비지도학습 기법인 군집분석에는 다양한 clustering 기법을 적용할 수 있다. 다음 clustering 기법들을 조사하여 특징, 적용절차, 적용 가능한 R 함수를 기술하려 한다. clustering 이란. > 구분하려고 하는 각 class에 대한 아무런 지식이 없
ARIMA 모형을 이용하여 시계열 자료를 분석하는 방법에 대해서 알아보자. 분석 절차 시계열 분석의 절차는 시계열 자료를 이용하여 일반화된 시계열 모형을 선정하고 이에 해당하는 모수 추정을 통해서 모형을 생성한다. 또한 모형이 유의한지 적한한지를 평가하여 미래 데이
시계열 자료의 분석 기법에는 평활법, 시계열 요소 분해법, ARIMA 모형법 등 다양하다. 시계열 자료의 4가지 변동 요인을 찾아서 시각적으로 분석하는 기법을 의미한다. 대체로 추세와 계절 변동 요인은 추세선에서 뚜렷하게 나타난다. 추세의 패턴을 찾는 방법 3가지차분
시계열 분석에서 시계열 자료의 특징을 정확히 파악한다면 해당 자료에 대한 적합한 분석 방법을 선택하는 데 많은 도움이 된다. 추세 : 어떤 현상이 일정한 방향으로 나아가는 경향을 말한다. 직선이나 곡선 형태로 차트에서 나타내는 선을 추세선이라고 하는데 이러한 추세선을
시계열 분석은 어떤 형상에 대해서 시간의 변화량을 기록한 시계열 자료를 대상으로 미래의 변화에 대한 추세를 분석 하는 방법 시계열분석은 회귀 분석과 동일 하게 설명변수와 반응변수를 토대로 유의 수준에 의해서 판단하는 추론 통계 방식이다. y 변수 존재 : 시간 t를
국비 초반에는 사실 일주일에 몰아서 주말에 3~4시간 공부해도 충분히 소화해 낼 수 있는 양이였다. 이젠 매일 끝나고 1시간씩 다듬고 주말에 한번 다시 리뷰 하며 모르는 함수들이 넘쳐나고 개념을 이해하며 맞는 함수를 고르고 왜? 라는 나의 궁금증은 이젠 책에서 찾을 수
드디어 결과가 나왔다. 시험 본후 거의 1달은 지나야 결과가 나온다... 너무 오래 걸리지만. 합격 했기에 참아 준다. ㅎㅎ 공부 방법 > 그냥 바로 궁금한 부분만 이야기 하겠습니다. 가이드북 시험 범위 2독 (2주일) 가이드북은 문제집과 다르게 스토리 텔링 방
라고 읽힐때 해결하는 방법은 파일을 다시 저장해 저장해 읽혀 주시면 됩니다. 참고로 저는 엑셀이 없어서 네이버 오피스를 이용합니다. 정말 잘 읽힙니다. 이렇게 한번 해보세요 ^\_^ 인코딩 인자를 넣어도 안되는 경우 많은데 .. 윈도우 에서 csv 저장 후 윈도우 R
단어의 의미성 초점 분석 단어의 동시 출현 단어를 분석 하는 것이다. 단어 간의 관계를 살펴보는 방법 손 = 장갑, 모자 = 머리 처럼 관계가 있는 단어 파악 단어의 관계를 표현한 의미망(semantic network) 만드는데 활용 동시 출현 단어 분석 (Co-o
감정 사전을 활용한 텍스트 마이닝 >감정 사전 '감정 단어'와 '감정의 강도를 표현한 숫자'로 구성된 사전을 이용해 문장의 단어에 감정 점수를 부여한 다음 합산 감정 사전 살펴보기 KNU 한국어 감성사전 군산대학교 소프트웨어융합공학과에서 개발 word : 감정 단어
시각화 부분에서 이미지 깨짐이 너무 많아 사실 포기 하고 있었는데. 교수님 께서 관련 정보를 건내 주셨다. 해결 완료 !!! 😁인자 추가 : vertex.label.family = " 원하는 글꼴 "사살 간단한 내용이였는데.. 매번 family = " 글꼴 " 했는데
사실 R 프로그램에서 활용하는 정말 좋은 방법이 하나 있다. 그건말로 '책갈피' 기능이다. 코드 작성중에 앞 또는 뒤로 찾기 위해 열심히 스크롤을 돌리는 경우가 생기면 !!! 이런식으로 \*\*352 줄 보면 처럼 각주를 써 놓으면 밑 주황색 부분을 클릭하면 저렇게내가
잘 보시면 왼쪽이 한글 깨짐 현상으로 단어들이 모두 '스펀지밥' 이 되어 버렸네요 ㅠㅠㅠㅠ 해결하는 방법은 !! 간단해요 . "extrafont" 를 패키지 다운로드한후 라이브러리를 불러 오세요. font_import() 는 폰트를 불러오기 하는 것 입니다. 버전에 1
SQLD 자격증 공부를 하면서 정말 중요하다고 생각되고 .. 출제도 정말 많이 되는 부분이라 블로그에 남겨 놓으려고 한다. 정규화란 : 관계형 데이터베이스의 설계에서 중복을 최소화하게 데이터를 구조화하는 프로세스를 정규화(Normalization)라고 한다데이터 중복은
이번주는 비정형 데이터 시각화 만 엄청 한것 같다. 해봤자 텍스트 마이닝 이지만 진짜 엄청 재미진다. 이것도 정형화된 ... 나름 깨끗한 파일이니깐 코드 조금 써서 바로 전처리 하지만 순수한 데이터를 분석 하려니 처음부터 "유요한 형식이 아닙니다.. " 란다..
제가 작성한 R프로그램 마크다운 = Rmb 파일을 그대로 복붙한 내용 입니다. title: '사례연구 output: pdf_document: keep_tex: yeseditor_options: chunk_output_type: inline공통수행사항: 1)
저는 인천일보 사이트를 사용했지만 다른 사이트도 얼마든지 가능합니다. 저는.. 하필이면 행렬이 아닌 문자열로 이미 다 정렬된 HTML 이라 광고를 빼는 기술 까지.. 제가 없어서 광고 문자가 나오기도 하네요;; 웹 문서는 여러개 태그(tag)를 이용해 자료를 만들고,
정말 엄청나게 많이 일어난다..거의 매일 있다 하루에 3~4번씩 ;;; 오류가 생길때 마다 캡쳐를 해서 왠만한건 정리하려 한다.. 그중에 오늘 5번 격은 패키지 때문에 벌어진 오류이다.
연관어 분석 연관규칙을 적용하여 특정 단어와 연관성이 있는 단어들을 선별하여 네트워크 형태로 시각화하는 과정을 연관어 분석이라 한다. 관련 패키지 설치 메모리 로딩 > - install.packages("KoNLP") 맥에서 R 텍스트 마이닝 패키지 다운받기 🔧