[PE프로그램] 프로젝트 정리

💻·2021년 8월 28일
0

PE프로그램

목록 보기
3/3

목차

  1. 수집 데이터
  2. 단어 빈도 분석, 워드클라우드 시각화
  3. 연관 분석, 네트워크 시각화
  4. 주식 종목 시세 예측 알고리즘 구현
  5. 소스코드

0️⃣ 수집 데이터

구분내용
유튜브 채널한국 뉴스 채널 4곳(SBS News, KBS News, JTBC News, YTN News)
주제코로나•주식 연관 뉴스 영상
영상 개수50
댓글 개수(raw data)14023
  • 영상 선정 기준
  1. 영상 업로드 날짜 기간: 2020.07 ~ 2021.07
  2. '코로나 주식' 검색어 지정, 주제와 관련성 높은 영상순으로 선정

1️⃣ 단어 빈도 분석, 워드클라우드 시각화

라이브러리 & 패키지용도
Konlpy텍스트 데이터 처리
Hannanum형태소 분석, 명사 분석
Counter빈도 분석
Wordcloud워드클라우드 시각화
  • 워드클라우드 결과물

    수집 데이터의 단어 빈도를 분석한 결과 가장 큰 빈도수를 보인 단어는
    순서대로 주식 - 사람 - 투자- 코인 -세금 임을 알 수 있습니다.

2️⃣ 연관 분석, 네트워크 시각화

라이브러리 & 패키지용도
Konlpy텍스트 데이터 처리
Hannanum형태소 분석, 명사 분석
Counter빈도 분석
Networkx네트워크 시각화
  • 연관 분석 규칙 생성
sourcetargetsupport
코로나사람0.333333
코로나주식0 .333333
코로나코인0 .333333
코로나투자0 .333333
코로나코인0 .333333
  • 네트워크 시각화 결과 (노드 갯수 제한 오류 해결 중에 있습니다.)

3️⃣ 주식 종목 시세 예측 알고리즘 구현

라이브러리 & 패키지용도
Keras모델 훈련
Matplotlib그래프 시각화

4️⃣ 소스코드

깃허브 레포지토리


참고 레퍼런스
이것이 데이터분석이다 with 파이썬 (한빛미디어)
주식•비트코인 시세 예측하기
딥러닝을 이용한 자연어처리 입문

0개의 댓글