정의
view or emtion 뒤의 상황 인식한다. 즉, 감정을 찾고 분석하거나 의사소통의 부분적인 요소들을 분석하기도 한다.
배경
사실 인간은 다양한 언어를 통해 여러 가지 표현방식으로 의사소통을 하고 그 모든 것에는 감정(긍정,부정,neutral)이 관련이 되어있습니다.
핵심
우리의 데이터는 음성이 아닌 텍스트이기에 텍스트 데이터에서 벌어지는 감정분석에 대해서 집중할 것입니다.
데이터
패스트 푸드 음식점 리뷰
Review 1: I love the cheese sandwich.(Postivite Statement)
Review 2: The beef burger has a bad taste.(Negative Statement)
Review 3: I orderd this cheese pizza tonight.(Neutral Statement)
분류
위와 같이 우리는 저런 식으로 다양하게 분류를 할 것입니다. 우리의 데이터는 한글이지만 일단, 영어로 어떻게 짤 수 있는지 알아보기 위해서 영어 데이터를 이용합니다.
Challenge
한국어 데이터로도 구현이 가능할 것 같은가?
지금은 txt파일이지만 우리의 파일은 csv, json파일 이라는 것이기에 어떻게 적용을 할 것인가?
다중분류가 잘 될 것인가?(유사한 부분에서)
단순히 긍정/부정/Netural이 아닌 세부적으로 어떻게 나눌 것인가?
Solution
Sentiment Analysis Model 사용
많은 데이터 수집
패턴과 규칙 찾아서 증거 수집 for 결론내기
작은 샘플 데이터로 추정해서 실험
감정 쪼개기
Happy, Love, Surprise
Sad, Fear, Angry