[GDSC] Solution Challenge 관련 논문 리뷰 ②

YOOJIN·2023년 1월 22일
0

score, magnitude 즉, 2차원 기준으로 value들을 어떻게 classify할 것인지를 고민하다가 발견한 논문

가사 텍스트의 감성분석에 기반 한 음악 시각화 콘텐츠 개발

구글 자연어 처리 API(Google Natural Language API)

  • 감성 분석(Sentiment Analysis)
  • 항목 분석(Entity Analysis)
  • 항목 감성 분석(Entity Sentiment Analysis)
  • 구문 분석(Syntax Analysis)
  • 콘텐츠 분류(Content Classification)

감성 분석결과는 문서 전체의 전반적인 감정값과 해당 문서에서 추출된 문장의 목록 및 문장 단위
의 감정값을 포함한다. 기계의 관점에서 바라보는 감정은 숫자로 치환되어 긍정과 부정의 양 극성과 이에 따른 감정의 값으로 분류되는 score(-1에서 1사이의 값)와 감정의 강도magnitude(0에서 무한대까지의 값)의 두 항목에 대한 수치로 정량화되어 나온다.

Magnitude는 score의 절대 값으로 표현되며 값이 클수록 감정의 강도가 세지는 것으로 해석할 수 있다.magnitude 값의 총합을 통해 문서 전체의 감정의 강도를 측정할 수 있고 문서의 전체의 정서 성향(긍정/부정)은 각 문장별 score값의 평균으로 해석될 수 있다.

→ 따라서 문장이 길어질수록 정서의 강도는 커진다

0을 중립적인 값으로 양 극단의 값(-1 ~ 1)으로의 거리를 통해 긍정적이거나 부정적인 감정의 성향을 파악할 수 있다. 그리고 감정의 강도를 0에서부터 커진 양에 따라 판단할 수 있다

score값을 valence 축에, 그리고 magnitude를 arousal축에 맵핑하였고 각 감정 위치를 통해 대표적 6개의 감정(happy, calm, sad, angry, anticipate, surprise)과 여기서 강도에 따라 세분화된 10개의 감정으로 구분하는 감정의 2차원 모델을 활용

MVP가 어느정도 끝나고 조금 더 리서치해보면서 + 가능하다면 육아를 하시는 분들이 인터넷상에 남기는 댓글들을 API에 input해보고 output (score + magnitude) 들을 기준으로 감정의 분류를 다시 classify해보는 것도 유의미할 것 같다 ...

score + magnitude -> 감정의 분류는 아주 주관적인 영역이라는 생각이 들어서 조금 더 고민이 필요할 것 같다 - !

0개의 댓글