일반적인 다이어리 어플은 텍스트 입력 이전 '오늘의 감정' 또는 '오늘의 기분'이 담긴 이모티콘을 통해 감정을 표현한다. 하지만 NLP를 사용한다면 작성한 텍스트를 기반으로 사용자의 감정을 추측할 수 있기 때문에 보다 사용자 편의가 강해질 것 같았다.
영어 감정 분석은 캐글 등에서 많은 데이터가 존재하고 연구 결과가 많다는 점에서 도전하기 쉬웠지만, 한국어가 모국어인 나로서는 보다 복잡한(조사, 어미 등 형변환이 자유롭다는 측면에서) 한국어 감정 분석에 관심이 갔다. 감정 분석이라는 세밀한 컨셉을 잡기 전부터 구글의 BERT 모델을 알고 있었고, 마침 SKT가 내놓은 KO-BERT 모델을 접하게 되어 '한국어 감정 분석'이라는 주제로 부분 앱을 계획하게 되었다.
BERT 모델은 트랜스포머를 사용한 NLP 모델로, 셀프 어텐션 기법을 활용해 "현재 주어진 문장에서 중요한 부분이 어디인지" 수치적으로 확인할 수 있다! 또한 위키피디아 등 어마어마한 분량의 데이터를 사전 학습한 토크나이저가 존재하기 때문에 일반적으로 성능이 뛰어나다는 장점이 존재한다.