● 연구 내용
본 연구에서는 대량의 텍스트를 활용하는 텍스트 마이닝 기법 중, LDA 토픽 모델링 기법을 사용하여 생성형 AI 서비스의 주요 성공요인들을 도출하고, 키워드 네트워크 다이어그램을 구축하여 키워드 사이의 관계를 구체적이고 입체적으로 살펴보았다. 본 연구를 통해 토픽 모델링을 처음 접하였고, 토픽 모델링이 전체 내용물에서 일정한 패턴을 발견해 내는 알고리즘 기반 텍스트 마이닝이라는 것을 알 수 있었다. 특히, LDA 토픽 모델링은 문서의 단어가 그룹화 되어있다고 가정하고, 이러한 단어가 특정 토픽에 속할 가능성을 계산하여 각 토픽에 해당하는 확률이 높은 단어 집합을 추출하는 기법으로, 문서를 주제별로 군집화하여 각 주제와 연관된 키워드를 통해 전체 내용을 요약하고 핵심 요소를 파악하는 과정을 간소화해주는 장점이 있다. 또한 키워드 네트워크 다이어그램은 문헌에서 발견되는 키워드 쌍의 동시 발생 정도를 기반으로 개별 키워드 간의 유사성 또는 연관성을 시각화하는 기법으로, 특정 문서에서 수집된 대표 키워드 간의 관계 강도를 측정하여 키워드 간의 패턴과 경향을 탐색하는 유용하다.
● 활용 방안
본 연구 과정에서 생성형 AI 서비스 성공에 영향을 미치는 주요 요인을 도출하였다는 점에서 내가 가고 싶은 분야에 대해서 알 수 있었고, 텍스트 마이닝 기법과 Chat GPT를 결합한 새로운 방법론을 제안했다는 점에서 더 나아가 새로운 방법론을 진행에 도움을 얻을 수 있다고 생각한다.