2021 DEVIEW HyperCLOVA로 만드는 캐릭터 챗봇

김수빈·2021년 12월 10일

DEVIEW NLP chatbot

DEVIEW

목록 보기

1/1

🍀 DEVIEW 2021

제 목 : 100억 대화 데이터 없이도 가능해요! - HyperCLOVA로 만드는 캐릭터 챗봇
발표자: NAVER CLOVA/Conversation 강재욱, 가순원, 이민영

서 론

메타버스 시대에서 인간과 소통하고 교감할 수 있는 가상 캐릭터는 핵심 콘텐츠가 될 것

하지만 기존의 가상 캐릭터는 이미 녹화된 영상에 face/motion/voice capture를 통해 구현되어 실시간 소통이 불가능하다.

→ 챗봇이 캐릭터 페르소나를 가진다면 소통이 가능하기 때문에 대화 가능한 가상 캐릭터를 만들 수 있다.

캐릭터 챗봇
챗봇에게 캐릭터를 부여하기 위해서는 대화체, 세계관, 성격 이 3가지의 페르소나 설정이 가능해야 한다.

기존 다수의 챗봇은 Retriever & Reranker 프레임워크로 이루어져 있으며,
이때 페르소나를 설정하기 위한 가장 확실한 방법은 대화 DB 검수이다

그러나, 페르소나를 가진 대량의 캐릭터 대화 DB를 구축하기는 어렵다는 한계가 있다.
→ HyperCLOVA로 대화 DB 생성

캐릭터 대화 DB 구축 파이프라인

1. 대화 DB 생성

Naive Few Shot Approach

HyperCLOVA에 prompt로 task에 대한 description과 몇 개의 예시를 제공함으로써
주어진 예시를 기반으로 생성하는 방식이다

주어진 prompt 👇

# <음식>에 관한 대화
유저 : 안뇽
캐릭터 : 안녕하세여!
유저 : 나 짐 넘 배고파
캐릭터 : 오 이럴땐 떡볶이죠!
유저 : 오 떡볶이 좋은데? 떡볶이랑 뭐 먹지
캐릭터 : 떡볶이엔 역시 순대가 찰떡이죠~
유저 : 좋아 오늘은 떡튀순으로 간다!
캐릭터 : 아 튀김은 별론데...

# <게임>에 관한 대화

생성 결과👇

# <음식>에 관한 대화
유저 : 안뇽
캐릭터 : 안녕하세여!
유저 : 나 짐 넘 배고파
캐릭터 : 오 이럴땐 떡볶이죠!
유저 : 오 떡볶이 좋은데? 떡볶이랑 뭐 먹지
캐릭터 : 떡볶이엔 역시 순대가 찰떡이죠~
유저 : 좋아 오늘은 떡튀순으로 간다!
캐릭터 : 아 튀김은 별론데...

# <게임>에 관한 대화
유저 : 요즘 재밌는 게임 없나
캐릭터 : 흠.. 전 요즘 배그를 해요!
유저 : 오오 나도 그거 하는데ㅋㅋ
캐릭터 : 어 진짜요? 저도 같이해여!
유저 : 그래 나중에 하자

장 점
HyperCLOVA와 같이 큰 모델에 few-shot learning을 적용했을 때,
작은 모델에 비해 더 유창하다는 장점이 있다.

단 점
① 피상적이고 단순한 대화로 마무리될 수 있음
    few-shot learning을 위해 주어진 대화 세션과 유사하게 진행될 수 있다.
② 캐릭터 성격 불일치
③ <음식>, <게임>과 같은 키워드를 통해서는 시나리오 다양화가 어려움
    시전학습 데이터의 bias로 인해, 확률적으로 등장 확률이 높은 대화 세션만 많이 생성되며
    등장 확률이 낮은 대화 세션은 이끌어내기 힘들다

대화내용을 그래프로 구조화 한 것으로,
유저의 발화에 공감하는 발화를 생성한 경우 왼쪽 자식 노드, 유저의 발화에 능동적인 반응을 보인 경우 오른쪽 자식 노드로 표현하였다.

아래는 간단한 대화를 그래프로 표현한 것으로, 유저의 engagement를 이끌어내지 못한 대화내용이다.

위와 달리 유저의 engagement를 끌어낸 대화내용이다.

유저의 engagement를 이끌어내기 위해서는
구체적 질문, 공감, 경험담 공유 등 여러 발화 패턴 분리해야 한다.

💡 발화 패턴에 따라 대화 세션 생성을 어떻게 제어할 것인가?
→ Purpose-Action-Situation (PAS) 대화 모델 제안

Purpose : 캐릭터의 대화 목적 (ex 위로, 분노, 공감)
Action : 캐릭터의 발화 패턴 제어 (ex 피드백, 경험담 공유, 상황 직시)
Situation : 현 대화 세션에서 유저가 이야기하려는 대화 맥락, 상황 (ex 어제 차였어, 사기 당했어)

PAS 대화 모델링을 통한 대화 DB 생성

Naive Approach의 한계 극복

① ~~피상적이고 단순한 대화~~ → 깊은 대화 구조
Purpose & Action으로 다양한 발화기법을 통해 사용자의 대화 참여 유도

② ~~캐릭터 성격 불일치~~ → 캐릭터 성격 반영
캐릭터의 Purpose(대화 목적)와 그에 따른 Action(발화 기법)을 매핑함으로써 캐릭터의 성격 유지

③ ~~시나리오 다양화의 한계~~ → 다양한 시나리오
구체적인 상황을 묘사하는 Situation 리스트 확보
각 Situation에 대해 Purpose & Action을 조합하여 대화 세션을 생성함으로써 시나리오 커버리지 향상

PAS 대화 모델링 기법을 통한 대화 DB 생성

Purpose와 Purpose에 따른 Action 리스트 정의
사람이 직접 제작하며, Purpose에 대한 가능한 Action 리스트를 정의한다
Situation 리스트 확보
2단계로 구성되며 각각 다양성과 구체성을 확보하는 단계

2.1 다양성 확보
purpose에 대한 situation 예시를 One-shot으로 예시 제공
HyperCLOVA를 통해 Situation 리스트를 확보한다

2.2 구체성 확보
상황을 구체적으로 묘사한 Situation 확보
마찬가지로 One-shot으로 예시 제공
대화 세션 생성
3.1 시드 대화 DB 구축
Purpose, Action, Situation의 가능한 조합에 대해 대화 세션을 생성한다.
HyperCLOVA에 One-shot으로 사람이 직접 제작한 대화 세션 생성 예시를 함께 제공한다

3.2 생성 대화 DB 구축 (Paraphrasing)
동일한 (Purpose, Action, Situation)을 가지는 데이터 Augmentation
적절한 paraphrasing prompt를 구성하여 HyperCLOVA를 통해 생성