Towards Emotional Support Dialog Systems
1,300개의 conversation
Data Structure
Experience_type (2)
['Previous Experience', 'Current Experience']help-seeker의 이전 경험인지, 현재 경험인지
75%이상이 현재 경험
Emotion_type (11)
['anxiety', 'anger', 'fear', 'depression', 'sadness', 'disgust', 'shame'
'nervousness', 'pain', 'jealousy', 'guilt']-> the help-seeker가 선택
-> 대화 전의 감정인지, 평균적인 감정인지
Problem type (13)
['job crisis', 'problems with friends', 'ongoing depression',
'breakup with partner', 'academic pressure', 'conflict with parents',
'Procrastination', 'Alcohol Abuse', 'Issues with Parents', 'Sleep Problems',
'Appearance Anxiety', 'School Bullying', 'Issues with Children']-> 깃헙에는 12개라고 되어 있는데 사실 13개지롱, 카테고리를 분할한 것 같다
'conflict with parents':8, 'Issues with Parents': 10
그리고 깃헙 기준으로 6번부터 12번은 데이터 개수가 2~28개 사이로 적은데 학습에 사용할건지 생각해보자
Situation
감정 문제의 원인을 설명하는 open text
한 줄 요약 느낌?
보통 한 두 줄로 쓰여있고 1인칭 시점으로 적힌 듯 하다.
unique value 1296개, 중복이 있는 듯
survey_score
"seeker": {
"initial_emotion_intensity": 1, 2, 3, 4, 5
"empathy": 1, 2, 3, 4, 5, nan
"relevance": 2, 3, 4, 5, nan
"final_emotion_intensity": 1, 2, 3, 4, nan
}
"supporter":{
"relevance": 0, 1, 2, 3, 4, 5, nan
}help-seeker가 평가하여 점수 부여 (1~5점)
emotion_intensity: 숫자가 클수록 강한 감정, 대화 후의 점수가 감소한 것은 감정 개선으로 파악
empathy: supporter가 경험과 감정에 공감하고 있는지에 대한 점수
relevance: supporter가 대화 주제에 대해 잘 반응하고 있는지에 대한 점수, 대화와의 관련성
seeker's relevance는 뭘까? 셀프 평가?
dialog
feedback score: helpfulness of the supporter messages,
대화하는 동안 helpseeker는 supporter로부터 새로운 utterances을 두 번 받을 때마다 피드백을 해달라는 요청 받음
평균 utterances 수: 29.5
최대가 120이던데 보통 몇 번의 멀티턴에서 종료하는지?strategy (8)
- Question
help-seeker가 직면한 문제를 명확하게 설명하는 데 도움이 되도록 문제와 관련된 정보를 요청
개방형 질문이 최선이며, 폐쇄형 질문을 사용하여 특정 정보를 얻을 수 있음- Restatement or Paraphrasing
자신의 상황을 더 명확하게 볼 수 있도록 help-seeker의 진술을 단순하고 간결하게 다시 표현- Reflection of Feelings
help-seeker의 감정을 명확하게 표현하고 설명- Self-disclosure
공감을 표현하기 위해 당신이 겪은 비슷한 경험이나 당신이 help-seeker와 나눈 감정을 언급- Affirmation and Reassurance
helpseeker의 장점, 동기 및 능력을 확인하고 안심시키고 격려- Providing Suggestions
변화하는 방법에 대해, 하지만 너무 지나치지 않도록 조심하고 helpseeker에게 무엇을 해야 하는지를 조언- Information
데이터, 사실, 의견, 자료 또는 질문에 대한 답변을 통해 helpseeker에게 유용한 정보를 제공- Others
위의 범주에 속하지 않는 인사말을 교환하고 기타 지원 전략을 사용
"seeker_question1": "no",
"seeker_question2": "no",
"supporter_question1": "no",
"supporter_question2": "no"
이건 또 뭘까?