Emotional-Support-Conversation

Eun·2023년 1월 27일
0

Chatbot

목록 보기
2/2

ESConv

Towards Emotional Support Dialog Systems

1,300개의 conversation

Data Structure

  • 'experience_type'
  • 'emotion_type'
  • 'problem_type'
  • 'situation'
  • 'survey_score'
    - 'seeker' : {'initial_emotion_intensity', 'empathy', 'relevance', 'final_emotion_intensity'}
    - 'supporter': {'relevance'}
  • 'dialog'
    - {'speaker', 'annotation': {'strategy', 'feedback'}, 'content'}
  • 'seeker_question1'
  • 'seeker_question2'
  • 'supporter_question1'
  • 'supporter_question2'

Experience_type (2)
['Previous Experience', 'Current Experience']

help-seeker의 이전 경험인지, 현재 경험인지
75%이상이 현재 경험

Emotion_type (11)
['anxiety', 'anger', 'fear', 'depression', 'sadness', 'disgust', 'shame'
'nervousness', 'pain', 'jealousy', 'guilt']

-> the help-seeker가 선택
-> 대화 전의 감정인지, 평균적인 감정인지

Problem type (13)
['job crisis', 'problems with friends', 'ongoing depression',
'breakup with partner', 'academic pressure', 'conflict with parents',
'Procrastination', 'Alcohol Abuse', 'Issues with Parents', 'Sleep Problems',
'Appearance Anxiety', 'School Bullying', 'Issues with Children']

-> 깃헙에는 12개라고 되어 있는데 사실 13개지롱, 카테고리를 분할한 것 같다
'conflict with parents':8, 'Issues with Parents': 10
그리고 깃헙 기준으로 6번부터 12번은 데이터 개수가 2~28개 사이로 적은데 학습에 사용할건지 생각해보자

Situation
감정 문제의 원인을 설명하는 open text
한 줄 요약 느낌?
보통 한 두 줄로 쓰여있고 1인칭 시점으로 적힌 듯 하다.
unique value 1296개, 중복이 있는 듯

survey_score

"seeker": {
"initial_emotion_intensity": 1, 2, 3, 4, 5
"empathy": 1, 2, 3, 4, 5, nan
"relevance": 2, 3, 4, 5, nan
"final_emotion_intensity": 1, 2, 3, 4, nan
}
"supporter":{
"relevance": 0, 1, 2, 3, 4, 5, nan
}

help-seeker가 평가하여 점수 부여 (1~5점)
emotion_intensity: 숫자가 클수록 강한 감정, 대화 후의 점수가 감소한 것은 감정 개선으로 파악
empathy: supporter가 경험과 감정에 공감하고 있는지에 대한 점수
relevance: supporter가 대화 주제에 대해 잘 반응하고 있는지에 대한 점수, 대화와의 관련성
seeker's relevance는 뭘까? 셀프 평가?

dialog

feedback score: helpfulness of the supporter messages,
대화하는 동안 helpseeker는 supporter로부터 새로운 utterances을 두 번 받을 때마다 피드백을 해달라는 요청 받음
평균 utterances 수: 29.5
최대가 120이던데 보통 몇 번의 멀티턴에서 종료하는지?

strategy (8)

  • Question
    help-seeker가 직면한 문제를 명확하게 설명하는 데 도움이 되도록 문제와 관련된 정보를 요청
    개방형 질문이 최선이며, 폐쇄형 질문을 사용하여 특정 정보를 얻을 수 있음
  • Restatement or Paraphrasing
    자신의 상황을 더 명확하게 볼 수 있도록 help-seeker의 진술을 단순하고 간결하게 다시 표현
  • Reflection of Feelings
    help-seeker의 감정을 명확하게 표현하고 설명
  • Self-disclosure
    공감을 표현하기 위해 당신이 겪은 비슷한 경험이나 당신이 help-seeker와 나눈 감정을 언급
  • Affirmation and Reassurance
    helpseeker의 장점, 동기 및 능력을 확인하고 안심시키고 격려
  • Providing Suggestions
    변화하는 방법에 대해, 하지만 너무 지나치지 않도록 조심하고 helpseeker에게 무엇을 해야 하는지를 조언
  • Information
    데이터, 사실, 의견, 자료 또는 질문에 대한 답변을 통해 helpseeker에게 유용한 정보를 제공
  • Others
    위의 범주에 속하지 않는 인사말을 교환하고 기타 지원 전략을 사용

"seeker_question1": "no",
"seeker_question2": "no",
"supporter_question1": "no",
"supporter_question2": "no"
이건 또 뭘까?

profile
새해 복 많이 받으세요 ^0^

0개의 댓글