[김기현의 자연어 처리 딥러닝 캠프] 5장. 유사성과 모호성 (개념) - (2) (2022/03/14)

gromit·2022년 3월 14일
0

[5.8.1. 래스크 알고리즘 - 시소러스 기반의 중의성 해소]

  • 가정: 문장 내에 같이 등장하는 단어들은 공통 토픽을 공유한다..!
  • 중의성을 갖는 각 단어에 대해 사전(ex. 워드넷 등)을 활용해 사전에서의 의미별 설명 사이의 유사도를 구하는(ex. 겹치는 단어의 개수를 카운팅 등) 알고리즘
  • <장점> 워드넷과 같은 잘 분류된 사전이 있다면, 쉽고 빠르게 중의성 해소 문제 해결 가능
  • <한계> 사전에 dependency


[5.9. 선택 선호도 (selectional preference)]

  • 표제어 용어 ? (Headword (: 표제어 단어 자체) VS. Lemmatization (: 표제어를 문장에서 추출하는 일) 구분 )

  • Lemmatization
    : have to find correct dictionary headword form

  • 방법 1) 워드넷 기반의 선택 선호도

  • 방법 2) 유사어휘를 통한 선택 선호도 평가

  • 방법 3) 유사도 기반의 선택 선호도

profile
AI, Big Data, Industrial Engineering

0개의 댓글