[CS224N_winter2021] 1. Intro & Word Vectors

김상윤·2022년 8월 29일
0

AI이모저모

목록 보기
9/13

Human Language

  • 인간의 언어는 사회적 합의에 기반한 사회적 시스템이다.
  • 즉 언어를 사용함에 있어서 궁극적 목표는 사용하는 단어가 듣는 사람에게 어떤 영향을 미칠지 (역할을 할지), 그 의미를 잘 예측하고 계산하는 것이다.
  • 인간의 의사소통 능력은 다른 동물에 비해 우월하게 만드는 강력한 무기가 되었다.
    쓰고, 읽는 능력은 지식 전달에서의 시공간적 한계를 없앴다.
  • 인공지능에서의 핵심은 컴퓨터가 인간 언어 형태의 정보를 이해할 수 있도록 하는 방법과 확보된 인간의 지식들이다.
    AI에서 웹 문서에 퍼져있는 많은 지식을 활용한 선순환을 기반으로 그것을 어떻게 구축하느냐가 중요하고, 그 발전의 끝에 GPT-3같은 모델이 있다.
    • 다음 올 단어를 정확히 예측함.
    • 흐름에 따라 다음 문장을 예측 할 수도 있고, 인간 언어 문장을 SQL 명령어로 번역할 스도 있다.

how to represent the meaning of word

denotational semantics

: 표시적 의미론

  • 표현(기표)와 의미하는대상(기의)를 대응시키는 방법
  • 예를들어 동의어 사전, WordNet(동의어 집합으로 나타낸 영어 어휘목록)이 있다.
  • 한계
    • 갖고 있는 동의어로 제한되기 때문에 비슷한 단어간 뉘앙스 차이를 반영하지 못 한다.
    • 새로운 단어나, 새로운 뜻을 update하지 못 한다.
  • 그래서 동의관계가 아닌 유사성을 기반으로하는 관점에서 나온 것이 word2vec

0개의 댓글