1. 개념 정리
밑바닥부터 시작하는 딥러닝 2를 읽고 정리한 내용입니다.
1) 단어의 의미를 파악하는 방법
1) 시소러스
- 유의어 사전
- WordNet
- 한계
- 시대 변화에 둔감
- 인건비
- 뉘앙스를 표현하기 어려움
2) 통계기반
- 말뭉치에서 효율적으로 핵심을 추출하는 것이 목표
- 방법
- 전처리 ⇒ 단어의 분산 표현 구하기(동시발생행렬, 벡터 간 유사도)
- 가설
- 분포가설: 단어의 의미는 주변 단어에 의해 형성된다. = 맥락이 단어의 의미를 결정한다.
- 한계
- 상호정보량: 빈도수가 높아도 의미가 없는 단어가 있을 수 있음 - PPMI
2. 회고
원래 실습을 했어야 하는데 Word2Vec부터 개념이 안잡혀 있으니 당연히 Seq2Seq도 모르겠어서 다시 공부하려고 밑바닥부터 시작하는 딥러닝2를 참고했다. 이번 주에는 지금까지 배운 내용을 복습하는 식으로 가야할 거 같다.