(cf. Jurafsky & Martin)
(-1980년대) Rule-Based
: Rule-based approach 는 이미 정의된 문법이나 언어규칙을 사용해서 텍스트를 분석하는 것을 의미한다. 그러나 자연어가 가진 시간에 따라 의미가 변한다는 특성에 의해 성공하지 못 했다.
(-1990년대) Statistical
: Statistical approach는 학습데이터를 기반으로 Hidden Markov Model(HMMs), Bayes' models, Support Vector Machines(SVM), Clustering 등을 진행
(~현재) ML&DL
: 현재는 NLP 분야에서 머신러닝, 딥러닝 접근법을 많이 쓴다. 과거에는 중간중간 사람의 개입으로 도메인 지식을 요했는데, 현재는 처음부터 끝까지 사람의 개입이 없는 종단학습이 가능해진다.
1) 명사(Noun)
2) 동사(Verb)
3) 대명사(Pronoun)
4) 전치사(Preposition)
5) 부사(Adverb)
6) 접속사(Conjunction)
7) 전치사(Particle)
8) 관사(Article)```POS 태깅 알고리즘은 아래 세 가지로 나눠볼 수 있다.


Generative sequence models
Discriminative sequence models
전체의 시퀀스를 분류기로 한 번에 예측
자연어처리 분야에서 많이 사용되는 통계적 모델링 기법입니다.
사진 하나의 행동을 분류할 때, 하나의 행동 Sequence만을 보고 판단하지 않고 사진을 찍은 순간의 이전/이후를 참조하여 지금 상태를 결정합니다.
(수정중)