
논문 제목: Neural Architectures for Named Entity Recognition
저자: Guillaume Lample et al. (CMU)
학회: ACL 2016
논문 제목: End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF
저자: Xuezhe Ma & Eduard Hovy (CMU)
학회: ACL 2016
| 항목 | BiLSTM-CRF | BiLSTM-CNN-CRF |
|---|---|---|
| 목적 | 다국어 NER, 범용성 강조 | End-to-end 구조에서 최고 성능 |
| Char 정보 | Char-level BiLSTM | Char-level CNN |
| 문맥 처리 | BiLSTM | BiLSTM |
| 시퀀스 디코딩 | CRF | CRF |
| 사전 임베딩 | Skip-n-gram | GloVe 등 |
| 지원 언어 | EN, DE, NL, ES | EN (POS/NER) |
| 최고 성능 | 90.94 (EN NER) | 91.21 (EN NER) |
| 항목 | BiLSTM-CRF 논문 | BiLSTM-CNN-CRF 논문 |
|---|---|---|
| 논문 제목 | Neural Architectures for Named Entity Recognition | End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF |
| 주요 목적 | 언어 특화 리소스 없이 동작하는 범용 NER 모델 제안 | 전처리와 feature 없이 가능한 end-to-end 시퀀스 라벨링 모델 제안 |
| 핵심 구성 요소 | Character-level BiLSTM + Word Embedding + CRF | Character-level CNN + Word Embedding + BiLSTM + CRF |
| 특징 | - 문자/분포 기반 정보 통합 - 다국어 적용 가능성 강조 - Stack-LSTM 구조도 함께 제안 | - POS/NER 모두 적용 가능 - feature engineering 전혀 없음 - dropout 등 정규화 강조 |
| 적용 태스크 | Named Entity Recognition (EN, DE, NL, ES) | POS Tagging (WSJ), Named Entity Recognition (CoNLL-2003 EN) |
| 공통점 | 둘 다 사전학습된 임베딩 + CRF 사용 hand-crafted feature 없이 성능 향상 목표 | 동일 |
| 최종 목표 요약 | 문자 + 문맥 + CRF로 구조적 시퀀스 예측 모델 구성 (다국어 NER) | 문자 + 단어 표현을 BiLSTM-CRF로 통합한 범용 시퀀스 라벨링 모델 구축 |