Character-Level Bidirectional LSTM-CRF 모델은 자연어 처리에서 시퀀스 라벨링 문제를 효과적으로 해결하기 위한 심층 신경망 모델이다. 쉽게 말해, 단어를 글자 단위로 쪼개서(캐릭터 수준) 양방향 LSTM으로 앞뒤 문맥을 모두 이해하고, 최종 출력을 CRF 계층이 문장 전체를 고려해 가장 최적의 일련의 태그로 결정하는 구조다.
Character-Level Bidirectional LSTM-CRF 모델은 글자를 단위로 세밀하게 보고, 문장 양방향 문맥을 학습하며, CRF 층을 통해 문장 전체 태그 관계를 최적화하는 강력한 시퀀스 태깅 모델이다. 주로 개체명 인식, 품사 태깅, 철자 오류 교정 같은 NLP 과제에 탁월하다[1][2][5].
출처
[1] 12-06 BiLSTM-CRF를 이용한 개체명 인식 https://wikidocs.net/147234
[2] 12-02 양방향 LSTM과 CRF(Bidirectional LSTM + CRF) https://wikidocs.net/34156
[3] End-to-end Sequence Labeling via Bi-directional LSTM-CNNs ... https://liquorshotz.tistory.com/entry/Endtoend-Sequence-Labeling-via-Bidirectional-LSTMCNNsCRF
[4] Bidirectional LSTM-CRF 기반 한국어 개체명 인식을 위한 ... https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002625058
[5] Bidirectional-LSTM-CRF 논문 번역 - 9566 - 티스토리 https://9566.tistory.com/551
[6] Bidirectional LSTM-CRF Models for Sequence Tagging ... https://velog.io/@zvezda/Bidirectional-LSTM-CRF-Models-for-Sequence-TaggingNAACL-2016
[7] 모델을 이용한 멘션탐지 Bidirectional LSTM-CRF https://koreascience.kr/article/CFKO201534168509141.pdf
[8] 특허 기술 개체명 식별을 위한 단어 임베딩 기반 Bi-LSTM https://ki-it.com/xml/27728/27728.pdf
[9] 제한된 언어 자원 환경에서의 다국어 개체명 인식 https://koreascience.kr/article/CFKO201712470015269.pdf
[10] 과학기술분야 텍스트의 정보추출을 위한 딥러닝 ... https://scienceon.kisti.re.kr/commons/util/originalView.do?dbt=TRKO&cn=TRKO201700000489