[mecab] 태그 구조 및 태그 별 설명

nooyji·2021년 8월 13일
0

서버에서 mecab 형태소 분석 테스트
$ mecab -d /usr/local/lib/mecab/dic/mecab-ko-dic

OUTPUT 태그 구조
단어 \t 품사, 의미분류(개체명), 종성유무, 읽기, 타입, 첫번째 품사, 마지막 품사, 표현
ex)
안녕 NNG,행위,T,안녕,,,,
하 XSV,,F,하,,,,
세요 EP+EF,
,F,세요,Inflect,EP,EF,시/EP/+어요/EF/
입니다 VCP+EC,,F,입니다,Inflect,VCP,EC,이/VCP/+ᄇ니다/EC/*

태그 구조
단어, left-ID, right-ID, weight, 품사, 의미분류, 종성유무(읽기 마지막 글자에 종성이 있는지 없는지- T or F), 읽기, 타입, 첫번째 품사, 마지막 품사, 원형, 인덱스 표현(검색 인덱싱에 사용되는 데이터)

원문 : https://somjang.tistory.com/entry/PythonUbuntu%EC%97%90-mecab-ko-dic-%EB%9D%BC%EC%9D%B4%EB%B8%8C%EB%9F%AC%EB%A6%AC-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0

http://openuiz.blogspot.com/2018/12/mecab-ko-dic.html

0개의 댓글