[NLP Package] Stanza

Alice·2022년 6월 12일
0

NLP 코드

목록 보기
1/1
post-thumbnail

Stanza란?

Medical Report Generation를 위한 NER로서 Stanza 활용

먼저 Stanza를 불러온다.

import stanza 
stanza.download('en', processors='tokenize,lemma,pos,ner')
stanza.download('en', package='radiology')

그 다음 NLP 파이프라인을 구축한다.

from stanza import Pipeline 
nlp = Pipeline(lang='en', package='radiology', processors={'lemma':'default', 'pos':'default', 'tokenize':'default', 'ner':'radiology'})

특정 문자열에 적용하여 Named Entity Recognition(NER) 결과를 확인한다.

doc = nlp("The heart is normal in size.")
for ent in doc.ents:
   print(f'Text : {ent.text}, Type : {ent.type})
profile
NLP Researcher

0개의 댓글