Stanza란?
Medical Report Generation를 위한 NER로서 Stanza 활용
먼저 Stanza를 불러온다.
import stanza
stanza.download('en', processors='tokenize,lemma,pos,ner')
stanza.download('en', package='radiology')
그 다음 NLP 파이프라인을 구축한다.
from stanza import Pipeline
nlp = Pipeline(lang='en', package='radiology', processors={'lemma':'default', 'pos':'default', 'tokenize':'default', 'ner':'radiology'})
특정 문자열에 적용하여 Named Entity Recognition(NER) 결과를 확인한다.
doc = nlp("The heart is normal in size.")
for ent in doc.ents:
print(f'Text : {ent.text}, Type : {ent.type})