안녕하세요. 이번에 소개해드릴 라이브러리는 Py-Handspell입니다.
네이버 한글 맞춤법 검사기로 만들어진 패키지 입니다.
바로 사용 방법에 대해 설명해드릴게요
먼저 라이브러리를 설치해 줍니다
pip install py-hanspell
!pip install git+https://github.com/ssut/py-hanspell.git
한국인이 자주 틀리는 맞춤법 문장 하나를 가지고 왔습니다.
'나는 며칠간 동생의 뒤치닥거리를 했다'
출처 : https://news.sbs.co.kr/news/endPage.do?news_id=N1005299526
바로 실습을 해보겠습니다.
from hanspell import spell_checker
text = '나는 며칠간 동생의 뒤치닥거리를 했다'
spelled_sent = spell_checker.check(text)
checked_sent = spelled_sent.checked
print(checked_sent)
>>> 나는 며칠간 동생의 뒤치다꺼리를 했다
이렇게 바로 맞춤법이 올바르게 바뀐 것을 볼 수가 있습니다.
저도 뒤치닥거리인 줄 알았는데 이번 실습을 통해 뒤치다꺼리가 올바른 표현이라는 것을 알게 되었네요 :)
다들 맞춤법 검사기를 통해 전처리에 사용해 보시기 바랍니다.