[Python] hanspell 맞춤법 검사기 사용하기

도갱도갱·2022년 2월 11일
0

Python

목록 보기
26/34
post-custom-banner

기능 및 문법

  • py-hanspell은 네이버 맞춤법 검사기를 이용한 파이썬용 한글 맞춤법 검사 라이브러리이다.
  • 라이브러리를 설치한 후 import하여 사용한다.
  • return 타입은 class 'hanspell.response.Checked'
from hanspell import spell_checker
text = "안녕하세요반갑습니다."
result = spell_checker.check(text)
print(type(result))



딕셔너리로 결과 받기

  • hanspell 결과를 dict로 변환할 수 있다.
dict_result = result.as_dict()
print(dict_result)

  • result : 맞춤법 검사 성공 여부 {True / Fasle}
  • original : 검사 전 문자
  • checked : 검사 후 문장
  • errors : 맞춤법 오류 수
  • words : 검사 후 문장을 공백으로 split하고 오류 종류를 매핑한 dict
  • time : 총 요청 시간

words

  • key 값은 검사 후 문장, value 값은 검사 전 오류의 종류가 매핑된 int 이다.
  • CheckResult를 import 하여 상수값을 확인해 보면 value의 숫자가 어떤 오류를 나타내는지 알 수 있다.
CONST int error
PASSED 0 맞춤법 검사 결과 문제가 없는 단어 또는 구절
WRONG_SPELLING 1 맞춤법에 문제가 있는 단어 또는 구절
WRONG_SPACING 2 띄어쓰기에 문제가 있는 단어 또는 구절
AMBIGUOUS 3 표준어가 의심되는 단어 또는 구절
STATISTICAL_CORRECTION 4 통계적 교정에 따른 단어 또는 구절



리스트로 결과 받기

  • check 함수안에 리스트로 문자열을 보내면 결과값도 리스트로 반환한다.
result = spell_checker.check(['안녕하세요반갑습니다.','이것은리스트입니다.'])
print(type(result))  #list
  • 리스트의 각 요소에 hanspell 타입의 결과값들이 저장된다.

  • hanspell 타입의 attribute에 접근하여 결과값을 추출할 수 있다.



Reference

post-custom-banner

0개의 댓글