체크포인트(Checkpoint)란 모델 학습 과정 중 특정 시점의 모델의 가중치와 파라미터를 저장한 상태이다. 이는 일종의 저장 상태로, 학습 중인 모델의 진행 상황을 특정 지점에서 보존하는 데 사용된다. 중단된 학습을 재개하거나 과적합을 방지하기 위해 조기에 학습을 멈출 때 유용하다.
또한 체크포인트는 모델의 일관성을 유지하고, 실험의 재현성을 보장하는 데 도움을 준다. 일반적으로 체크포인트는 주기적인 간격으로 생성되며, 이러한 주기는 학습자가 직접 설정할 수 있다.
Source : github.com/leekh4232
Mecab 형태소 분석기는 일본에서 만든 오픈소스 형태소 분석기
검색 엔진에 사용하기 위해서 만들어졌으며, 특정 언어에 국한되지 않고 범용적으로 설계되었기 때문에 한글을 지원하는 은전한닢 이라는 오픈소스 프로젝트로 한글화되어 사용되고 있음.
C++로 작성되었으며, 다양한 플랫폼에서 사용할 수 있습니다. 형태소 분석의 성능과 속도면에서 우수한 결과를 제공함
mecab-ko-windows-x64.zip 파일을 내려받는다.mecab 폴더를 C드라이브 root로 옮김C:\mecab
mecab-ko-dic-msvc.zip 파일을 내려받아 압축을 해제C:\mecab 폴더 안으로 이동 (폴더병합)cp311win32win_amd64$ python -m pip install <whl파일명>$ python -m pip install mecab_python-0.996_ko_0.9.2_msvc-cp311-cp311-win_amd64.whl설치 도중 C++ 관련 에러가 발생한다면 Visual C++ 재배포 가능도구 2015-2022를 설치후 다시 시도
https://learn.microsoft.com/ko-kr/cpp/windows/latest-supported-vc-redist?view=msvc-170
C:\mecab\user-dic 폴더에 utf-8 형식의 csv 파일을 추가한다.
기존 파일들은 각각 고유명사(nnp.csv), 인명(person.csv), 지명(place.csv)을 담고 있는 파일
ex) C:\mecab\user-dic\mydic.csv
단어, 0, 0, 우선순위, 품사 태그, 종성 유무, 읽기, 타입, 첫 번째 품사, 마지막 품사, 원형, 인덱스 표현
대우,,,,NNP,*,F,대우,*,*,*,*,*