외국인 발화 한국어 음성 인식률 향상 해커톤에 참가하면서 한국어 STT를 공부하고 구현한 내용을 정리해 보려 한다. 이번 포스터에서는 STT가 무엇인지, 실제 사용했던 오픈소스인 Kospeech에 대한 설명, 기본적인 개발환경 구축에 대해 작성할 생각이다. SST
👉 한국어 STT #1에 이어서 진행되는 내용에 대해 작성해보려 한다. 학습 실행 코드 Kospeech는 깃허브 README에 음성 파일과 해당 음성의 전사 파일만 있다면 feature 추출하고 벡터화된 데이터를 학습까지 한번에 실행 해주는 명령어를 모델 별로
지난글 👉\[ 한국어 STT 사실 몇시간 동안 작성했던 모두 저장을 습관...화... 합시다......이번 포스팅에서는 우리가 학습을 하면서 겪은 시행착오에 대해 작성해 보려 한다!python ./bin/main.py model=ds2 train=ds2_train t
지난 글 👉 한국어 STT #3 이때까지 학습을 위해 전처리, 글자 사전 생성, transcript.txt 파일 생성, 모듈설치 및 코드 수정을 통해 아래 실행 코드를 실행하면 학습이 실행된다! > python ./bin/main.py model=ds2 trai
지난 글 👉 한국어 STT #4 우리의 궁극적인 목표는 새로운 오디오 파일이 입력되면 그 오디오 파일의 전사가 출력이 되고 이를 총 10,000개의 테스트 케이스를 가지고 평가하는 것이었다. 음성인식에서 흔히 사용하는 CER과 WER로 평가가 이루어 졌는데, 오