Reference: [재작성] https://ratsgo.github.io/speechbook/docs/introduction
Automatic Speech Recognition:
Goal:
input에 대해 가장 likely 한 시퀀스 inference
|
but! 음성신호 사람마다 너무 다양함. (같은 음소나 단어라도 사람마다 발음 양상 다름). X의 분포를 우리가 generalization 하기 어려움. a가 감기걸렸을 때여도 "딸기", 신났을 때 말해도 "딸기"....
그럼 특정 단어 (y)의 모든 경우의 수에 해당하는 X 발생확률 추정이 너무 어려움.
So, bayes' Theorem 활용해서, 계산 가능하도록 바꿔보는 것임. 시퀀스는 한정된 범위니까, 입력신호를 고정해놓고, 어떤 단어가 저 목소리랑 비슷할지 찾는다는 것이구만!!!
|
|
음성인식 모델의 컴포넌트:
뒤에 나오니까 그때 하겠음