오늘도 이어서 https://ratsgo.github.io/speechbook/docs/phonetics/humans를 정리해본다
인간의 음성 인식
lexical access
- frequency: 사람은 빈도 높은 단어를 빠르게 인식
- parallelism : 여러 단어(예컨대 두 명 이상의 화자가 발화)를 한번에 알아들을 수 있음
- cue-based processing : 인간의 음성 인식은 다양한 단서(cue)에 기반
cue-based processing
on-line processing
- 인간의 말소리 인식은 그때그때 실시간으로 진행
- Marslen-Wilson의 1973년 연구
- 사람은 다른 사람의 말을 듣고서 250ms 내에 바로 따로 말할 수 있음
- = 단어 세그먼트(word segmentation), 구문 분석(parsing), 그리고 해당 문장에 대한 해석(interpretation)에 이르기까지 전 과정을 250ms 안에 처리 가능하다는 뜻