[캡스톤] 유사 솔루션

정수현·2025년 3월 13일

캡스톤

목록 보기
1/8
post-thumbnail

2025.03.13

“발음 교정”에 필요한 기술

음성 인식 (ARS, Automatic Speech Recognition)

발음 평가 모델

음성 레벨 비교

딥러닝 기반 음성 분석 (DNN, CNN, RNN)

1) 음성 인식 (ARS, Automatic Speech Recognition)
2) 발음 평가 모델
3) 음성 레벨 비교
4) 딥러닝 기반 음성 분석 (DNN, CNN, RNN)

  • AI가 음성 파형을 분석해 발음의 자연스러움을 평가한다.

AI 발음 체크 과정 (예시)

① 사용자가 음성 입력
② AI가 사용자의 발음을 STT(Speech-to-Text)로 텍스트 변환
③ 사용자의 발음과 정답 발음을 비교 분석 (AI가 정답 발음과 비교 & 음소 분석)
④ 피드백 제공



유사 솔루션

1️⃣ Google Pronunciation Tool

구글에 원하는 단어의 발음을 검색 (예시 : squirrel 발음)

① 사용자의 음성 입력

  • 정답 발음을 듣고, 'Practice'를 눌러 사용자의 발음 입력

② AI가 사용자의 발음을 STT로 텍스트 변환

  • skwaar·uhl

③ 사용자의 발음과 정답 발음을 비교 분석

  • Try to say skwur instead of skwaar

④ 피드백 제공

  • Think of this as a long "r" sound. Make sure the tip of our gongue isn't touching anthing.
  • 장음인지 단음인지, /o/ 발음인지 /ɔ/ 발음인지 등을 피드백 해준다.

2️⃣ ELSA Speak

제시 단어 : choir [ˈkwaɪə(r) ]

  • 음성 및 발음 기호를 통해 단어의 발음을 확인

① 사용자의 음성 입력

② AI가 사용자의 발음을 STT로 텍스트 변환

  • 이거눈 없는듯 ,,

③ 사용자의 발음과 정답 발음을 비교 분석

  • 음절 단위로 정답 발음과 사용자의 발음을 비교 및 분석

④ 피드백 제공

  • This is a /w/ sound. Start with your lips tightly rounded into a small circle and then move them apart to shift to the next vowel.
  • This is a /k/ sound. Raise the back of your tongue up against the roof of your mouth to stop the air from coming out, and then release it.
  • 혀의 위치, 입술의 모양 등에 대한 피드백 제공

0개의 댓글