11,12차시 - 인공지능을 통한 음성인식 기초 / 인공지능을 통한 음성인식 심화

주완·2022년 6월 9일
0

AI 미션 클리어

목록 보기
9/9
post-thumbnail

🔊 음성인식

트레이닝 셋 : 라벨링된 데이터 - 업로드한 음성에 라벨을 붙여 만듦

배경소음 수집이 중요 : 백색소음, 주변소음이 담겨 인식하지 못할 수 있어서 필수적으로 수집

인식할 소리를 제외하고 생활 소음, 백색소음, 주변 소음을 20초 이상 수집해야 한다.

제대로 발음, 그렇지 않은 발음 녹음

정확한 소리만 수집하는 것이 아니라 여러 발음으로 녹음해 다양한 데이터를 수집해야 한다.

하나의 클래스의 모아진 소리 합이 10초 정도 되게해야 함

음성 1초에 44000개의 데이터로 오랜시간이 필요하다.

중첩요인 : 빈도에 따라 0은 1초간격 0.5는 0.5초 간격으로 인식

주변소음이 달라지거나 다른 사람의 목소리로 테스트 하게되면 성능이 떨어질 수 있으므로 다양한 데이터를 수집해 인식률을 높이는 것이 중요하다.



🎤 음성인식 인공지능

배경 소음 인식, 음성의 특징이 잘 드러나게 녹음해야 하며, 특징이 정확할 수록 인식율이 늘어난다.

학슴 샘플 : 트레이닝 샘플, 트레이닝 데이터 셋

테스트 샘플 : 모아놓은 데이터셋의 15%가량으로 가중치 업데이트마다 성능을 평가하기 위한 데이터로 사용되는 테스트 데이터셋



🎤 과소적합

인공지능 모델이 학습샘플의 어떠한 특징이나 복잡성을 파악하지 못하여 분류 상태가 좋지 않은 경우

초기 에포크 상태에 자주 발생하며, 훈련 데이터 셋과 테스트 데이터 셋에 대한 성능이 둘 다 좋지 않다.



🎤 과적합

인공지능 모델이 지나치게 학습 샘플과 유사하게 분류하도록 학습되어서 테스트 샘플에 대해서는 성능이 좋지 않은 경우

훈련 데이터 셋 성능이 좋으나 테스트 데이터 셋 성능은 좋지 않다. 데이터 셋의 구성을 더 다양한 데이터와 많은 양의 데이터가 필요하다.

과적합, 과소적합 해결 방안

  1. 배경소음 데이터 확보
  2. 데이터 양 늘리기
  3. 데이터 특징 잘 드러나도록 정제하기

손실, 정확도 함수 그래프로 성능 평가할 수 있다.

스크래치 내에서 티처블 머신 연동 프로그램, tts 프로그램을 활용해 음성인식 인공지능을 제작해 볼 수 있다.

profile
배움을 기록하자

0개의 댓글