[AI 미션클리어] 9차시 – 음성 데이터의 이해

Kim yunseo·2022년 6월 6일
0

AI 지니어스

목록 보기
9/12
post-thumbnail

음성 인식

우리의 말 인지, 파악, 분석
-> 결과에 맞는 표현이나 결과 전달해 줌



인간이 이해하기 좋음 ->
기계어 어세블리 고급어 자연어



자연어

: 인간의 언어

한국어, 일본어, 중국어, 영어, 프랑스어

(서로 다른 감각을 사용하느 표상체계)
1. 문자언어
2. 음성언어
	주기적인 움직임을 갖는 waveform의 형태로 표현
    주기적인 움직임이 단위시간동안 진동한 횟수 등의 개념으로 표현
    
    x축: 시간
    y축: 진폭(Amplitude)
    잔폭: 주기적으로 진동하는 파형, 진동의 폭 의미
    마루: 볼록한 곳
    골: 오목한 곳
    
    
    
    
    
주파수 (frequency)
: Hz라는 단위를 사용하며, 단위시간 1초에 진동하는 횟수
	
    주파수 = 1 / 주기
    주기 = 1 / 주파수
    
잔폭이 클 때 -> 소리가 크다
잔폭이 작을 때 -> 소리가 작다




소리를 컴퓨터에 입력
-> 소리를 숫자로 표현해야 함
소리의 파동의 높이를 일정한 간격에 의한 좌표값으로 저장

소리를 샘플링하는 과정이라고 함
저장하는 주기 = 샘플링 레이트

샘플링 레이트가 짧음 -> 실제와 비슷한 신호
샘플링 레이트가 김 -> 실제와는 거리가 먼 손실이 많은 신호




표준 샘플링 레이트 44.1KHz

1초당 44,100개의 샘플을 추출했다는 뜻




소리의 파동
1. 시간영역
2. 주파수 영역





주파수 정보를 추출하는 특징 추출 기법

  • 스펙트럼

    	소리의 특징을 추출하여 사용하는 것
  • 멜 스펙트로그램

    시간에 대한 정보까지 고려하여
     주파수 특성이 시간에 따라 달라지는 특징을
     추출해 줄 수 있는 기법




기계어

: 기계의 언어

어셈블리어, 고급 프로그래밍 언어, 고급어
C언어, 파이썬, 자바

0개의 댓글