SOUND: 소리
acoustics: 음향, hifi(오디오)
speech: 음성(발화,청취) - 서비스 현장(고객 응대)
신호처리(전자과 2학년), 신호와 시스템, 디지털 신호처리
speech recognition : 학부 고학년, 전자과 대학원
기본신호처리
파이썬 기본 사운드 라이브러리
pytorch-audio
gan
api(구글, 카카오, 네이버)
(analog input) -> (analog-digital converter) -> (digital signal processing)
-> (digital analog coverter) -> analog ouput
analog input: 공기의 진동, 성대, 마이크 수음(전기 진동) ->
analog-digital converter: 사운드 카드 ->
digital signal processing: PC 프로그램->
digital analog coverter: 사운드 카드 ->
analog ouput: 스피커: 변형된 공기 진동
analog input: 공기의 진동, 성대, 마이크 수음(전기 진동) ->
analog signal processing: 저항, 콘덴서, 코일, 트랜지스터(진공관), 전기 회로, 카세트 테이프
analog output: 스피커: 변형된 공기 진동
analog to digital converter
import numpy as np
import matplotlib.pyplot as plt
X_analog = np.linspace(0, 2*np.pi, 1000) #1초 음성 신호 가정
y_analog = np.sin(X_analog) * 10.0/2.0
X_digital = np.linspace(0, 2*np.pi, 10) # 디지털 샘플링(sampling rate : 60hz)
y_digital = (np.sin(X_digital) * 10.0/2.0).astype(int)
plt.plot(X_analog, y_analog)
plt.plot(X_digital,y_digital, "o")
plt.legend(["analog","digital_quantized"])
plt.show()
cd음질 44100hz, old전화기: 8000hz, 음성: 16000hz, 고급 192000hz
진폭 표현력 8bit, 16bit, 24bit
🐱