지난 시간
이어 이번 시간에는
에 대해 알아보자.
우리가 평소에 자연에 의해 듣는 소리를 아날로그 신호라고 한다. 이런 아날로그 형식의 데이터를 컴퓨터나 디지털 장비에서 사용하기 위해 0,1로 된 디지털 신호로 변환하는 과정을 샘플링이라고 한다.
사람은 보통 20kHz까지 들을 수 있다. 그에 2배인 40kHz rate로 샘플링하면 자연스럽게 들을 수 있다고 한다.
샘플링 레이트는 샘플링시 얼마만큼 정교하게 샘플링하는지에 대한 주파수(Frequency)를 말한다. 1초 동안 몇 번 샘플링하는지를 계산하여 나타낸다. 음질과 밀접한 관계에 있으며 그 비율에 따라 11KHz, 22KHz, 44KHz 등으로 분류된다.
예를 들어, 22Khz는 입력되는 아날로그 데이터를 1초에 2만 2천번으로 세분하여 샘플링한 것을 의미한다. 샘플링레이트가 클수록 아날로그와 가까운 음질을 갖지만 용량이 커진다는 단점이 있습니다.
8 또는 16 비트로 표현.
샘플당 몇 비트로 나타낼 것인지에 대한 것이다. 8bit는 256가지의 소리를 표현할 수 있다는 말이되고 16bit는 65,536가지의 소리를 표현할 수 있다.
샘플링은 정교한 clock purses에 의존한다.
sampling 속도를 다르게 했을 때 피치 역시 달라진다. 정보의 왜곡이 생기는데 이를 jitter effect라고 한다.
Sampling이 주기에 따라 순간적인 값을 구한 것이면 Quantization(양자화)은 진폭 값을 디지털화한 것이다.
Sampling하기 이전에 랜덤한 작은 노이즈를 끼워 넣는 것.
이 과정을 통해 가파른 변화가 있는 음파를 자연스럽게 샘플링하는 것이 가능하게 한다.
r
을 초당 기록한 샘플 수
s
를 bit크기
이 둘을 곱한 rs
가 데이터의 크기이고, bytes
로 나타낸다면 rs/8
bytes
가 되겠다.
만약 레코딩 레벨이 너무 높거나 너무 낮을 때 증폭의 크기를 제한할 수 있다. 이를 clipping
이라고 한다. 왜곡이 조금 있지만 그렇게 심한 편은 아니다.
원하지 않는 noise를 제거하는 것
쉽게 말해 아날로그 소리를 정현파(sin, cos)들의 합으로 나타낼 때 각 정형파의 계수를 구하는 공식이다.
저음 통과 필터. 옷깃 스치는 소리, 바스락 거리는 소리와 같은 높은 음을 걸러주는 필터.
ex) hiss
고음 통과 필터. 코 고는 것 중 드르렁 거리는 소리와 같은 낮은 음을 걸러주는 필터.
ex) rumble
하나의 작은 주파수단위를 제거
ex) removing hum(50~60Hz)
치찰음(sibilance)을 제거. 마이크에 너무 가까이에서 말할 때 들리는 이상음을 제거.
남자는 4500Hz, 여자는 6780Hz
손상되거나 더러운 비닐 레코드에서 가져온 녹음에서 클릭 제거.
공간 음향을 표현한 것. 원본을 시간차를 두고 반복해서 표현. 작은 방에 있지만 콘서트 홀에 온 것 같은 느낌을 준다.
원하는 정현파의 계수를 크게한 것
Faders, tremolo
피치 변화 없이 늘려서 템포를 늦추거나 빠르게 하는 것.
압축
일반적으로, 오디오 데이터의 복잡하고 예상할 수 없는 특징 때문에 lossy, 손실이 있다.
증감값을 가지고 quantization size를 줄일 수 있다.
dynamic range
급변하는 소리보다 완만하게 변하는 소리에 사용하는 것이 유리.
masking
학교 수업에서 배운 내용을 토대로 작성했는데 정확한 원리에 대해 배운다기보다는 그냥 이런 개념들이 있다 정도의 나열식 수업이라 양은 많지만 깊은 이해를 하기에 부족했다. 수업을 들으면서 더 궁금한 내용은 직접 찾아보고 작성해서 조금 정리가 안된 부분이 많다. 이후 수업이 진행됨에 따라 추가적인 이해가 필요한 부분에 대해 좀 더 조사해보고 내용을 보충할 것이다.