악기분류 딥러닝을 만들기 전에

응큼한포도·2023년 11월 16일
0

가장 중요한 점

딥러닝은 데이터를 확보하는 게 제일 중요하다. 뭐? 데이터를 확보하는 게 가장 중요하다. 뭐? 데이터를 확보하는 게 가장 중요하다. 뭐? 데이터를 확보하는 게 가장 중요하다. 뭐? 데이터를 확보하는 게 가장 중요하다. 뭐? 데이터를 확보하는 게 가장 중요하다. 뭐? 데이터를 확보하는 게 가장 중요하다. 뭐? 데이터를 확보하는 게 가장 중요하다. 뭐? 데이터를 확보하는 게 가장 중요하다. 뭐? 데이터를 확보하는 게 가장 중요하다. 뭐? 데이터를 확보하는 게 가장 중요하다. 뭐? 데이터를 확보하는 게 가장 중요하다.

내가 실제로 물리학과 학기말에 졸업논문을 쓸 시간이 3달 정도 있었는데 딥러닝에 대한 이론을 배우는 게 3주 정도고 모델을 만들고 실험한 시간은 일주일 정도가 걸렸다. 근데 데이터 확보하고 가공하는 데 한 달 정도를 사용했다.

여러분이 딥러닝 프로젝트를 처음 접해본다면 딥러닝을 실습하는 데 대부분 모델을 개발 및 성능 튜닝하는 데 대부분 시간을 사용하고 가장 중요하다고 생각할 지 모른다.
하지만 한 번만 프로젝트를 경험해보면 가장 중요한게 데이터의 확보와 가공이라는 것을 느낄 수 있다.

데이터의 확보

우선 모델의 목적을 정한다. 내 경우에는 밴드음악 데이터를 이용해서 드럼,기타,베이스,보컬을 분류하는 간단한 딥러닝 모델을 만드는 것이였다. 애초에 밴드의 역사가 100년 정도 됐기 때문에 데이터를 얻기 쉬울 거라고 생각했다.

처음이라 아무것도 몰라서 악기 각각의 데이터를 100개 정도 구했는데 정말 뒤지게 힘들었다.

얻는 법

직접 녹음해서 데이터를 얻는다.

가장 좋은 방법이다. 모델에 따라서 필요한 음원 데이터가 다 다르다. 내가 악기 분류 딥러닝 모델을 만들어서 다행이지 만약 인간의 목소리에 따른 감정에 분류 같은 복잡한 모델을 만들었다면 기존의 데이터를 활용 할 수 없다.

당장 생각나는 건 영화 주인공들의 목소리를 활용하는 정도가 있겠는데 솔직히 연기의 감정과 실생활의 감정엔 차이가 있지 않은가? 제일 좋은 방법은 사람들을 사서 자연스러운 감정에 따른 목소리를 녹음하는 것이다. 그래야 모델을 상업적이고 정확한 모델을 만들 수 있다.

인터넷에서 데이터를 구한다.

분류 딥러닝이 어려운 이유가 있다. 분류 딥러닝 모델로 원하는 게 뒤죽박죽 섞인 데이터를 각각 분류해서 뽑아내는 것이다.

근데 이 모델을 만들려면 이미 분류가 된 독립된 데이터가 필요하다. 이게 가장 짜증나는 부분이다. 그러면서도 현재 인공지능의 원리이기 때문에 어쩔 수 없는 부분이기도 하다.

내 악기분류 모델을 예시로 들면 학습을 위해서 다양한 장르의 밴드 음악을 선정해서 유튜브나 음원 사이트를 통해서 분리된 음원 파일을 구했다.
metallica - master of puppets guitar isolated 이런 식으로 그러면 정말 자료가 없지만 사운드 엔지니어 들이 올린 파일들이 간혹 있다. 이런 식으로 모든 파일을 일일이 400개 정도를 구했다. 자료가 많은 분야가 이런식인데 나머지 분야는 말할 것도 없다.

따라 하시는 분들을 위해

없을 거라고 생각은 되는 데 혹시나 이 시리즈를 읽고 한 번 따라해 보고 싶거나 응용하고 싶다면 일단 데이터를 구하라. 만약 분류 모델을 만들고 싶다면 모델의 목적을 확정하기 전에 구글링을 통해서 이미 분류된 데이터가 확실히 많은 지 확인부터 하는 것이 좋다. 간단한 딥러닝 모델은 경험상 각 항목마다 음원 30-50개 정도가 충분하다고 생각한다.

profile
미친 취준생

0개의 댓글