AI 커버곡 생성 알고리즘 RVC ( Retrieval-based-Voice-Conversion ) 을 사용하기 시작한지 한달이 되어 간다. 그동안 순수하게 덕질 목적으로 좋아하는 보컬들 AI 커버곡을 만드는데 열중했는데, 사용하다 보니 개발자 입장에서 RVC 모델 자체와 오픈소스 커뮤니티에 대해 흥미롭게 공부할 부분이 보이기 시작했다.
한달 간 직접 RVC 모델을 사용하며 정리한 내용을 아래와 같이 공유한다.
RVC 오픈소스 프로젝트는 아래와 같이 MIT License 정책하에 있다.
덕분에 RVC 오픈소스 프로젝트에서 GUI 개선을 위한 기여가 활발히 이뤄지고 있고 훌륭한 결과물들을 누구나 공유할 수 있다. 그 중에서 아래의 Mangio-RVC-Fork가 커뮤니티 내에서 큰 주목을 받고 있다.
그리고 이를 한차례 더 발전시켜서 Colab환경에서 gradio UI 기반으로 실행가능하게 개선한 Easy GUI 가 등장했다. donation 링크에서 기여자의 개발 id가 @lesantillan 인것까진 확인했는데 git 에서 개인 repo를 아직 못 찾앗다.
굵직굵직한 기여 흐름을 요약하면 아래와 같다.
<원본 프로젝트 repo>
Retrieval-based-Voice-Conversion-WebUI
↓
Mangio-RVC-Fork
↓
Easy GUI by @lesantillan
나는 @lesantillan 가 Colab에 공개한 버젼으로 RVC 모델을 학습시키고 또 해당 모델로 곡 변환하는 작업을 해왔다. 덕질한다고 나름 헤비하게 사용하고 이것저것 돌려본 경험에 기반했을 때, Colab이 무료로 기본 제공하는 GPU 리소스 할당량으로도 RVC 모델을 학습시키에 충분하다.
@lesantillan 가 현재진행형으로 활발히 기여하고 있는 것으로 보인다. 내가 처음 사용 시작한 버젼은 6/24/23 이고 글을 작성하는 시점에서 가장 최근 버젼은 9/08/23 이다. 그동안 새로운 버젼을 확인할 때마다 아래와 같이 개인 Colab 저장소에 복사본을 옮겨놨다.
@lesantillan 버젼의 RVC Easy GUI를 colab에서 실행하면 아래와 같은 화면을 브라우저에서 확인할 수 있고 세개의 탭이 있다.
RVC Easy GUI 버젼을 통해 누구나 비용 안들이고 AI Cover곡을 만들 수 있다.