5초 음성파일로 당신의 목소리를 만드는 딥페이크

hur-kyuh-leez·2019년 11월 16일

영상으로 만들려다
단순하게 영어에서 한국어로 번역하는 거 같아서 그냥 글로 쓴다.

(참고: 사진클릭하면 영상으로 이동합니다)

공부하다가 유튜브를 볼 때면 양심이 찔리기 시작한다.
공부해야 되는데...
근데 내 양심을 덜 찔리게 하는 채널이 있다.
바로 인공지능 논문을 2분만에 설명해 주는 채널이다.
바로 'Two Minute Papers'
https://www.youtube.com/user/keeroyz/videos
논문 abstract 읽는 거 보다 재밌게 영상으로 설명 해준다.

2019.11.12.에 딥페이크 보이스 관련 영상이 올라왔다.
무려 5초 음성파일이 있으면 거의 완벽히 음성을 재현 할 수 있단다...!
파이썬 코더 유튜버 sentex가 소개한 것 보다 무려 (15*60 / 5 - 1)% 적은 파일로 더 비슷한 음성을 만든다!

(참고: 사진클릭하면 영상으로 이동합니다)

위 해당 영상은 sentex가 코드를 작성하지 않았다.
카카오 브레인에 계신 한국인 박사님이 2년 전에 만드신 코드이다.
https://github.com/Kyubyong
2년 사이에 15분에서 5초로 단축한 것 이다!
정말 인공지능 분야는 눈부신 속도로 빠르게 발전한다.
사실 이전 글에 언급한 딥페이크 보이스 코드이다.
로컬 딥러닝 서버가 없어서 제대로 시도를 못한게 바로 이 코드...
만약 빵빵한 local gpu 서버가 있으면 한번 시도 해보면 좋을 거 같다.

생각

항상 한가지가 아쉽다.
한국어로 된 데이터는 항상 부족하다.
물론 상대적으로 적은 인구가 사용하는 언어라 당연한 이 야기이지만... 그런데 NUGU를 사용해 보면 절대 Alexa에 밀리지 않는다. 그렇다는 이야기는 분명 충분한 음성 데이터가 존재한다는 것 인데...공개가 되지는 않은 거 같다.
이럴 때면, 영어권 나라가 부럽다.
우리보다 항상 더 빠르게 더 좋은 인공지능을 접하게 된다.
단순하게 사용인구가 많아 데이터가 많이 쌓이고,
잘 쌓고,
그리고 공개도 잘 한다.
그러하니 연구가 더 많아지고,
더 빠르게 새로운 인공지능이 상용화 된다.

하지만 반대로 생각하면,
오직 이런 분야가 우리나라가 꼭 지켜야 될 데이터이다.
절대 다른 나라에게 선점 시켜서는 안된다.
절대 외국인에게 무상으로 데이터를 공개해서는 안된다.
생각을 해봐라.
우리나라 보다 더 우리나라를 더 잘 알면,
당연히 우리나라를 착취 할 수 있다.
아니 이미...시작 되었는 지도...

이런면에서는 확실히 우리가 중국에 밀린다.
중국 관련 데이터는 중국이 독점한다.
선견지명 했다.
그러하니,
절대 중국은 다른 나라에게 착취 당할 수가 없다.
또한,
원하면 공산당은 언제나 모든 국민들의 데이터를 취합 할 수 있다.

hur-kyuh-leez

벨로그에 생각을 임시로 저장합니다. 틀린건 틀렸다고 해주세요 :) 그래야 논리 학습이 강화됩니다.

5초 음성파일로 당신의 목소리를 만드는 딥페이크

생각

인공지능 베이스 중소기업의 벽 (개인적인 생각)

5초 음성파일로 당신의 목소리를 만드는 딥페이크

0개의 댓글