넷플릭스의 오프닝 건너뛰기에 대해 - 아니 대체 어떻게 한거야?

Shin Yeongjae·2020년 4월 27일
2

구글링 도중 흥미로운 글들(1, 2)을 읽게되어 번역을 한번 해볼까 합니다..

미천한 영어 실력이라 오역, 의역이 매우 많습니다.

감안하고 가벼운 마음으로 봐주시면 감사하겠습니다 😉



넷플릭스를 많이 보신 분들이라면 오프닝 건너뛰기 버튼을 보셨을겁니다.

보통 콜드 오프닝이 있는 영상들에 있는데요, 저는 넷플릭스에서 이 기능을 어떻게 구현했는지 항상 궁금했습니다.

왜냐하면 오프닝 건너뛰기는 영상들을 몰아서 볼 때 성질이 급한 우리를 위해 시간을 많이 절약해주거든요 😆

그래서 넷플릭스에서 어떻게 구현했을 지 몇 가지 추측을 해봤습니다.


😱 사람, 사람, 사람

인력을 동원해 수천 시간에 달하는 모든 영상의 인트로 시작과 끝을 수작업으로 기록했을까요?

넷플릭스... 당신들 진짜로 그렇게 하지 않았길 바랍니다..

🔊 오디오 인식

이 방법이 사실 가장 가능성이 높은 방법입니다.

영상에서 인트로를 구성하는 요소 중 하나는 바로 오디오인데요, 인트로의 오디오는 항상 똑같습니다.

따라서 알고리즘을 통하여 음향 지문(acoustic fingerpint를 어떻게 번역해야할지..) 을 인식 시킵니다.

그리곤 똑같이 끝나는 부분에 오프닝 건너뛰기 기능을 추가하는 겁니다.

샤잠이 바로 이 방식을 이용했습니다. 네이버의 음악 찾기도 같은 기능을 이용했겠네요.

아래에서 음향 지문의 예시를 보여드리겠습니다.

🖥 머신 러닝

넷플릭스는 놀라운 기술을 가진 기업이기 때문에, 머신러닝을 이용해 오프닝 건너뛰기 기능을 추가했다고 해도 놀랍지는 않습니다.

주당 10억 시간 이상의 영상을 분석할 수 있다고 하는데요

예를 들어, Friends라는 영상을 이용해 학습을 시켜 오디오 샘플이나 시각적인 신호가 없어도 인트로의 시작과 끝을 인식하도록 할 수 있습니다.

그리곤 학습된 것을 바탕으로 다른 영상에 적용시키기 위해 스스로 배우게 될 것입니다.

또 다른 방법으론 이용자들의 패턴을 분석하여 각 영상들의 인트로의 시작과 끝이 어디인지 학습시킬 수 있습니다.

넷플릭스에서는 주당 10억 시간 이상의 영상을 분석할 수 있다고 합니다.

이런 무서운 컴퓨터를 이긴 이세돌 당신은 대체..

📺 스크린 스크래핑

스크린 스크래핑이라는 기술이 있습니다.

이 기술을 이용한 앱 중에 Tunity라는 앱이 있습니다.

Tunity는 TV가 만약 음소거 상태라도 화면을 인식하여 소리를 들을 수 있게 해주는 앱 입니다.

이 마법같은 기술은 여러분들이 보고 있는 TV 화면을 스캔하여 현재 방송중인 채널의 오디오와 매칭하는 기술 입니다.

그렇다면 넷플릭스는 어떤 방식으로 활용할 수 있을까요?

바로 머신 러닝에서 언급한 시각적 신호를 활용하는 것입니다.

The Office라는 드라마를 예로 들어 보겠습니다.

The Office의 인트로는 시작부터 30초까지 같은 화면이 재생 됩니다.

따라서 알고리즘을 통하여 모든 영상들에 대해 동일한 프레임이 반복되는 구간을 찾아

인트로가 언제 시작하는지 계산하여 오프닝 건너뛰기 기능을 추가할 수 있습니다.


profile
문과생의 개발자 도전기

1개의 댓글

comment-user-thumbnail
2020년 7월 20일

알려진 바로는 전체 수작업입니다. 유튜브처럼 1초에 수 백시간의 영상이 올라오는 것도 아니고 넷플릭스 직원들이 업로드하는 것이며 어차피 자막 작업과 검수 작업도 해야하는데 인트로 쯤이야 시작 지점과 끝 지점에 플래그만 지정하면 되니까요.

게다가 언급하신 오디오 인식이나 스크린 스크래핑을 사용하기 위해선 처음 몇 개를 사람이 수작업으로 태깅을 해줘야 적용을 시작할텐데, 인트로가 똑같은 시리즈는 많아봐야 십수 편 뿐일테니 차라리 사람이 수작업으로 하는 것이 빠를 겁니다. 어떤 드라마는 각 에피소드, 각 시즌마다 조금씩 다른 인트로를 사용하니 모델을 재활용할 수도 없고요..

답글 달기