CNN으로 웹툰 그림체 학습이 가능할까?

Lana Chung·2021년 4월 29일
0

나는 추천 시스템에 관심이 많다. 추천 알고리즘 전문가가 되고 싶어서 딥러닝을 배우게 됐다.(엥) 이번 일주일 소small프로젝트때도 그래서 컨텐츠 추천 알고리즘 관련된 걸 해야겠다고 생각했다. 굳이 따지자면 영상 쪽에 더 관심이 많지만, 영상 보다는 이미지 컨텐츠가 다루기 더 쉽고 CNN에 대해 배웠으니 이미지 특징 추출을 해보고 싶어서 웹툰으로 정하게 됐다.

웹툰을 선택할 때, 3초 안에 결정된다는 사람의 첫인상처럼 웹툰의 썸네일은 그토록 중요하다. 하지만 100 픽셀도 되지 않는 작은 썸네일에 얼마나 많은 것을 담을 수 있단 말인가? 심지어 바둑판처럼 모여있기에 선택받기 위해선 튀어야 한다. 유명한 작가가 아니고서야 웬만한 작가들은 썸네일에 본인 작품의 정수가 담겨있길 바랄 것이다. 작품을 설명하는 작은 창. 그것이 딥러닝에서 학습 후 추출할 수 있는 작품의 "Latent Space"일 것이다. 우리는 그러니까 인공 신경망 모델을 통해 벡터화 되어 있는 작품의 썸네일을 찾는 것이다. 작품의 수많은 특징, 색감과, 선과, 대사와, 연출이 녹아 있는 특징들 사이에 그것들을 통틀어 설명하는 벡터 말이다.

그래서 나도 처음엔 Auto Encoder 모델을 생각했다. 오토 인코더는 인코딩, 디코딩을 거쳐 진짜 이미지를 재현함으로써 latent vector을 학습하게 된다. 그리고 KNN처럼 비슷한 그림체를 가진 웹툰끼리 추천해주기 위해 Kmeans Clustering을 사용하기로 했다.

profile
그게 쉬운 일이었다면, 아무런 즐거움도 얻을 수 없었을 것이다.

0개의 댓글