boostcamp AI Tech 4기 18주차 회고록(01/23)

유상준·2023년 1월 23일
0

18주차 회고록

최종 프로젝트

FastAPI를 본격적으로 공부 했고, 스페셜 미션할 때 코드도 짜보면서 우리 프로젝트에 담당자가 어떤식으로 코드를 녹여내고 있는지 크로스체크했다. 아직 많이 부족한 것 같지만, 그래도 프론트엔드에서 리퀘스트 날리고 백엔드에서 받아오는 정도는 구현할 수 있게 되었다.

리랭킹에서 시간이 너무 오래걸린다. 결국 DB가 필수적인 것 같다. 속도개선을 한다고 한들, 페이지에서 결국 다시 리랭킹 옵션을 선택할 때마다 계산해야 되는데, 나는 리랭킹이 거의 새로운 모델을 학습하는 것과 비슷한 개념이라고 생각하기에 전체 유저에 대한 계산을 페이지에서 요구 할 때마다 하는 것은 불가능하다고 생각한다.

대안으로 일부 유저군집(10대 남성 or 30대 직업번호가 3인 여성처럼 조건을 선택)대상으로 리랭킹을 적용시키거나 혹은 특정 유저 id들 입력하면 그 유저에 대해서만 리랭킹을 진행(1인당 0.2~4초)하는 방법을 생각했다.

UML 다이어그램으로 백엔드와 프론트엔드간 I/O 명세를 확실히 하여 분업이 더 원활하게끔 하려고 한다.

오프라인 멘토링

오프라인 모임을 두 번했고, 한 번은 수내역 오프라인 교육장에 가서 당직 멘토님이신 류영표 멘토님과 대화도 나눴다. 기술면접에 나올 법한(부스트캠프 강의 내용 중에서) 질문지도 공유해주셨고, 그 동안 겪은 경험들과 앞으로의 길에 대한 조언도 해주셨다. 정말 열심히 살아오셨고, 치열하게 경쟁하며 살아남는다는 마인드를 갖고 계신것 같아서 살짝 놀라기도 했다. 아직 나는 아무것도 모르기에, 그 정도까지는 생각하지 못했는데 현실을 알게 된 것 같아서 기분이 씁쓸하고도 두렵기도 했다.

피드백

세상에는 유저의 인터랙션이 일정하지 않는 문제도 존재한다. 모든 데이터의 문제를 해결할 수는 없다.

⇒ 그러므로 문제를 한정해야 한다.

모델을 이용해서 추천할 수 있지만 모델은 모든걸 해결할 수는 없다.

  • 데이터 차원의 문제도 고려해야 한다.
    • 특정 배우, 감독이면 무조건 5점을 주는 사람들도 있다.
    • 이런 경우 이 데이터를 제거하고 진행하면 어떻게 결과가 변하는지 확인하는 것도 좋다.
  • 어떤걸 의도하고 만드는지 계속해서 상기해야 한다.
    • 우리는 추천시스템의 고질적인 문제를 해결하기 위해 이 서비스를 기획했다. 추천시스템은 모델의 성능이 곧 사용자의 만족도로 이어지지 않는다. 즉 유저의 시청기록을 정확하게 재현하는 추천 모델을 만들고 서비스에 이용해도, 수익으로 이어지지 않을 수 있다는 의미이다.
      추천의 품질을 높이기 위해서는 다양한 방법이 있다.
    • 콜드스타트 문제를 제외하기 위해 초기 유저는 선호 컨텐츠를 정하게 한다.(넷플릭스)
    • 다양성을 위해 내가 한번도 본 적 없는 제작자의 컨텐츠을 추천(스포티파이)
    • 참신함을 위해 내가 한번도 본 적 없는 주제의 영상을 추천(유튜브)
profile
데이터 사이언티스트 지망생

0개의 댓글