[Review] 가상 면접 사례로 배우는 머신러닝 시스템 설계 기초

Judy·2024년 7월 26일
1

Review

목록 보기
2/2

❗️ 머신러닝 실무자라면 꼭 한번쯤 읽어야 하는 실전 바이블

운 좋게 도서 리뷰어에 당첨되었습니다.
(인사이트 관계자분들께 감사드립니다 🥰)

AI Researcher, 그러니까 머신러닝 엔지니어로서 논문 읽고 모델 가져다 쓰는 등 AI 기술에만 집중해 왔는데
주니어로서 현업에서 AI 를 이용해 서비스를 만드는 과정에서 필요했던 역량은
하나의 서비스를 처음부터 만들기 위해서는 시스템을 설계할 줄 아는 역량과
실제 서비스가 가능할 정도로 품질을 향상시키고 검증할 줄 아는 역량이었습니다.

👍 추천 대상

이 책을 다음 독자들에게 특히 추천드리고 싶습니다.

  • 📌 데이터 사이언티스트 (강추!)
  • 머신러닝 시스템을 처음부터 설계해야 하는 개발자
    • AI 배경지식이 얕은 경우 이 책이 다소 어렵게 느껴질 수 있음.
    • 주니어보다는 시스템을 설계해야 하는 직책 (시니어, 팀장 등) 을 맡은 경우 더욱 추천
  • 기업에서 실제 서비스를 만들어야 하는 AI 연구원
  • 추천 시스템 연구자 및 개발자
    • 특히 6장부터 11장까지 추천 시스템을 다루므로.

📚 Contents

이 책은 총 11장으로 구성되어 첫번재 장을 제외하고 각 장별로 실제 시스템 설계 사례 10가지를 다루며
각 장의 소주제는 다음과 같이 모두 동일합니다.

  • 💁🏻‍♀️ 요구사항 명확화

    • 지원자와 면접관 간의 가상 면접 대화를 제시하여 주제에 맞는 요구사항을 간소화하거나 필요한 조건 상정
      • 예시) 검색 대상 명확화(이미지, 동영상, 텍스트 중 이미지에만 집중하는 등), 개인화 포함 여부, 데이터셋 규모, 다국어 지원 여부 등
  • 🧐 머신러닝 작업으로 문제를 구조화

    • 머신러닝 목표 정의
    • 시스템의 입력 및 출력 지정
    • 적합한 머신러닝 유형 선택
  • 🗂️ 데이터 준비

    • 데이터 엔지니어링
    • 피처 엔지니어링
  • 🤖 모델 개발

    • 모델 선택
      • 적합한 모델과, 해당 모델을 선택한 이유 설명
    • 모델 훈련 (Train)
      • 데이터셋 구성
      • 손실 함수 선택
  • 📊 평가

    • 오프라인 지표 (통계적 지표)
      • 모델을 평가하기 위한 서너가지 평가 지표를 제시하고, 최종적으로 선택한 지표와 그 이유 설명
    • 온라인 지표
      • 클릭률 등
  • ⛓️ 서빙

    • 한 장의 그림으로 전체 서비스 파이프라인을 한 눈에 볼 수 있게 설명
  • 🙋🏻‍♀️ 추가 논의 주제

    • 면접이 끝나고 시간이 남는 경우를 가정하고, 추가로 논의할 수 있는 주제 제시
      • 예시) 편향 문제 해결, 더 나은 모델 및 학습 방법, 해당 설계의 장단점, 외부 요인(보안정책 등) 이 시스템에 미칠 수 있는 영향 등
  • 📝 요약

    • 트리 형태로 해당 장에서 설명한 모든 내용을 정리
  • 📑 참고 문헌

    • 용어 설명 위키피디아 링크, 논문 링크 등

🌱 Before & After 🌳

이 책을 읽고 난 후 개인적인 변화는 다음과 같습니다.

  • 실제 시스템을 설계할 때 고려해야 할 조건을 명확하게 정의할 수 있게 됨
    (= 요구사항 명확화)
  • 필요한 데이터셋의 요구 조건과 최소 크기를 고려할 수 있게 됨
  • 서비스에 적합한 모델을 선정하고 그 이유를 설명할 필요성을 깨달음
    • 예를 들어 지금까지는 오픈소스 LLM 을 이용하여 서비스를 만든다면 단순히 LLaMA3를 이용해 구현하는 데에만 집중했으나, 이제는 몇 가지 LLM (Gemma, Mistral, LLaMA) 의 특성 및 장점을 먼저 체크한 후, 해당 모델을 선정한 이유를 설명할 수 있도록 진행할 예정
  • 모델 평가 시 각 평가 지표의 특성을 알고 적합한 지표를 선정할 필요성을 깨달음
    • 예를 들어 LLM 서비스의 성능을 평가한다면 ROUGE, RAGAS 등의 평가지표 계산식을 이해하고 서비스에 적합한 평가 지표를 선정할 예정
  • 시스템 설계 시 단순히 모델의 input/output 뿐만이 아니라 데이터셋 구축 및 사용자 입력부터 최종적으로 제공되어야 하는 이벤트까지 고려해야 함을 깨달음

좋은 책을 읽을 기회를 주신 인사이트 출판사에 다시 한번 감사드립니다 🙇🏻‍♀️
👉 Yes24 구매링크

profile
NLP Researcher

0개의 댓글