❗️ 머신러닝 실무자라면 꼭 한번쯤 읽어야 하는 실전 바이블
운 좋게 도서 리뷰어에 당첨되었습니다.
(인사이트 관계자분들께 감사드립니다 🥰)
AI Researcher, 그러니까 머신러닝 엔지니어로서 논문 읽고 모델 가져다 쓰는 등 AI 기술에만 집중해 왔는데
주니어로서 현업에서 AI 를 이용해 서비스를 만드는 과정에서 필요했던 역량은
하나의 서비스를 처음부터 만들기 위해서는 시스템을 설계할 줄 아는 역량과
실제 서비스가 가능할 정도로 품질을 향상시키고 검증할 줄 아는 역량이었습니다.
👍 추천 대상
이 책을 다음 독자들에게 특히 추천드리고 싶습니다.
- 📌 데이터 사이언티스트 (강추!)
- 머신러닝 시스템을 처음부터 설계해야 하는 개발자
- AI 배경지식이 얕은 경우 이 책이 다소 어렵게 느껴질 수 있음.
- 주니어보다는 시스템을 설계해야 하는 직책 (시니어, 팀장 등) 을 맡은 경우 더욱 추천
- 기업에서 실제 서비스를 만들어야 하는 AI 연구원
- 추천 시스템 연구자 및 개발자
- 특히 6장부터 11장까지 추천 시스템을 다루므로.
📚 Contents
이 책은 총 11장으로 구성되어 첫번재 장을 제외하고 각 장별로 실제 시스템 설계 사례 10가지를 다루며
각 장의 소주제는 다음과 같이 모두 동일합니다.
-
💁🏻♀️ 요구사항 명확화
- 지원자와 면접관 간의 가상 면접 대화를 제시하여 주제에 맞는 요구사항을 간소화하거나 필요한 조건 상정
- 예시) 검색 대상 명확화(이미지, 동영상, 텍스트 중 이미지에만 집중하는 등), 개인화 포함 여부, 데이터셋 규모, 다국어 지원 여부 등
-
🧐 머신러닝 작업으로 문제를 구조화
- 머신러닝 목표 정의
- 시스템의 입력 및 출력 지정
- 적합한 머신러닝 유형 선택
-
🗂️ 데이터 준비
-
🤖 모델 개발
- 모델 선택
- 적합한 모델과, 해당 모델을 선택한 이유 설명
- 모델 훈련 (Train)
-
📊 평가
- 오프라인 지표 (통계적 지표)
- 모델을 평가하기 위한 서너가지 평가 지표를 제시하고, 최종적으로 선택한 지표와 그 이유 설명
- 온라인 지표
-
⛓️ 서빙
- 한 장의 그림으로 전체 서비스 파이프라인을 한 눈에 볼 수 있게 설명
-
🙋🏻♀️ 추가 논의 주제
- 면접이 끝나고 시간이 남는 경우를 가정하고, 추가로 논의할 수 있는 주제 제시
- 예시) 편향 문제 해결, 더 나은 모델 및 학습 방법, 해당 설계의 장단점, 외부 요인(보안정책 등) 이 시스템에 미칠 수 있는 영향 등
-
📝 요약
- 트리 형태로 해당 장에서 설명한 모든 내용을 정리
-
📑 참고 문헌
🌱 Before & After 🌳
이 책을 읽고 난 후 개인적인 변화는 다음과 같습니다.
- 실제 시스템을 설계할 때 고려해야 할 조건을 명확하게 정의할 수 있게 됨
(= 요구사항 명확화)
- 필요한 데이터셋의 요구 조건과 최소 크기를 고려할 수 있게 됨
- 서비스에 적합한 모델을 선정하고 그 이유를 설명할 필요성을 깨달음
- 예를 들어 지금까지는 오픈소스 LLM 을 이용하여 서비스를 만든다면 단순히 LLaMA3를 이용해 구현하는 데에만 집중했으나, 이제는 몇 가지 LLM (Gemma, Mistral, LLaMA) 의 특성 및 장점을 먼저 체크한 후, 해당 모델을 선정한 이유를 설명할 수 있도록 진행할 예정
- 모델 평가 시 각 평가 지표의 특성을 알고 적합한 지표를 선정할 필요성을 깨달음
- 예를 들어 LLM 서비스의 성능을 평가한다면 ROUGE, RAGAS 등의 평가지표 계산식을 이해하고 서비스에 적합한 평가 지표를 선정할 예정
- 시스템 설계 시 단순히 모델의 input/output 뿐만이 아니라 데이터셋 구축 및 사용자 입력부터 최종적으로 제공되어야 하는 이벤트까지 고려해야 함을 깨달음
좋은 책을 읽을 기회를 주신 인사이트 출판사에 다시 한번 감사드립니다 🙇🏻♀️
👉 Yes24 구매링크