정확히는 서비스 요구 사항으로부터 학습 데이터셋의 종류/수량/정답을 정해야 한다.
질의 응답을 통해 데이터셋의 종류/수량/정답 관련 요구 사항을 구체화해야 한다.
종류
기술 모듈 설계
정답
결국 학습 데이터 준비를 하려면 모델 파이프 라인 설계가 되어야 한다!
그런데 모델 파이프 라인을 설계하려면 어느 정도 데이터가 있어야 한다.
즉, 모델 설계와 데이터 수집, 서비스 요구 사항 확인이 여러번 반복하며 수렴된다.
ML Product는 보통 다음과 같은 과정을 통해 만들어진다.
ML Team
Full Stack ML Engineer in ML Team
: Full Stack ML Engineer가 팀에서 하는 구체적인 업무
Job 1: 실생활 문제를 ML 문제로 formulation
Job 2: Raw Data 수집
Job 3: Annotation tool 개발
Job 4: Data version 관리 및 loader 개발
Job 5: Model 개발 및 논문 작성
Job 6: Evaluation tool 혹은 demo 개발
Job 7: 모델 실 서버 배포
Full stack ML Engineer가 되기 어렵나요?
염두 할 것
시작이 반이다? - 시작이 80%다.
처음부터 너무 잘하려고 하기 보단, 최대한 빨리 완성하자.
전문 분야를 정하자.
새로운 것에 대한 두려움을 없애기 위해 반복적으로 접하자.
어떻게 시작하는 것이 좋을까요?
자신을 이해하라.
학교를 다니는 동안 AI 관련 인턴십, 아르바이트를 하라.
AI 대회를 나가보자(ex. 캐글)
최신 논문을 재현해보자
FAQ
회사를 가기 위해 석사/박사를 해야 하나요?
X를 꼭 배워야 하나요?
어떤 역량을 쌓아야 할까요?
제가 가진 역량을 어떻게 보여줘야 할까요?
AI 관련 각 포지션의 이름은 아직 완전히 합의 된 것이 아님. 따라서 모집 공고를 꼼꼼히 읽자(같은 이름인데도 다른 업무를 할 수도 있음)
각 사람이 100% 하나의 역할만을 수행하는 경우는 드물다
나의 관심사와 능력 뿐 아니라 시장의 흐름과 수요/공급을 고려해서 커리어 방향을 정하면 더 많은 기회가 열릴 것
모든 것을 잘하려고 하기보다 팀에 기여할 수 있는 나만의 엣지를 키우는 것이 더 중요
오 내용 정리가 잘되어있어서 잘 봤습니다 ㅎㅎ 좋은 글 감사합니다!