나는 8개월 간 데이터 PM 인턴 경험을 쌓았다.
퇴사 후에 시간이 조금 흐르긴했지만 지금이라도 내가 어떤 작업을 했는지 작성해보고자 한다.
오로지 나의 경험을 바탕으로 작성했기에 참고만 해주시길..
데이터 PM은 한 줄 요약해보자면 "데이터를 만들기 위해 프로젝트를 굴러가게 하는 사람이다."
여기서 데이터란 (우리 회사 한정) 언어 데이터를 지칭한다. 언어 데이터의 종류는 다양하다. 텍스트, 이미지, 음성 등을 일컫는다.
우리 회사는 B2B였기에 고객사로부터 프로젝트를 수주받았다.
고객사 마다 데이터 종류와 목적이 다 다르다.
따라서 고객사 마다 프로세스가 달라지게 된다. 각 상황에 맞춰서 프로젝트 진행 방식에 대한 프로세스를 짜야한다.
예를 들어, 고객사가 한국어 데이터를 요청하는 경우 어떤 방식으로 데이터를 구축할 것인지, 검수는 어떻게 할 것인지, 작업자는 몇 명이 필요한지, 작업자는 어떻게 뽑을 것인지 등등을 정하게 된다.
참고) 내가 맡았던 프로젝트는 약 4개정도 된다.
이렇게만 설명하면 어려우니 JD를 가져왔다.
내가 일했던 곳의 JD를 보면 데이터 PM의 역할은 다음과 같다.

다른 회사의 비슷한 직무에 대한 JD도 한 번 가져와보았다.

회사마다 직무에 대한 명칭이 다를 뿐 하는 일은 비슷한 것 같다.
내 경험을 바탕으로 JD를 해석해보면 다음과 같다.
회사의 규모에 따라 다르지만 인턴 또는 신입의 경우에는 투입 리소스 소싱 및 관리와 데이터 품질 관리를 하게 될 가능성이 크다.
AI에 대한 관심이 없고 관련 전공이 아니더라도 괜찮다.
나의 학사 전공은 "언어학"과 "컴퓨터 전자 시스템 공학과" 이다.
AI 관련 교육도 다수 수료했고 프로젝트 경험도 2-3개가 있었다.
그러나 꼭, 학사 전공에 구애받지 않는 것 같다. 함께 입사한 동기들은 제 2 외국어(일본어, 스페인어, 불어 등등) 전공생들도 많았고, 심지어 유아 교육과, 동양 철학과도 있었다.
영어는 필수고 제2외국어 할 수 있으면 좋다.
고객사 중 외국계 기업이 있느냐 없느냐에 따라 다르겠지만, 내가 근무했던 곳은 외국계도 있었고 다양한 언어의 데이터를 구축하는 프로젝트도 있었기 때문에 영어는 필수였다.
영어 이외의 외국어를 구사할 수 있다면 충분한 강점이 된다.
데이터 PM은 엑셀, 스프레드 시트를 사용하여 투입되는 리소스를 관리한다. 따라서 엑셀을 잘하는게 좋은 것 같다.
나는 엑셀을 잘하지 못하지만 SQL을 공부했기 때문에 함수가 크게 어렵지 않았다. 그리고 쓰는 함수들이 정해져있어서 그것만 공부하면 된다.
잘 모르지만 좋지 않을까 싶다.
언어 데이터는 주로 클로바, 챗 지피티 등과 같은 LLM(대규모 언어모델)의 학습을 위해 필요하기 때문에 LLM의 전망에 따라 달라질 가능성이 크다고 생각한다.
이 기사에 따르면 LLM 시장 규모가 2030년까지 약 32% 꾸준히 성장한다고 하니, 그만큼 데이터가 많이 필요하다는 말이니까 데이터 PM의 전망 역시 좋지 않을까 싶다.