데이터 기반 제품 개선!
머신 러닝을 통해서 패턴을 찾아 미래를 예측해 제품을 개선하는 기법.
머신러닝은 블랙박스 형태로 데이터를 누적함.
데이터 과학자의 역할
- 머신러닝의 형태로 사용자들의 경험을 개선
- 문제에 맞춰 가설을 세우고 데이터를 수집한 후에 예측 모델을 만들고 이를 테스트
- 장시간이 필요하지만 이를 짧은 사이클로 단순하게 시작해서 고도화 하는 것이 좋다. (한큐에 진행한다면 엄청난 시간과 한번의 실수가 치명적으로 작용할 수 있기 때문에 애자일 개발형태로 진행)
- 테스트는 가능하면 A/B 테스트를 수행하는 것이 더 좋다.
- 데이터 과학자에게 필요한 스킬셋
- 머신러닝/인공지능에 대한 깊은 지식과 경험
- 코딩능력(파이썬과 SQL)
- 훈련데이터를 만들때에 데이터 클린업시 코딩을 통해 단축시키는 데에 밀접한 관계가 있다.
- 통계 지식, 수학 지식
- 끈기와 열정!
- 한기용 강사님 의견 : 한 가지에 몰두했던 경험을 한 박사학위가 도움이 되는 이유!
훌륭한 데이터 과학자란?
- 제일 중요한 것은 모델링을 위한 데이터의 존재 여부(데이터가 없으면 말짱 도루묵)
- 다양한 경험을 통해 나만의 인사이트를 만들 수 있는 사람.
- 접근 방법을 애자일 기반으로 모델링. / 딥러닝이 모든 문제의 해답이 아님을 명심
- 지표기반 접근
- 내가 만드는 모델의 목표와 측정 데이터를 체크.