난 데이터 분석가가 되고 싶었다.
- 좀 더 정확하게는 Data-Science 10% 와 Data-Analysis 90%쯤이다.
잠깐, 내가 생각했을때 Data-Science는 뭘 하는 것이고 Data-Analysis 는 무엇인가?
그 둘에는 무슨 차이가 있는가?
DS란?
- Data-Science는 논문을 읽고 코드로 구현하거나, 복잡한 모델링을 하는 일이라고 생각한다.
- 다른 말로는 Researcher에 가깝다고 생각한다.
DA란?
- Data-Analysis는 EDA를 하는 일이라고 생각한다.
- 그렇다고 Businiess-Analyst가 되긴 싫었다.
- 시장에서의 BA는 쿼리(머신) + 마케팅에 집중된 업무라고 생각한다.
- 하루종일 쿼리만 하다보면 재미가 없고,
- 어떤 물건을 더 많이 판매하기 위해, 리텐션등을 올리기 위해 A/B 테스팅을 반복하는 업무는 들이는 노력에 비해 내가 잘 못할것 같기도 하고 재미도 없을 것 같았다.
- 예를 들어 매출은 떨어지는데, 나보고 원인/해결방안을 파악해오라고 하면 잘 못할 것 같다. 걍 뇌피셜이 아닐까?
- 노하우가 축적되면 잘 할수도 있으나, 답도 없는 문제에 괴로운 반복되는 일상이 상상된다.
- 어쩌면 이 영역은 예전에는 엑셀로 하던 사무직의 일이, 단순히 일의 도구만 SQL, Python이 된건 아닐까? 생각하기도 했다. (몰라서 하는 말이다.)
왜 시장에서 BA 직군이 많을까?
- 일반적인 비즈니스에선 DA로 돈을 못벌기 때문이다.
- 비싼 몸값치곤 가성비가 안좋다.
- 반면 BA는 DA에 비해 목적이 보다 명확하다. ( 어찌보면 분석 주제가 한정되어 있다고 본다. )
- BA가 가성비가 좋을 확률이 높다.
학생때 생각하던 DA 업무와 현실은 무엇이 다른가?
- 이미 충분히 이상적인 일을 하고 있지만,
- 그럼에도 불구하고 학생때의 bias 와 현재의 bias에는 차이가 있다.
분석의 스킬적인 부분
- 모델, 데이터 분석의 스킬적인 부분은 "도구"일 뿐이다.
- EX. 모델링을 최적화하여 성능을 0.1% 높이는 것
- "도구"라고 깎아내리는건 아니다.
- 예전의 난 누군가 '이미 그걸 해봤는데 안됐어' 라고 한다면
- '그건 니가 못해서 안된거겠지'라고 생각했던 사람이었다.
- 도구를 잘 다룬다는건 엄청난 메리트다.
- 그리고 내가 도구를 다루는 능력이 부족하다는 것 또한 알고 있다.
- 다만 돈을 받고 성과를 내야하는 입장에서, 언제나 성과가 도구보다 우선시된다는 것이다.
- 도구를 쓸 줄 모른다면 그거대로 문제지만, 도구로 "성과"를 내는게 더 중요한데, 분명히 평범한 도구로 위대한 성과를 내는 사람이 있고, 비범한 도구로 성과를 내지 못하는 사람이 있다.
- 별개로 "성과"를 내는건 무척 어렵다.
- 별개로 내가 쓰는 도구가 구린걸 알지만 현시점에서 전략적으로 가성비있게 성과를 내기 위해 타협하는건 훌륭한 결정이라고 생각한다.
- 현 시점에서 스킬적 부분에서 내가 가장 부족한 부분은 "패턴 발견" 및 "이를 훌륭하게 표현하는 방법"이다.
- 별개로 잘 설명하는 능력 또한 부족하다고 느낀다.
Closed Problem and Open Problem
- 학교에서 풀던 문제는 답이 있던 문제였다.
- 그러나 현실에서 풀어야 하는 문제는 답이 없는 문제이다.
- 초보면 초보일수록 답이 없는 문제를 잘 풀지 못하고
- 노하우가 쌓일수록 답이 없는 문제를 잘 풀 수밖에 없다고 생각한다.
- 노하우가 쌓일수록 문제 정의를 잘하기 때문이다.
- ( 별개로 어떤 산업의 도메인에서 설득력있고 잘 통하는 논리가 있다고 생각한다. )
- 따라서 초보면 초보일수록 이게 왜 문제인지를 남에게 설득할 수 있어야 한다.
- 따라서 초보면 초보일수록 문제 정의를 고민해야한다.
아무것도 모르지만 일단 뭐라도 써봤다.