데이터 분석가의 필요역량
1. 문제 정의 역량
- 문제 정의 : 문제의 본질을 파악하는 과정
- 특정 현상을 파악하고, 현상의 문제를 정의
- 문제 해결을 위해서는 문제 정의가 중요
- 문제 정의 흐름도
현상파악 > 문제 정의 > 프로젝트 설계 > 실행 > 추가 원인 분석
- How보다 Why? 가 중요
2. 비즈니스 모델 파악 역량
- 회사의 비즈니스 파악
- 데이터 활용 부분(Input)
- 어떤 데이터가 존재하는가?
- 데이터 정합성, 레이블, 신뢰도
- 데이터 분석 결과 활용(Output)
3. 데이터 해석능력
내가 가지고 있는역량
막상 서술하다보니 어려운 부분이네요.. 크게 정리해봤습니다.
1. 보고서 작성
데이터 분석에 대한 전체적 프로세스로 문제설정 > 데이터 수집 > 분석 및 시각화 > 보고서의 과정으로 진행된다고 말해진다. 어렸을 때부터 OA(Office Automation) 를 손에서 놓지 않았기 때문에, 남들보다 강점이라고 생각한다. 특히 한글(Hwp)의 경우 보고서 작성에 한해서는 자부심이 있다. 하지만 이 또한 국내에서만 해당될 뿐, 당장 사기업으로 범위를 확장하면 강점이라고 보기 힘들어 최근 다른 프로그램(Word, Markdown 등)을 익히려 노력 중이다.
2. 정보수집능력
어떠한 문제를 진행하기 이전에, 왜? Why? 라는 것에 대해 중요하다고 지금까지 이야기 해주셨다. 타 전공에 어떤 Method를 적용시켰는지에 대한 논리적인 근거를 제시하기 위해, 이에 대해 사전적 지식 습득이 필요하였다. 처음에는 정보검색에 대해 어려움이 있었으나, 점차 필요한 부분에 대해서, 핵심만 간추려서 검색하는 방법을 알게 되었고, 논리적으로 내세울 수 있다고 본다.
내가 키워야하는 역량
1. 코딩(Coding)
- 프로그래밍 언어(Python, R, SQL 등)의 사용능력의 거의 전무하다시피 하여, 생각한 것에 비해 코딩으로 실현하는 것이 거의 불가능하였다. 이번 스쿨을 통해 가장 가지고 싶고 발전시키고 싶은 개인역량이다.
- Machine Learning, Deep Learning의 개념은 어느정도 이해하지만, 이를 적용하고 분석하는 능력이 부족하다. 분석 이전에 구현하는 것을 목표로 한다.
2. 통계적 지식
- 통계적이라고 했지만, 전반적으로 수학적 지식에 대해 알아야 할 필요가 있다. 왜? 라는 표현이 더 맞는 듯 하다.
- 예를 들어 Activation Function으로 Relu, Selu, hyperbolic function 중 무엇을 쓸 것인가? 라고 물어본다면, 두 function이 어떻게 구성되는지는 이해하지만, 왜 function을 선택하였는가? 질문을 들으면 항상 설명을 머뭇거린다. 근본적으로 더 파악하고, 더 논리적으로 전달할 수 있도록 노력할 것이다.
3. 그 외(Etc..)
- 지금처럼 Markdown을 사용하는 방법이 익숙치 않아 표현이 어렵다. 평소 정리하던 방법과 다르게 서술이 되다 보니 난잡한 감이 느껴져, 많이 다루는 연습을 해야할 듯 하다.