생각보다 많은 분석가들이 개념적인 확실한 이해 없이 코드만 붙여 업무를 하는 것을 봤다.
특히 기존 다른 영역의 업무 진행 후 데이터 분석가로 전향한 이들은 비즈니스적인 이해도는 높지만 전체적인 데이터 분석 프로세스를 올바르게 구성하는 것에 많은 어려움을 겪는다.
머신러닝은 데이터를 제대로 이해한 다음에 가공 및 전처리해야만 의미가 있다.
효과적인 결정을 할 수 있도록 도움을 주는 것이 데이터 분석의 주된 목적임에도 머신러닝 모델에만 매몰되어 방향을 잡지 못하는 것이다.
이제부터는 1) 비즈니스 문제를 정의하는 단계부터 2) 데이터 준비, 3) 모델링 및 평가, 4) 스토리텔링까지, 데이터 분석가라면 반드시 알아야 할 모든 내용을 다룬다.
출처 : 데이터 분석가가 반드시 알아야 할 모든 것, 위키북스 2023