데이터 분석 문제 정의는 데이터 분석의 첫 단계로, 해결하고자 하는 문제나 목적을 정의하는 과정입니다
아래의 체크리스트(Checklist)로 더욱 좋은 데이터 분석 문제를 정의할 수 있습니다.
[ ] WHO 누가 문제를 제기하였나요?
[ ] WHAT 무엇이 문제인가요?
[ ] WHEN 언제 문제가 발생하였나요?
[ ] WHERE 어디에서 문제가 발생하였나요?
[ ] WHY 왜 이 문제를 해결해야 하나요?
[ ] HOW 어떻게 문제를 해결할 것인가요?
[ ] 문제의 핵심 요구 사항(Requirement)을 2-3줄로 요약(Summary)할수 있나요?
[ ] 문제를 해결하였을 때의 혜택(Benefit)은 무엇인가요?
[ ] 해결했을 때 어떤 결과들(In-scope)이 발생하나요?
[ ] 해결되지 않는 결과들(Out of Scope)은 어떤 것인가요?
[ ] Subject Matter Expert (SME) 주제 전문가
[ ] Stakeholder 문제 관련자
[ ] Client 고객
[ ] 매우 급함
[ ] 약간 급함
[ ] 급하지 않음
[ ] 분류 (Classification) - 주어진 데이터를 미리 정의된 카테고리로 분할하는 데이터 분석 방법입니다.
[ ] 예측 (Prediction) - 주어진 데이터와 과거 패턴을 기반으로 미래의 결과나 동향을 예측하는 데이터 분석 방법입니다.
[ ] 추천 (Recommendation) - 추천은 사용자의 과거 행동과 선호도를 기반으로, 해당 사용자에게 관련된 아이템이나 서비스를 제안하는 데이터 분석 방법입니다.
[ ] 이상치 발견 (Identification) - 이상치 발견은 데이터 분석에서 주어진 데이터 집합에서 통계적으로 특이한 값을 찾아내는 과정입니다.
[ ] 그룹화 (Segmentation) - 주어진 데이터를 특정 기준에 따라 그룹으로 나누는 데이터 분석 방법입니다.
[ ] 기타 (Etc)
[ ] 분석을 위한 타겟 변수(Target Variable)가 명확한가요?
[ ] 분석을 위한 핵심 지표(Metrics)를 설정할 수 있나요?
[ ] 검증하고자 하는 가설(Hypothesis)은 무엇인가요?