책을 읽고 기존에 내가 진행했던 데이터 분석 프로젝트들을 생각해보았다.
대부분의 과정들은 이렇게 진행하지 않았던가 싶다.
이러한 과정이 제대로 데이터 분석을 진행했다고 말할 수 있을까? 책의 저자는 위와 같은 데이터 분석 프로세스는 좋은 데이터 분석이 될 수 없다고 한다.
위의 과정은 데이터 분석을 통한 결론을 이끌어 내는 것이 아니라. 그저 데이터 분석 결과를 만들어 낼 뿐이게 된다. 이 과정은 특정한 문제를 해결 하기 위하여 데이터 분석을 진행하는 것이 아니라, 데이터를 분석하는 것이 목적이 되어 버린다. 즉 데이터가 수단이 아닌 목적이 되어 버리는 일이 발생한다.
이를 위해서 우리는 데이터 문해력 을 기를 필요가 있다. 책의 저자는 데이터 문해력이란 데이터를 수단으로 합리적으로 논할 수 있는 능력이라고 정의한다. 인간이 가질 수 있는 강점인 논리적 사고를 기반으로 정답에 대해 고민하고 이를 해결해 나아가는 과정이 중요하다고 한다. 또한 이 과정속에서 단순히 '정답을 찾으러 가는 작업자'로 전락하지 않도록 주의하라고 한다.
데이터에는 답이 없을 수도 있다. 모든 데이터에 정답이 있다고 생각해서는 안되며, 정답이 1개만 있다고 생각해서도 안된다. 항상 데이터를 중심으로 생각하지 않고, 데이터에 의존하지 않는 사고방식과 목적 중심의 사고가 중심이 되어야 한다.
데이터 분석의 절차는 "데이터" -> "가설" 이 아닌 "가설" -> "데이터" 의 과정으로 흘러가야 한다. 데이터 분석은 자신이 수립한 가설을 객관적, 논리적으로 검증하기 위한 것이다. 이 과정이 반대가 될 경우에는 "결론과 관련 없는 결과", "필요에 따라 가설 재정립" 등 여러 문제가 발생할 수 있다.
모델, 통계적인 지식이 뛰어나다고 뛰어난 분석을 잘할 수 있는 것은 아니다. 문제를 해결하기 위해서 갇힌 사고가 아닌, 열린 사고로 접근을 할 수 있어야 한다. 문제를 넓게 바라볼 수 있어야 한다. 끊임없이 가설을 세워보고 증명해 나아갈 수 있어야 한다. 데이터 분석에 있어서 "정답"이라는 것이 명확하게 존재하지 않는다. 그저, 내 스스로 정답을 만들어내고 이를 논할 수 있는 역량을 계속 키우는 것이 데이터 분석의 실력을 늘릴 수 있는 방법이 될 것이다.
책의 목차만 확인해도 많은 깨달음을 얻을 수 있다.
(1) 분석 전에 문제 및 목적을 정의하고 가설을 구축 -> (2) 분석을 위한 기술과 지식 -> (3) 분석 결과에 대한 해석 및 스토리 구축.
많은 사람들이 (2)번 과정에 집착을 한다. 하지만 (2)번은 (1)번의 과정을 거쳐야만 효력이 생길 수 있다. (2)만을 활용하여 만든 결과물은 어디까지나 계산과 분석의 '결과'에 지나지 않는다. 이는 다른 사람에게 전달했을 때 이해를 받고 동의를 얻기 어렵다. (p20~p21)
단순히 기술 공부를 하는 것이 아니라 '내가 무엇을 알고 싶은가?', '이를 통해 무엇을 하고 싶은가?', '이를 위해 어떠한 데이터(지표)가 필요한가" 끊임없이 고민해야 한다.
'데이터'를 보고 문제를 파악하는 과정이 아니라, '문제'를 해결하기 위해 내가 필요한 데이터가 무엇인가? 하는 접근법이 좋다. 이와 마찬가지로 '데이터'에서 무엇을 알 수 있을지 생각하고 데이터를 가공하는 방식으로 진행되어야 한다.
'목적과 문제' -> '목적과 문제에 따라 데이터 수집 및 방법론 구축' -> '목적과 문제에 대한 결론'
더욱 자세한 과정으로는
A : (겉으로 드러난 현상)
B (목적/문제정의) : 목적 및 문제를 정의
C (목적/문제정의) : 지표를 결정
D (현상파악/평가) : 현재 상태를 파악
E (현상파악/평가) : 평가
F (요인) : 요인을 분석
G (방법) : 해결 방안을 모색
데이터 활용의 예시
B2B 기업들은 '고객 만족도 향상' 을 목표로 정하고는 한다. 그런데 '고객 만족도 향상' 은 최종 목적이 되기가 어렵고, '실현 수단'이 되는 것이 좋다. 이에 대한 최종 목적은 '수주 금액 증가'가 될 수 있을 것이다. 이를 위하여 '고객 만족도 향상' 을 수단으로 잡고, 이에 대한 결과를 확인하여야 한다. 고객 만족도가 개선이 되었을 때 매출이나 고객 방문 등에 어떤 영향이 있을지 조사해서 고객 만족도 향상에 대한 목적을 명확히 하는 것이 '데이터 활용'의 첫 시작이 될 수 있다.
항상 이러한 생각을 갖고자 노력해도 놓치는 부분이 생기기 마련이다. 특히나 일을 한지 얼마 되지 않았기 때문에, 일에서 직접적인 연관성(공감?)을 느껴보지는 못해서 머릿속에서 조금 더 빨리 사라지지 않을까?
일을 하면서 다양한 프로젝트를 진행하게 될 것이다. 모든 프로젝트마다 다시 이 책을 확인하며 체크해볼 수는 없겠지만, 한 달에 한 번은 확인하며 프로젝트를 피드백하고 성장의 시간을 다짐한다면 좋겠다.