데이터 문해력을 읽고

hi_life·2023년 5월 1일
0

우리는 데이터로 무엇을 하려고 하는가? 데이터 분석에는 항상 정답이 있을까?

내가 데이터 분석 관련 프로젝트를 진행할 때마다 여러 번 스스로 던졌던 질문이다. 최근에 데이터의 중요성이 대두되면서 데이터 사이언스 커리큘럼을 제공하는 학원들이 우후죽순 등장하고, 나 또한 그런 학원에서 데이터 사이언스 강의를 수강하게 되었다. 그러한 학원에서는 통계 지식이나 머신러닝 이론 등 데이터 관련 지식을 중점적으로 가르치기에, 분석가로서 데이터를 가지고 무엇을 하려고 하는지, 어떻게 데이터를 활용해야 할지 등에 대해서는 스스로 고민하며 찾아 나가야 한다. 그래서 나는 책을 읽으며 스스로 해답을 찾아보기로 하였다.

데이터분석가로 처음 업무를 하면서 처음으로 읽게 된 책이 '데이터 문해력'이다. 이 책은 데이터 분석 기술에 관한 서적이라기보다는, 본질적이고 가치 있는 데이터 활용 방식에 대해 기술한다. 책 내용은 총 8개의 챕터로 구성되어 있고 어렵지도 길지도 않아서 쉽게 술술 읽혔지만, 책을 읽으며 그동안 분석가로서 고민하던 것들에 대해 생각하느라 두 번을 더 읽어서 시간이 오래 걸렸다. 책을 읽으며 내가 분석 업무를 하면서 고민하던 것들이 조금은 해결된 느낌이었다.

오늘은 데이터 분석을 시작하는 분들께 추천하고 싶은 서적 "데이터 문해력"을 읽은 후 느꼈던 점을 질문과 대답 형식으로 적어보려고 한다.

1. 우리는 왜 데이터 분석을 하는가?

데이터 분석이 왜 필요한 것인지, 나는 왜 데이터 분석을 하는지 다시 생각해보게 되었다. 우리는 비즈니스에서 다양한 문제를 마주하고 해결해야 하는 상황을 자주 겪는다. 문제를 해결하기 위한 도구로 데이터 분석이 필요한 것이고, 이런 의미에서 데이터 분석은 목적을 달성하기 위한 도구에 지나지 않는다는 것을 항상 인지해야 한다.

우리의 최종 목표는 행동과 판단이라는 것을 항상 인지하고 있어야 한다. 결국, 우리가 하고자 하는 것은 데이터를 통해 문제 해결 방안을 수립하거나 행동 계획을 세우는 것이다. 분석 자체가 목적이 되어서는 안 되고, 어떠한 목적을 달성하기 위한 도구로써 활용해야 한다.

2. 데이터 분석을 잘한다는 것은 무엇일까?

데이터 분석가로서 데이터 분석을 잘한다는 것은 어떻게 정의할 수 있을까? 단순히 데이터를 분석하기 위한 통계 분석 방법론을 잘 알고 있는 사람일까? 아니면 데이터 툴을 잘 익히고 데이터 시각화를 잘하는 사람일까? 아니다. 데이터 분석을 잘하는 사람은 자신의 목적과 문제를 정의하고, 데이터를 적절히 활용해서 가치 있는 결과물을 낼 수 있도록 하는 사고방식과 기술을 가진 사람을 말한다. 데이터 분석 기술보다 문제 및 목적을 정의하고 가설을 구축하고 분석을 위한 기술을 활용해 분석 결과를 해석하고 스토리를 구축하는 일련의 데이터 활용 프로세스에 맞춰 데이터를 활용하는 사람을 데이터 분석을 잘한다고 말할 수 있다.

반대로 데이터 분석을 잘 못하는 사람, 즉 데이터 활용을 못하는 사람은 생각하고→작업하고→생각하는 과정에서 생각하는 과정을 간과하고 분석을 진행하는 사람이라고 말할 수 있다. 분석 전 문제 및 목적을 정의하고 가설을 구축하는 첫 번째 생각하는 단계, 그리고 데이터 분석 결과에 따른 해석을 추가해 결론을 내리게 되는 세 번째 생각하는 단계를 간과하면 데이터 활용을 못하는 사람이 될 수 있다. 우리는 이 생각하는 단계에 집중해야 한다.

3. 데이터 분석을 잘하기 위해서는 어떻게 해야 할까?

데이터 문해력에 뛰어난 사람이 되려면 목적을 올바르게 설정하고 그 목적에 따라 데이터를 활용해 결과를 결론으로까지 끌어낸다는 흐름을 익히고 잘 밟아가야 한다. 우리가 가장 먼저 추구해야 하는 것은 목적 중심이고, 내가 알고 싶은 것에 따라 데이터를 수집하고 그 결과를 검증하고 결론으로 연결하는 것이다. 목적 중심으로, 목적 및 문제 정의 -> 지표 결정- > 현재 상태 파악- > 평가 -> 요인 분석 -> 해결 방안 모색 이 데이터 활용 프로세스를 인지하고 이대로 따라야 한다.

가장 먼저 해야 하는 것은 목적과 문제에 대한 정의이다. 하지만 우리는 주어진 데이터로 현재 상태를 파악하는 것에서부터 시작하는 경우가 많다. 나는 무엇을 알고 싶은지, 무엇을 해결하고자 하는지 이 두 가지를 명확히 하는 것에서부터 시작해야 한다. 이 단계가 확실히 되어야 문제를 분석하기 위해 어떤 지표를 사용하면 좋을지 고민하고 지표를 결정하는 단계로 나아갈 수 있다.

4. 논리적인 사고란 무엇이고 논리적인 사고력을 어떻게 배양할 수 있을까?

데이터 분석가 채용 공고를 읽다 보면, 자격 요건에 논리적인 사고력이 기재되어 있는 것을 흔히 볼 수 있다. 하지만 논리적인 사고력이라는 것이 정확히 무엇일까? 나는 가끔 논리적인 사고력이라는 단어가 너무 모호하다고 생각했다. 하지만 이 책을 읽으면서 이 뜻이 조금은 명확해졌고, 논리적인 사고력을 어떻게 배양할 수 있을지 진지하게 고민해보게 되었다.

논리적인 사고란, 스토리를 탄탄히 구성하고 결론의 설득력을 높이기 위한 사고력과 구성력을 말한다. 우리는 이 논리적 사고와 문제 해결 능력을 배양하기 위해서는, 문제->원인->해결 방안이라는 세 단계로 구성된 프로세스를 염두에 두어야 한다. 많은 사람들이 문제 해결 프로세스에서 현재 상태를 파악하고 곧바로 해결 방안에 달려드는 실수를 범하는데, 이는 데이터 기반이라고 볼 수 없다. 따라서 해결 방안으로 뛰어들기 전에 원인을 분석하는 과정을 꼭 거쳐야 한다. 무엇을 해결하고자 하는지, 무엇이 결정적 요인인지를 확실히 한 이후 무엇을 해야 하는가라는 순서로 사고를 진행해야 한다.

또, 문제에 대한 범위나 분석 영역을 누락 없이 판별하기 위해서 논리적 사고가 필요하다. 여기서 말하는 논리적 사고란 문제를 구조화하고 정리하면서 생각하는 것을 말한다. 구조화해 정리하게 되면, 왜 이 데이터를 사용해서 분석했는가에 대한 질문에 대해 논리적인 설명이 가능하다.

5. 결과와 결론은 어떻게 다를까?

우리는 결과와 결론의 차이를 명확히 알아야 한다. 계산과 분석을 통해 나온 결과물은 결과이고, 그 결과가 목적에 대해 어떤 의미가 있는지 설명하는 것이 결론이다. 결론이란 결과를 기반으로 도출하기에 결과와 결론에 이르는 과정은 본질적으로 같지만 표현 방식은 다르다. 이 차이를 이해하는 것이 데이터 문해력에 있어서 중요한 요소이다. 결과로부터 결론을 도출할 때 자신의 정보 집약 능력에 더해 상상력이 필요하지만, 필요 이상으로 자신의 해석을 덧붙이지 않도록 주의해야 한다. 원칙적으로 데이터를 통해 알 수 있는 사실의 범위 내에서 생각해야 한다.

6. 내가 되돌아보게 되었던 것들

나는 이때까지 데이터 중심 사고를 하고 있었는지 아니면 목적 중심 사고를 하고 있었는지 많이 되돌아보게 되었다. 데이터 분석 전에 목적과 문제를 먼저 정의하는 것을 간과하고, 데이터를 보면 무언가 답이 있겠지라고 생각했던 적이 있었다. 또, 데이터 분석 업무를 할 때 데이터 정리로 끝낸 적도 있다. 내가 꼭 기억해야 하는 것은 데이터는 그 자체로는 의미가 없다는 것이다. 적절한 사고 과정을 밟으며 데이터 분석을 통해 어떠한 실행이 되어야 그것이 의미 있는 데이터 분석이라고 말할 수 있다. 내가 현재 배양해야 할 능력은 데이터 분석 기술이나 지식을 키우는 일이 아니라 적절한 사고 과정을 밟는 것이다.

책에서도 나오듯이, 업무를 할 때 우리의 사고 과정을 방해하는 것들이 있다. 대표적인 것이 시간의 부족이다. 목표에 도달하는 데 필요한 프로세스를 숙지하고 있더라도 이를 실현하려면 시간이 필요한데, 시간을 확보할 수 없는 환경 때문에 우리의 사고 과정이 방해를 받는다. 하지만 시간에 쫓겨 데이터 중심 사고를 하는 것보다는 시간을 더 들여서라도 목적 중심 사고를 기반으로 데이터를 사용하는 목적이 무엇이며, 데이터를 분석해 실현하고 싶은 것이 무엇이며, 어떤 행동으로 이어지게 하고 싶은가? 를 고민하는 과정을 거쳐야 하며, 명확하고 구체적인 목적을 협업하는 팀원들에게 공유하는 문화를 지향해야 한다.

profile
성장 일기

0개의 댓글