데이터분석과 관련된 다양한 책을 읽어나갑니다. 이번에는 책 <그로스해킹>을 완독하고 난 후, 느낀 감상과 기억하고 싶은 점을 정리했습니다.
책 정보 : <그로스해킹> 2021 | 양승화 | 위키북스
그로스 해킹이란? 크로스펑셔널한 직군의 멤버들이 모여서 / 핵심지표를 중심으로 / 실험을 통해 배움을 얻고, 이를 빠르게 반복하면서 / 제품이나 서비스를 성장시키는 것
제품을 사용하는 과정에 대한 사용자 행동 로그를 잘 기록하고 있다면 사용자들이 어떤 시나리오에서 어떻게 행동하는지를 이해하는 데 큰 도움이 된다. 제품의 사용 맥락을 이해하기 위해 사용자 행동 데이터를 수집하는 것은 선택이 아니라 필수다.
중요한 건 서비스의 특성에 따라 카테고리별로 어떤 지표를 봐야 할지를 선정하는 과정, 그리고 지표를 개선하기 위해 어떤 실험을 어떤 우선순위에 따라 진행할지 결정하고 실행할 것인가다.
AARRR을 활용하는 방법 : 각 단계별로 풀어야 하는 문제를 확인한다. / 각 단계의 핵심이 되는 주요 지표를 선정하고, 해당 지표의 현재 수준을 측정한다. / 측정된 지표가 가지는 의미를 이해한다. / 개선해야 하는 목표 수준을 정하고, 실험을 통해 단계적으로 개선한다.
특히 스타트업이라면 단순히 많은 채널을 찾으려고 하기보다는 영향력있는 소수의 채널을 찾아서 해당 채널의 효과를 극대화하는 것을 목표로 삼는 편이 훨씬 바람직하다.
퍼널 분석을 진행할 때는 다음과 같은 세가지 요소를 고려해야 한다. 핵심 가치를 경험하는 시점과 그곳으로 연결되는 각 단계를 잘 정의했는가? / 각 단계별 전환율을 어떤 기준으로 측정하는가? / 코호트에 따른 퍼널별 전환율을 보고 있는가?
공통적인 특성에 따라 여러 집단으로 분류한 사용자 그룹을 코호트(Cohort)라고 한다.
코호트별로 전환율을 쪼개서 살펴보면 각 퍼널에 영향을 미치는 선행지표를 발견하기 쉬워진다.
전환에 영향을 주고 있는 코호트를 발견할 수 있다면 전환율을 높이기 위한 구체적인 액션을 하기가 훨씬 수월해진다.
퍼널 분석과 마찬가지로 리텐션을 분석할 떄도 코호트에 따른 차이를 확인하고 그 원인이 되는 요소를 규명하는 것이 대단히 중요하다.
일반적으로 높은 리텐션을 유지하는 방법 중 하나는 서비스를 통해 '축적되는' 가치를 만들고 이를 사용자에게 지속적으로 전달하는 것이다.
좋은 지표가 가져야 할 조건 중 하나는 그 지표를 바탕으로 행동할 수 있어야 한다(actionable)는 것이다. 지표가 주는 정보를 기반으로 다음 행동을 계획할 수 있고, 계획에 따라 실험을 진행한 이후에 그 결과를 돌아보며 배움을 얻을 수 있다면 굉장히 의미 있는 지표라고 할 수 있다.
데이터를 분석하기에 앞서 꼭 체크해야 하는 점은 '수집된 데이터가 분석하려는 목적에 적합한가?'다.
많은 사람들이 데이터 분석 스킬셋을 열심히 공부하지만 막상 현업에서 데이터 분석을 하면서 겪는 어려움의 상당 부분은 데이터 수집과 전처리에서 온다. 분석 목표에 맞는 데이터를 신중하게 수집하고 가공하는 단계가 잘 진행되지 않으면 그다음에 진행하는 어떤 고도환된 알고리즘이나 분석 방법도 의미가 없다는 점을 반드시 기억하자.
지표를 잘 활용하기 위해 가장 우선적으로 고려해야 하는 것은 '지금 가장 중요한 지표가 무엇인가?'라는 질문에 답하는 것이다.
데이터 분석가나 개발자뿐 아니라 다양한 직군의 실무자들이 데이터에 손쉽게 접근하고, 이를 통해 인사이트를 얻을 수 있는 환경을 만들려면 적절한 시각화를 통해 지표를 한눈에 볼 수 있도록 대시보드를 만들고, 필요한 경우 로 데이터를 쉽게 확인할 수 있는 시스템을 구축해야 한다.
행동 로그를 어떻게 설계하느냐에 따라 얻을 수 있는 정보의 수준은 완전히 달라진다. 행동 로그 설계의 핵심은 이벤트의 속성(property)을 어떤 수준으로 함께 남길 것인가를 정의하는 부분이다. 이벤트 속성은 특정 이벤트가 발생했을 때 함께 남길 수 있는 세부정보라고 생각하면 된다.
데이터 분석은 '좋은 질문'에서 시작하는데, 일반적으로 좋은 질문을 할 수 있는 사람은 서비스와 사용자의 접점에서 일하면서 도메인 지식을 쌓아 온 사람이다.
A/B 테스트 설계의 성패는 실험 집단과 통제 집단을 적절하게 나누고 통제 변수 관리를 얼마나 잘 했느냐에 달려 있다.
경영진의 의지는 말이 아니라 투자하는 리소스로 증명된다.
분석만 잘하는 데이터 분석가들만으로는 비즈니스의 중요한 문제를 풀 수 없다. 다음 질문에 대해 고민하고 답을 찾아보면서 담당하는 서비스 도메인에 대해 깊이 있게 이해하고 있어야 한다.
술술 쉽게 재밌게 읽기보다는 '와, 진짜 중요한 정보가 많은 책이다. 정독하자'라는 생각으로 신중히 읽었다. 데이터 분석가가 되기 위해 나와 같은 취준생이 집중하는 일은 '스킬셋 높이기'이다. SQL, 파이썬, 타블로와 같이 데이터 분석가가 주로 쓰는 기술 실력을 높이는 데 대부분의 에너지를 쓴다. 이 책을 다 읽고나서 든 생각은 정말 일 잘하는 데이터 분석가는 그러한 스킬셋은 기본으로 갖춰야 하는 것이고, 그에 더해 담당하는 서비스 도메인에 대해 깊이 있는 이해가 있어야 한다는 것이었다. 데이터 분석가에게 도메인 지식이 중요하다는 이야기가 이해가 되는 맥락이었다.
책을 읽다보니, 지표가 정말로 다양했다. '이렇게 많은 지표를 언제 다 이해하고, 언제 다 분석하지?'라는 걱정이 들기도 했다. 저자는 그에 대한 답을 정확히 내려주고 있었다. 지표를 잘 활용하기 위해서 '지금 가장 중요한 지표가 무엇인가?'라는 질문에 답을 내릴 수 있어야 한다고 말한다. 즉, 지표를 잘 활용하기 위해서 모든 지표를 다 확인할 필요는 없으며, 현 상황에서 비즈니스 문제의 해결을 위해 가장 필요한 지표가 무엇인지 선별하는 작업이 반드시 필요하다고 말한다.
좋은 지표란 그 지표를 바탕으로 행동할 수 있는 지표라고 쓴 대목이 특히 기억에 남는다. 지표가 주는 정보를 기반으로 다음 행동을 계획할 수 있고, 계획에 따라 실험을 진행한 이후에 그 결과를 돌아보며 배움을 얻을 수 있는 지표가 좋은 지표라고 저자는 명확하게 밝혔다.
이 대목을 읽으면서, '아, 이런 사수 밑에서 일하면 정말 정확하게 배우고 빠르게 성장할 수 있겠구나'하는 생각이 들었다. 이렇게 알찬 책을 쓰기까지 저자가 얼마나 진지하고 성실하게 데이터 분석에 대해 공부하고 연구했을지 그 진지함이 피부로 느껴지는 책이었다.
이 책은 한번 읽고 책장에 꽂아둘 책은 아니다. 데이터 분석가로 취업하면, 업무용 책상에 항상 꽂아두고 필요한 때마다 참고해야 할 책이라고 생각한다. 데이터 분석가가 단순히 SQL로 데이터 테이블 추출하고 대시보드 만드는 일이라고 어림잡아 생각했었는데, 데이터 분석 관련 책들을 볼수록 일을 제대로 하려면 정말 많은 고민과 공부 그리고 진지한 태도가 필요한 직업이라는 걸 깨닫는다.