책 《데이터 읽기의 기술》 읽기

tolerance·2020년 8월 18일
1
post-thumbnail

학습력을 높이는 방식으로 책 데이터 읽기의 기술을 일부 읽어보았다. 추후 더 읽고 보완할 수 있다.

책을 통해 새롭게 알고싶은 내용

  1. 데이터 분석가는 비즈니스(조직)에서 누적되는 데이터를 어떻게 바라보는지
  2. 어떻게 비즈니스에서의 문제를 설정하는지, 문제 설정은 누구의 몫인지
  3. 어떻게, 어떤 것을 근거로 가설을 세우는지. 그때의 기반 지식이 무엇인지
  4. 테이터 분석이 비즈니스와 쫀쫀하게 연결되기 위해 조직은 어떤 준비가 되어 있어야 하는지(하드/소프트)

인상적인 부분(아하 포인트)

우리는 소비자에 대해 아주 파편화된 부분밖에 알 수 없다. 기업에서 수집하는 데이터는 소비자의 아주 작은 부분들을 알아차릴 수 있는 단서가 된다. 이 단서를 데이터의 목적에 맞게 재배치하고 분석하면, 조금이나마 소비자를 이해할 수 있게 된다 (p. 14)

패시브 데이터가 아닌 액티브 데이터가 모이는 시대가 된 지 얼마 되지 않았다. 이런 빅데이터를 다양한 분석에 활용할 수 있다는 것은 이 시대가 주는 하나의 선물이라고 생각한다. 데이터 분석가들이 무궁무진한 분석 재료를 가질 수 있게 된 것이다. (p. 37)

소비자에 대한 이해는 교묘한 상술과는 다르다. 상술은 소비자를 속여 더 많은 이윤을 얻고자 하는 쪽에 가깝다. 그러나 소비자를 진심으로 이해하고자 하면, 제품과 서비스에 소비자의 니즈가 담긴 인사이트를 반영하게 되고, 자연스럽게 소비자는 그 브랜드를 좋아하게 된다. (p. 37)

테이크아웃의 비율은 현재 그 자체가 중요하다기보다는, 과거보다 얼마나 많이, 어떤 지역이 다른 지역보다 더 많이 테이크아웃을 하는지가 더 중요하다. 따라서 데이터를 아는 것보다 데이터를 지속적으로 쌓는 것이 더 중요한 경우도 있다. (p. 194)

그 명제에 대해 아주 구체적으로 답변할 수 있다는 것, 데이터로 증명을 한 것과 아닌 것의 차이다. 가을보다, 전년보다, 지금 이 시즌에 어떤 빵이 얼마나 더 팔리는지, 아침에 많이 팔리는지, 저녁에 많이 팔리는지, 주말에 많이 팔리는지 숫자를 가지고 있는 조직과 가지지 못한 조직은 다르다. (p. 195)

조직 특성상 결국엔 임원들이 의사 결정을 내리게 되는 일이 많은데, 임원이 데이터에 대한 이해가 낮다면 점점 실무자들이 데이터에 소홀해질 수밖에 없다. 데이터 프로젝트들이 무산될 수도 있고, 성과 없는 프로젝트들이 반복될 수도 있다. (p. 196)

프로젝트 시작 시점 전후, 주제를 선정하기 위해 관련 주제에 대해 구할 수 있는 책과 자료를 대략적으로라도 훑어보는 것을 권한다. 주제를 선정한 뒤 연구 문제를 만들고, 검증할 명제를 만드는 작은 분석 목표가 생길 것이다. 낱개의 데이터를 모아 분석하고, 분석을 통해 명제와 주제를 검증해갈 수 있게 된다. (p. 205)

프로젝트가 흘러가는 과정: (p. 205)
목적 - 프로젝트 - 주제 - 연구문제 - 인사이트 - 모델링 - 전처리 - 데이터

소비자의 문제 행동이 나타나는 원인은 매장 곳곳에 숨어 있다. 제품이 문제인지, 매장 진열이나 디자인이 문제인지, 마케팅 전략이 문제인지, 매장 점원들의 판매 방식의 문제인지 잘게 쪼개볼 줄 알아야 한다. 소비자는 결국 이 모든 것을 뭉뚱그린 '브랜드'로 인식하기 때문이다. (p. 211-212)

그러나 조직, 특히 기업에서는 이미 정해져서 내려오는 톱다운 방식으로 분석 주제를 받는 경우가 많다. 구체적으로 분석하는 방법이나 명제에 대한 아이디어를 얻는 것은 아니다. 그러나 분석의 주제와 키워드는 확실히 톱다운 방식으로 자주 결정된다. (p. 224)

몇 가지 구체적인 상황을 가정한 연구 문제일 때 좀 더 풍성한 답을 얻을 수 있다. 분석을 위한 몇 가지 변수를 정리해놓고, 가능한 경우의 수를 하나씩 제거하는 것이다. 자신의 가설만을 주장하는 사람들에게 다른 가능성을 보여주기 위한 방법이기도 하다. (p. 232)

기억하고 싶은 내용을 내 언어로 정리하기

  1. 같은 지역의 세 매장 중 한 매장에서만 매출이 낮아지는 경우, 이유 파악해보기
  • 주변 공사 등으로 해당 매장쪽 길로 유독 사람들이 적게 오게 되었을 수 있음 아니면
  • 해당 매장이 잘 안보였을 수도 있음. 간판이나 홍보문구가 잘 안 보였거나 아니면
  • 왔다가 구경만 하고 나간 사람이 많을 수도 있음. 매장 경험이 뭔가 좋지 않았다거나
  1. 데이터는 일단 잘 쌓아두어야 한다. 그러기 위해 정기적인 조직 내 데이터 수집에 관한 점검이나 계획이 필요한 것 같다. (예를 들어 에이전시 같은 곳에서도 프로젝트별 고객평가를 받을 수도 있지만, 연 2회 정도의 이미지 조사 같은 걸 고객군을 대상으로 시행할 수 있다.)
  2. 책과 별개로 생각난 것인데, MZ 세대(나보다 어린..), 10-20대는 인스타그램에 맞춤 광고가 나오면, 정보를 침해받았다고 느끼기보다는 오히려 내게 필요한 정보를 줘서 편리하다고 느낀다고 들었다. 나도 비건식품의 경우는 조금 그렇게 느끼기도 했다. (비건 빵류 찾아봄 -> 인스타에서 템페 칩 추천, 강화 / 관련하여 p. 121에도 언급) 이렇게 주구매 소비자 세대가 비즈니스 데이터 활용에 대해 우호적이라면 데이터 기반의 마케팅이 더더욱 주류가 될 것이라고 본다.

알고싶었던 내용에 대해 대답해보기

  1. 데이터 분석가는 비즈니스(조직)에서 누적되는 데이터를 어떻게 바라보는지
    : 과거에 비해 분석할 수 있는 데이터가 많아져서 기뻐하면서 본다(?).

  2. 어떻게 비즈니스에서의 문제를 설정하는지, 문제 설정은 누구의 몫인지
    : 현실적으로 대부분 대표님, 경영진 등으로부터 탑다운으로 내려온다. 그 이후 분석 방식은 분석가가 정한다. 간혹 바텀업 방식으로 하는 경우 지지기반이 약한 것 같다.

  3. 어떻게, 어떤 것을 근거로 가설을 세우는지. 그때의 기반 지식이 무엇인지
    : 이 부분은 책에서 알기가 어려웠다. 린 분석(Lean Analytics)와 같은 책으로 보완할 수 있을 것 같다.

  4. 테이터 분석이 비즈니스와 쫀쫀하게 연결되기 위해 조직은 어떤 준비가 되어 있어야 하는지(하드/소프트)
    : 데이터의 분류 체계(세세한 분류와 자세한 태그)를 잘 잡아두면 분석에 날개를 달아주는 것과 같다.

profile
매일. 나. 배운다. 조금씩

0개의 댓글