책 <데이터 문해력>을 읽고 - 3, 4장

르네·2023년 10월 13일
0

독서기록

목록 보기
5/7

책 제목

빅데이터 시대, 성과를 이끌어 내는 <데이터 문해력>

인상 깊었던 구절의 사진





책에 나온 지식 또는 사례를 실생활, 업무에서 직접 찾아본 경험

평가를 객관적으로 만드는 것은 바로 '다른 것과의 비교'입니다.

내집마련을 하기 위해 서울과 경기도 지역의 아파트를 찾아보았다. 처음에는 그냥 아는 동네 아파트 가격만 봤더니, 이 가격이 아파트 자체의 가치에 비해 비싼건지 싼건지 전혀 알 수 없었다. 부동산 강의를 들어보니, 강사가 부동산을 살 때는 '비교평가'를 통해 그 부동산의 가치를 비로소 평가할 수 있다고 했다. 그래서 나는 서울 강동구, 서울 송파구, 경기도 분당구의 아파트를 비교평가했다. 셋 다 비슷한 입지가치의 아파트였는데 어느 순간 서울 송파구의 아파트 가격이 급격하게 떨어졌다. 비슷한 입지가치의 부동산을 지역별로 비교평가하여 입지 대비 가격이 싼 아파트를 골라낼 수 있었다.

책에서 읽은 내용을 앞으로 실생활 또는 업무에 어떻게 적용할 수 있을지 고민해 본 내용

실무에서 '가치 있다'고 생각하는 정보는 다음 중 한 가지와 연결되어야 한다.

  • 구체적인 행동을 특정할 수 있다(누가 언제 무엇을 했는지)
  • 구체적인 판단을 내릴 재료가 된다.
    : 그냥 '데이터를 다루고 있다' 정도가 아니라 '데이터를 활용한다'까지 가려면 위의 둘 중 하나라도 만족해야 한다. 데이터를 통해 사용자의 행동을 특정하고 사용자를 분류할 수 있다거나, 데이터 분석을 통해 비즈니스 성장에 도움이 될 만한 action을 제안할 수 있어야 한다.

문제와 원인, 그 관련성 유무를 확인하는 방법

1단계 - 시각적으로 관련성을 확인한다
: '문제와 결과를 나타내는 지표'가 세로축, 가설로 수립한 '원인 후보 지표'를 가로축으로 하여 '산포도'를 작성합니다. 그러면, 세로축과 가로축의 관련성을 시각적으로 포착할 수 있습니다.
2단계 - 통계 지표를 확인한다 ~ 상관계수 ~
: 지표 데이터 조합이 많을 때는 일단 상관계수를 활용하여 분석을 수행하고 관련성이 있는 것처럼 보이는 조합을 먼저 들여다보는 것이 좋습니다. 다만, 데이터의 관련성을 모두 상관분석을 통해 파악 가능한 것은 아니므로 더 자세하게 관련성을 알아보고 싶을 때는 산포도를 통해 시각화하는 편이 무난합니다.

: 데이터 간 상관성을 분석하는 게 막연히 어렵게 느껴졌다. 책에서 분명하게 가이드라인을 제시해주어서, 데이터분석 프로젝트를 할 때, 이 가이드라인을 따라 하면 그리 어렵지 않겠다는 자신감이 들었다.

profile
데이터분석 공부로그

0개의 댓글