1. 데이터 분석(Data analysis) 이란?
- 비즈니스에서 의사 결정 또는 목표 달성을 돕기 위하여 인사이트를 도출하는 과정이다.
- 데이터에서 얻은 인사이트는 차트, 그래프 또는 대시보드와 같이 시각적인 형태로 표현된다.
- 데이터 분석의 핵심은 트렌드를 식별하고 예측하며, 수집 가능한 모든 데이터로부터 패턴과 상관관계를 파악하여 복잡한 문제에 대한 해결책을 찾는 것이다.
2. 데이터 분석이 중요한 이유
- 효율적인 의사 결정
: 주관적인 판단이나 직관 보다는 실제 데이터에 기반하기 때문에 시장의 상황과 고객이 원하는 바에 대하여 효율적이고 전략적으로 대응하는 판단을 가능하게 한다.
- 고객 이해와 개인화된 서비스 제공
: 제품 및 서비스에 대한 구매 기록이나 선호도를 분석하여 잠재고객에 대하여 이해하고 더 나은 제품 및 서비스를 제공할 수 있게 한다.
- 비용 절감과 효율성 향상
: 비즈니스 프로세스를 분석하고 최적화하여 비용 절감과 효율성을 향상시킬 수 있다.
- 위험 관리
: 잠재적인 약점과 개선 영역을 발견하고 이를 통해 위험을 예방하고 불확실성을 줄일 수 있다.
3. 데이터 분석 과정(Data analysis process)
- 데이터 활용 목표 설정(Data requirements)
: 이 단계에서는 데이터 분석을 수행하는 목적에 대하여 생각하고 파악하는 것이 중요하다.
예) 해결하려는 문제는 무잇인가?
데이터 분석의 목적은 무엇인가?
이를 통해 하고자 하는것은 무엇인가?
무엇을 달성하고 싶은가?
최종 목표는 무엇인가?
- 데이터 수집(Data collection)
: 이 단계에서는 어떤 데이터를 수집해야 할지 수집되는 데이터의 유형은 무엇인지 명확히 하는 것이 중요하다.
예) 상품 구매 이력
고객 리뷰와 피드백
이메일 오픈 여부
검색 키워드
- 데이터 처리(Data processing)
: 이 단계에서는 분석에서 정확한 결과를 얻을 수 있도록 데이터를 변환하고 구성한다.
- 데이터 정제(Data cleaning)
: 이 단계에서는 수집된 raw data의 오류를 수정하고 중복된 데이터는 제거하며, 필요하지 않는 데이터를 제거하는 등 데이터를 가다듬고 정렬해야 한다.
예) 이상치 찾기
오타 수정
데이터 오류 제거
중복 데이터 제거
결측치 확인
- 데이터 분석(Data analysis)
: 이 단계에서는 제일 첫 단계인 '데이터 활용 목표 설정'에서 정의했던 질문과 목표에 따라 데이터를 분석한다.
- 수집된 데이터를 요약하기
- 문제가 되는 상황을 파악하고 데이터의 패턴 찾기
- 데이터의 패턴으로 예측하기
- 예측한 상황에 대한 대비책과 계획 수립하기
- 결과 도출(Presenting the Data)
: 이 단계에서는 일반적으로 데이터 시각화 도구를 사용하여 보고서, 차트, 그래프, 대화형 대시보드를 생성한다.
4. 활용 사례
- 넷플릭스(Netflix)
: 사용자가 취하는 모든 행동을 지속적으로 모니터링하고 수집하여 데이터를 전체 혹은 개별적으로 가져와서 특정 사용자들이 어떻게 콘텐츠를 소비하는지에 대한 프로파일링한다.
(수집하는 데이터)
- 일시 중지, 되감기, 빨리 감기
- 콘텐츠 시청 요일
- 시청일
- 콘텐츠 시청 시간
- 시청하는 지역 위치
- 시청할 때 사용하는 디바이스 등
[Reference]
https://en.wikipedia.org/wiki/Data_analysis
https://elice.io/ko/newsroom/data_analysis
https://yozm.wishket.com/magazine/detail/1567/
https://www.geeksforgeeks.org/six-steps-of-data-analysis-process/
https://www.openads.co.kr/content/contentDetail?contsId=5547