데이터 분석이란 무엇일까?

채은·2025년 11월 28일

원본링크

내용정리

학습목표
1. 왜 데이터 분석이 중요한지
2. 데이터 분석을 위해선 어떤 기술이 필요한지

데이터?

사실/정보의 집합
종류는 크게 두가지

  • 정성적 데이터: 숫자X. (이미지, 비디오, 오디오, 텍스트, ...). '무엇을','어떻게','왜'에 대한 답을 알려줌
  • 정량적 데이터: 숫자O. '얼마나'

.

데이터 분석?

원시데이터에서 유용한 인사이트를 도출하는 작업
이 인사이트를 차트나 대시보드 등으로 시각화하고 이게 기업이나 조직의 의사결정에 도움을 줌
핵심은...
트랜드를 식별하고 예측, 수집 가능한 모둔 데이터로부터 패턴과 상관관계를 파악
-> 결과적으론 복잡한 문제에 대한 해결책을 찾아내는 거

.

데이터 분석이 왜 중요?

타겟팅이 가능

데이터를 통해 경쟁업체, 소비자층, 시장의 트랜드 등을 분석할 수 있고, 이 결과가 좋은 전략을 세울 수 있게 만들어줌
-> 궁극적으론 비용&시간을 절감할 수 있게 해주고, 성과는 더 올릴 수 있음

성공/성과 측정

데이터 분석으로 기업 스스로를 평가할 수도 있음
경쟁사와 비교했을 때 얼마나 경쟁력이 있는지,
언제 성과가 제일 좋았는지,
어떤 부분이 부족한지,
이런 걸 분석하고 시각화해서 앞으로의 방향성을 정할 수 있음

.

데이터 분석 프로세스

1단계: 문제 인식

분석을 통해 얻고자 하는 목표가 있어야 함.
어떤 목적인지,
어떤 문제를 해결하려 하는지,
이 데이터 분석이 왜 필요한지,
분석을 통해 얻은 인사이트를 어디에 어떻게 활용할 건지,
등이 확립되어 있어야 함.

2단계: 데이터 수집

공개 데이터셋을 웹 스크래핑을 통해 수집하기
어떤 데이터를 수집해야하는지는 링크타고 들어가서 일어보기. 내용이 좀 많음!

3단계: 데이터 정제

내가 필요한 내용 다 모았는지, 빠뜨린 건 없는지 점검한 뒤
데이터의 구조를 먼저 이해해야함

수집한 데이터가 이쁘게 구조화가 안 되있을 수도 있는데, 이걸 한번 다듬는 시간이 필요함.
오타 수정, 데이터 정렬, 중복제거, 형식 통일 등등
그리고 일관성이 떨어지는 데이터/관련성이 없는 데이터/유용하지 않은 데이터 등은 제거해야함

이 과정이 데이터의 퀄리티를 높여줌.
사실상 이게 제일 중요해서 여기 소요되는 시간이 가장 길다~~

4단계: 데이터 분석

이제 진짜 분석함. 근데 이것도 4종류가 있음

기술적 분석 - 뭔일이고.
진단적 분석 - 왜그러는데. 문제의 원인을 찾아냄
예측 분석 - 내가 장담함. 성장에 중요한 인사이트 제공
처방적 분석 - 훈수. 앞의 세단계에서 얻은 인사이트 모아 실행가능한 계획 수립

내 목적과 방향성에 따라 적절하게 적용하기!

5단계: 결과 공유

분석한 내용 이쁘게 만들기 - 차트, 그래프, 보고서, 대시보드, ...
이 내용이 의사결정에 기반이 되기 때문에, 직관적이고 이해하기 쉽게 만들어야함
일종의 스토리텔링이 필요하다~

.

어떤 기술이 필요?

도움이 되는 아티클, 강의 링크들이 있으니 원문 타고 들어가서 한번 보기!

수학&통계

통계, 확률에 대해서 좀 잘 알아야 함.... 수업시간에 졸지말걸..

SQL과 관계형 DB

관계형 DB와 상호작용하며 데이터를 추출하는 법을 알아햐 함
SQL은 관계형 DB를 조회하고 상호작용하는데 사용되는 언어

프로그래밍 언어 지식

파이썬, R

시각화 툴에 대한 지식

Tableau
아까 말한 차트, 그래프, 보고서, 대시보드, ... 얘네를 이쁘게 만들 줄 알아야 함

마무리

  1. 왜 데이터 분석이 중요한지
    -> 데이터 분석을 통해 얻은 인사이트는 방향성을 제시해, 시간과 비용은 절감시켜주고 성과는 올려주기 때문에
  2. 데이터 분석을 위해선 어떤 기술이 필요한지
    -> 일단 데이터를 다루다 보니 통계적 지식이 필요하고,
    SQL, 파이썬, 시각화 툴을 능숙히 다룰 수 있어야 함. 또한 이 결과를 누군가에게 설명하고 방향성을 제시하기 때문에 커뮤니케이션 능력도 중요함

아티클의 분석 방법을 적용한 관련사례

의약품-> 유통기한이 있음
그래서 재고가 부족하면 --> 환자의 치료 기회 상실ㅠㅜ
과잉 재고 --> 폐기 비용 발생..!!
=> 그래서 수요 예측이 중요

한미사이언스의 사례
AI를 통해 날씨, 계절성, 질병 발생 패턴, 처방 트렌드 등 다양한 변수들 간의 상관관계를 분석하고 판매량 변동 원인 도출해냄(진단적 분석)
향후 6개월의 판매량을 80.1%의 정확도로 예측했고(예측분석)
생산량을 조정한 결과(처방적 분석) 재고 비용을 55.1% 절감하고, 품절율을 22.6% 감소시킬 수 있었음

참고자료
https://www.impactive-ai.com/clients/pharmaceutical-ai-case-study

profile
내일배움캠프 사전교육 수강중

0개의 댓글