통계 1: 기술통계와 추론통계

ヒヒヒ·2025년 9월 19일

통계

목록 보기
1/13
post-thumbnail

🧐 통계를 배우는 이유

  • 통계는 데이터를 이해하고 해석하는 핵심 도구임
  • 방대한 데이터를 요약해서 패턴을 발견할 수 있음
  • 일부 데이터를 통해 전체를 추론할 수 있음
  • 데이터를 기반으로 합리적인 의사결정을 할 수 있음

사례1) 유튜브

통계 활용: 시청 기록 분석을 통한 개인화된 영상 추천 알고리즘 개발
주요 효과: 개인 맞춤 콘텐츠 추천으로 사용자 경험 극대화 및 플랫폼 내 체류 시간 증가
성과: 광고 수익 증가, 다양한 크리에이터 유입 확대 등의 비즈니스 성장


사례2) 쿠팡

통계 활용: 배송 데이터 분석을 통한 최적화된 배송 루트로 배송 시간 단축 (로켓 배송 기여)
주요 효과: 빠른 배송으로 사용자 만족도 향상 및 플랫폼 내 구매 빈도 증가
성과: 더 많은 구매 유도 및 시장 경쟁 우위 확보

👉 통계는 직감 대신 근거 기반 의사결정의 시대를 여는 핵심 도구


📌 통계학 유형

1️⃣ 기술통계 (Descriptive Statistics)

정의

  • 수집한 데이터를 보기 좋게 요약하고 설명하는 통계 방법

특징

  • 데이터를 대표값으로 요약 (평균, 중앙값, 분산, 표준편차 등)
  • 데이터의 대략적인 특징을 쉽게 파악할 수 있음
  • 다만 요약은 전체 데이터의 특징만 보여주므로, 특이한 값(이상치)은 놓칠 수 있음
  • 많은 데이터를 표와 그래프로 변환해 쉽게 파악할 수 있음

예시
[스포티파이]
수많은 스트리밍 데이터를 분석하여 이용자별 및 세계 음악 트렌드 요약 (연말 결산 Wrapped)

출처: 스포티파이

[축구]
스페인 라리가 2022/23 시즌 선수들의 ‘28km/h 이상 속도로 뛴 누적 거리’

출처: LALIGA

2️⃣ 추론통계 (Inferential Statistics)

정의

  • 일부 데이터(표본)를 통해 전체 데이터(모집단) 혹은 미래에 대해 추측하는 통계 방법

특징

  • 현실적으로 모집단의 데이터 확보가 불가능하여 표본을 가지고 분석 수행
  • 전체를 확인하지 않고도 결과를 추측할 수 있음
  • 전체가 아닌 일부이기에 표본의 불확실성은 항상 존재
  • 추후 신뢰구간, 가설검정 등으로 활용
  • 가설을 세우고 가설이 맞는지 틀린지 통계적으로 검증
    • 표본은 모집단을 대표하기에 모집단의 특성을 그대로 가지고 있음
    • 표본은 모집단에서 랜덤으로 추출해야 왜곡이 비교적 덜 생김
    • 두 집단간에 차이가 발생하면 안됨(단, 두 집단이 100% 일치하지 않기에 약간의 차이가 있을 수는 있음)

예시
[선거 출구조사]
전체 개표 전, 일부 유권자 표본을 활용한 당락 예측

출처: Polymarket

[임상시험]
신약의 효과를 검증하기 위해 일부 표본을 대상으로 연구 진행

출처: 충남대학교병원

📌 기술 vs 추론 비교

구분기술통계추론통계
핵심이미 있는 데이터를 요약일부 데이터로 전체 추정
예시스포티파이 Wrapped, 축구 누적 뛴 거리여론조사, 임상시험
정리“요약해서 보여주기”“일어날 일을 예측하기”

📌 퀴즈

화면을 드래그해서 정답 확인

🎧 신곡을 10초만 듣고 “너무좋다” 평가 → 정답: 추론통계

🚔 경찰이 무작위 차량 일부만 음주단속 → 정답: 추론통계

넷플릭스가 리뷰 수천 개 대신 평균 제시 → 정답: *기술통계**

🛒 슈퍼마켓 시식 코너, 한입 먹고 구매 결정 → 정답: 추론통계

0개의 댓글