통계란 무엇인가?

수현·2024년 1월 12일
0

Statistics

목록 보기
6/7
post-thumbnail

통계(Statistics)란 무엇인가?

정의

  • 데이터 수집 및 분석 연구: 데이터를 체계적으로 수집, 정리, 분석, 해석하는 과학적 방법론
  • 데이터 사실 요약: 평균, 개수 등을 사용해 데이터를 요약하고 사실을 나타내는 정보

통계의 중요성

  • 의사결정: 제품 구매 확률, 결제 시스템의 영향, 호텔 점유율 최적화 등에 활용할 수 있다.
  • 예측 및 계획: 인구 통계에 따른 제품 크기(예: 옷 사이즈 결정), 수요 예측에 활용할 수 있다.
  • 마케팅 전략: A/B 테스트를 통해 광고 효과를 분석하고 마케팅 전략을 수립할 수 있다.

통계의 한계

통계는 많은 질문에 대한 답을 제공하지만, 모든 질문에 대한 답을 제공하지는 않는다. 데이터의 한계, 해석의 주관성 등이 영향을 미치기 때문이다.


통계의 유형

1. 기술 통계(Descriptive Statistics)

현존하는 데이터를 설명 및 요약하기 위해 데이터의 특성을 직관적으로 이해하기 쉽게 만든다.

  • 예시: 4명에게 출근 방법을 질문한 결과, 50%가 차로, 25%가 버스로, 25%가 자전거로 출근한다.
  • 포함 요소: 평균, 중앙값, 최빈값, 범위, 표준편차 등.

2. 추론 통계(Inferential Statistics)

샘플 데이터를 바탕으로 전체 모집단에 대한 추론을 하기 위해, 일부 데이터로부터 전체에 대한 결론을 도출한다.

  • 예시: 한 도시에서 무작위로 선택된 100명의 출근 방법 데이터를 통해, 전체 도시민의 출근 방법 비율 추정.
  • 적용 방법: 확률 이론, 통계적 유의성 검증 등.

데이터의 유형

1. 양적 데이터(Quantitative)(Numeric)

수량을 나타내며 수치로 표현될 수 있는 데이터이다

- 연속 데이터(Continuous)(Measured)

  • 예시: 카페의 일일 판매액
  • 특징: 무한하고 연속적인 값 범위를 가짐

- 이산 데이터(Discrete)(Counted)

  • 예시: 카페서 하루에 판매한 커피 개수
  • 특징: 특정 값에 한정되며, 보통 정수로 표현됨

2. 질적 데이터(Qualitative)(Categorical)

특성이나 품질을 나타내며, 범주 또는 라벨로 표현되는 데이터이다.

- 범주형 데이터(Nominal)(Unordered)

  • 예시: 카페의 커피 종류(아메리카노, 라떼, 카푸치노)
  • 특징: 순서가 없으며, 서로 구별 가능한 범주

- 명목형 데이터(Ordinal)(Ordered)

  • 예시: 고객 만족도 설문(매우 만족, 만족, 보통, 불만족)
  • 특징: 순서가 있으나, 간격이 균일하지 않음

범주형 데이터는 숫자로 표현이 가능하다.

예: 커피종류(1, 2, 3, ...), 만족도(3, 2, 1).

데이터 유형의 중요성

데이터의 유형에 따라 적절한 요약 통계 및 시각화 방법이 달라진다.

  • 수치 데이터: 평균, 중앙값, 범위 등의 요약 통계 사용 가능.

  • 범주형 데이터: 산점도가 의미 없을 수 있으며, 막대 그래프 등 다른 시각화 방법 적용.

  • 양적 데이터: 연속 데이터(속도, 시간)는 선 그래프, 이산 데이터(패키지 수)는 히스토그램으로 시각화.

  • 질적 데이터: 범주형 데이터(결혼 여부)는 파이 차트, 명목형 데이터(만족도)는 순서가 있는 막대 그래프로 시각화.

profile
데이터 분석 공부중:)

0개의 댓글