AI&ML_Eng : 이론 공부 : 통계학이란 무엇인가.

0
post-thumbnail

AI&ML_Eng : 이론 공부 : 통계학이란 무엇인가.

▽ AI&ML_Eng : 이론 공부 : 통계학이란 무엇인가.

목   차

1. 통계학 정의와 활용

2. 기술통계와 추론통계

3. 통계학의 중요성

1. 통계학 정의와 활용


핵심 개념.

  • 통계학(Statistics): 데이터를 수집, 정리, 분석하여 의미 있는 결론을 도출하는 학문.

  • 분류

      1. 기술통계(Descriptive Statistics): 데이터를 요약·정리하여 패턴을 파악.
      1. 추론통계(Inferential Statistics): 표본 데이터를 통해 모집단의 특성을 추정하고 의사결정을 지원.

AI/ML·데이터사이언스 관점.

  • 데이터 전처리와 탐색적 분석(EDA)의 핵심 도구

  • 모델링 전에 데이터 패턴, 이상치, 분포를 이해하고 확인하는 과정에서 필수

  • AI/ML 알고리즘 성능 평가에서 통계적 지표(예: p-값, 신뢰구간, 분산)를 활용

학습 포인트.

  • 기술통계: 평균, 표준편차, 사분위수, 시각화

  • 추론통계: 가설 검정, 신뢰구간, 표본 추출 방법 이해

  • 실무 적용: AI/ML 프로젝트에서 데이터 신뢰성과 품질 검증

2. 기술통계와 추론통계


기술 통계

  • 목적 : 데이터를 요약하고 이해

  • 예시 : 데이터셋의 평균, 분산, 히스토그램, 상관관계

  • AI/ML 적용

    • 데이터 이상치 탐지
    • Feature scaling, normalization 필요성 판단
    • EDA(Exploratory Data Analysis) 필수 과정

추론 통계

  • 목적: 표본을 통해 모집단의 특성을 추정하고 가설 검정

  • 예시: t-검정, 카이제곱 검정, ANOVA

  • AI/ML 적용

    • 모델 성능 비교(예: 두 모델의 정확도 차이 유의성 검정)

    • 실험 설계(A/B 테스트)와 결과 해석

3. 통계학의 중요성.


이유 1: 데이터 기반 의사결정

  • 데이터 분석과 모델링은 통계학적 사고 없이는 의미 있는 결과 도출 불가

  • 표본, 분포, 확률 개념을 이해해야 모델 과적합/과소적합을 방지 가능

이유 2: AI/ML 모델 설계와 검증

  • 회귀, 분류, 군집 등 모든 모델은 통계적 개념 기반

  • 예: 선형회귀 계수 해석, 로지스틱 회귀 p-값, 신뢰구간 확인

이유 3: 실험 및 평가

  • A/B 테스트, 하이퍼파라미터 튜닝, 모델 성능 평가에서 통계학적 방법 필수

  • 정확도, 정밀도, 재현율, F1-score 등 지표 해석의 근거

0개의 댓글