목 차
1. 통계학 정의와 활용
2. 기술통계와 추론통계
3. 통계학의 중요성
통계학(Statistics): 데이터를 수집, 정리, 분석하여 의미 있는 결론을 도출하는 학문.
분류
데이터 전처리와 탐색적 분석(EDA)의 핵심 도구
모델링 전에 데이터 패턴, 이상치, 분포를 이해하고 확인하는 과정에서 필수
AI/ML 알고리즘 성능 평가에서 통계적 지표(예: p-값, 신뢰구간, 분산)를 활용
기술통계: 평균, 표준편차, 사분위수, 시각화
추론통계: 가설 검정, 신뢰구간, 표본 추출 방법 이해
실무 적용: AI/ML 프로젝트에서 데이터 신뢰성과 품질 검증
목적 : 데이터를 요약하고 이해
예시 : 데이터셋의 평균, 분산, 히스토그램, 상관관계
AI/ML 적용
목적: 표본을 통해 모집단의 특성을 추정하고 가설 검정
예시: t-검정, 카이제곱 검정, ANOVA
AI/ML 적용
모델 성능 비교(예: 두 모델의 정확도 차이 유의성 검정)
실험 설계(A/B 테스트)와 결과 해석
데이터 분석과 모델링은 통계학적 사고 없이는 의미 있는 결과 도출 불가
표본, 분포, 확률 개념을 이해해야 모델 과적합/과소적합을 방지 가능
회귀, 분류, 군집 등 모든 모델은 통계적 개념 기반
예: 선형회귀 계수 해석, 로지스틱 회귀 p-값, 신뢰구간 확인
A/B 테스트, 하이퍼파라미터 튜닝, 모델 성능 평가에서 통계학적 방법 필수
정확도, 정밀도, 재현율, F1-score 등 지표 해석의 근거