데이터 분석 33일
| 종류 | 설명 | 예시 |
|---|---|---|
| 1. 지도학습 (Supervised Learning) | 정답(레이블)이 있는 데이터를 학습해서, 새로운 입력에 대해 예측함 | 이메일 스팸 분류, 집값 예측, 시험 점수 예측 |
| 2. 비지도학습 (Unsupervised Learning) | 정답이 없는 데이터를 스스로 그룹으로 묶거나 패턴을 찾음 | 고객 세분화, 추천 시스템, 이상치 탐지 |
| 3. 강화학습 (Reinforcement Learning) | 보상과 벌점을 통해 어떤 행동이 좋은지 학습함 | 게임 AI, 로봇 제어, 자율주행 |
데이터: 입력(X)과 출력(Y)이 짝지어진 상태
목표: 새로운 입력이 주어졌을 때 적절한 출력을 예측
분류 vs 회귀
- 분류: 스팸/비스팸처럼 정해진 범주 중 하나를 예측
- 회귀: 숫자 예측 (예: 키, 가격 등)
데이터: 출력이 없이 입력만 있음
목표: 데이터 안에서 숨겨진 구조, 패턴, 군집 등을 발견
대표 기법:
- 군집화 (Clustering): 유사한 데이터를 묶음 (예: 고객 군집화)
- 차원 축소: 중요한 정보만 추려서 데이터 압축 (예: PCA)
개념: 에이전트가 환경과 상호작용하며 최적의 행동을 학습
보상: 좋은 행동에는 보상, 나쁜 행동에는 벌점을 받음
예시: 체스 두는 AI, 마리오 게임 플레이
- 지도학습 (Supervised Learning)
→ 분류(Classification) / 회귀(Regression) 알고리즘 사용
→ 예: 로지스틱 회귀, 랜덤 포레스트, XGBoost, SVM 등
- 비지도학습 (Unsupervised Learning)
→ 클러스터링(Clustering) / 차원 축소(Dimensionality Reduction) 알고리즘 사용
→ 예: K-Means, DBSCAN, PCA, t-SNE 등
- 강화학습 (Reinforcement Learning)
→ 보상 기반의 정책 최적화 알고리즘 사용
→ 예: Q-learning, Deep Q Network(DQN), Proximal Policy Optimization(PPO) 등