1️⃣ 기존 프로그래밍 vs 머신러닝
2️⃣ AI vs 머신러닝 vs 딥러닝
- 인공지능(AI): 인간의 지능을 컴퓨터가 모방한 포괄적 기술
- 머신러닝: 데이터를 기반으로 컴퓨터가 학습해 규칙을 찾는 AI 기술
- 딥러닝: 머신러닝의 하위분야로서 인간의 신경망을 모방한 인공신경망(ANN)을 활용한 알고리즘
3️⃣ 머신러닝의 학습
- 데이터에서 규칙성(패턴)을 찾아내는 과정
- 찾은 규칙으로 새로운 데이터에 대한 답을 예측
✨ 머신러닝과 기존 알고리즘의 차이
| 전통적 알고리즘 | 머신러닝 |
|---|
| 문제 명세 → 알고리즘 → 결과 | 데이터 → 결과 → 규칙(알고리즘) |
| 조건 명확 | 조건 불명확 (복잡한 문제에 효과적) |
4️⃣ 학습 데이터의 구성
📌 학습 데이터를 나누는 이유는 과적합(overfitting)을 방지하기 위함
- 훈련 데이터(Training set): 모델 학습
- 검증 데이터(Validation set): 모델의 성능 조정, 하이퍼파라미터 튜닝
- 테스트 데이터(Test set): 최종 모델 평가
| 용어 | 설명 |
|---|
| 하이퍼파라미터 | 사람이 설정해주는 파라미터 (학습률, 에폭 등) |
| 매개변수 | 학습 중 자동으로 학습되는 값 (가중치, 편향 등) |
5️⃣ 머신러닝의 분류
| 종류 | 설명 | 예시 |
|---|
| 지도학습(감독학습) | 입력과 정답이 있는 데이터를 이용한 학습 | 분류, 회귀분석 |
| 비지도학습(무감독학습) | 입력 데이터만으로 규칙성을 찾아 군집화 | 군집화(Clustering), 차원 축소 |
| 준지도학습 | 지도학습 + 비지도학습을 혼합한 방식 | 소수의 레이블 데이터와 다수의 비레이블 데이터를 함께 학습 |
| 강화학습 | 환경과의 상호작용에서 피드백을 통해 행동 결정 | 게임 플레이, 자율주행 |
6️⃣ 인공신경망(ANN)
- 인간의 뉴런 구조를 모방한 머신러닝 모델
- 입력(Input) → 가중치(Weight) → 활성화 함수(Activation function) → 출력(Output)
✨ 인공신경망의 문제점
- 과적합(overfitting) 가능성
- 파라미터의 최적값 찾기 어려움
- 학습 속도 느림
7️⃣ 딥러닝(DNN, Deep Neural Network)
- ANN에서 발전하여 다수의 은닉층(hidden layers)을 구성한 형태
- 심층 구조를 통해 복잡한 패턴을 학습할 수 있도록 함
- 대규모 데이터, 반복학습, 오류 역전파를 통해 성능 향상
| 알고리즘 | 특징 | 용도 |
|---|
| CNN (합성곱 신경망) | 이미지의 특징을 추출해 학습 | 이미지 인식, 영상 분석 |
| RNN (순환 신경망) | 순차적 데이터(시계열, 텍스트)에 특화 | 텍스트 처리, 음성 인식 |
| LSTM | 장기 의존성을 개선한 RNN의 발전형 | 언어 모델링, 음성 인식 |
| GRU | LSTM의 간소화 버전 | 자연어 처리 |
8️⃣ 주요 알고리즘 특징 요약
✨ RNN(순환 신경망)
- 순차적 데이터 처리에 특화
- 시간에 따른 데이터의 선후 관계 학습에 유리
- 음성, 텍스트 분석 등에 활용
✨ CNN(합성곱 신경망)
- 이미지의 시각적 특징(feature)을 추출
- 이미지 인식, 객체 탐지, 영상 분석에 뛰어난 성능