머신러닝 활용 - 4회차

Data_Student·2024년 11월 25일

0

머신러닝

목록 보기

6/10

04. 딥러닝

1. 딥러닝

1) 머신러닝 vs 딥러닝

머신러닝과 딥러닝은 내부 구조와 활용범위가 다를 뿐 기본적인 흐름은 동일
다만, 딥러닝은 자연어처리와 이미지 처리에서 뛰어난 발전
공통점
- 데이터로부터 가중치를 학습하여 패턴을 인식하고 결정을 내리는 알고리즘 개발과 관련된 인공지능의 하위 분야
차이점
- 머신러닝 : 데이터 안의 통계적 관계를 찾아내며 예측이나 분류를 하는 방법
- 딥러닝 : 머신러닝의 한 분야로 신경세포 구조를 모방한 인공 신경망을 사용

2) 딥러닝의 유래

인공 신경망 : 인간의 신경세포를 모방하여 만든 망(네트워크)
- 퍼셉트론(Perceptron) : 인공 신경망의 가장 작은 단위

3) 가중치 구하기 - Gradient Descent(경사하강법)

가중치를 움직이면서 최소의 MSE를 도출하는 함수를 목적함수 또는 손실함수라고 함
- 경사하강법은 모델의 손실 함수를 최소화하기 위해 모델의 가중치를 반복적으로 조정하는 최적화 알고리즘

4) 활성화 함수의 등장

로지스틱 함수(시그모이드 함수의 한 예) 외에도 다양한 활성화 함수가 존재
- Sigmoid, tanh, ReLU, Leaky ReLU, Maxout, ELU 등

5) 히든 레이어의 등장

데이터를 비선형적으로 변환함과 동시에 데이터의 고차원적 특성을 학습하기 위해 중간에 입력과 결과 이외의 추가하게 되는 숨은 층의 개념이 등장
히른 레이어가 많을수록 좋은 모델이 나올 줄알았으나 기울기 소실이라는 문제 발생
- 인공 신경망의 학습
  - 순전파(Propagation) : 입력 데이터가 신경망의 각 층을 통과하면서 최종 출력까지 생성되는 과정
  - 역전파(Backpropagation) : 신경망의 오류를 역방향으로 전파하여 각 측의 가중치를 조절하는 과정
- 기울기 소실 문제 등장
  - 문제 : 역전파 과정에서 하위 레이러로 갈수록 오차의 기울기가 점점 작아져 가중치가 거의 업데이트 되지 않는 현상
  - 해결 : 특정 활성화 함수( ReLU 등)를 통해 완화

6) 복습은 도움이 된다 - epoch

epoch : 전체 데이터가 신경망을 통과하는 한 번의 사이클
- 1000 epoch : 데이터 전체를 1000번 학습
batch : 전체 훈련 데이터 셋을 일정한 크기의 소 그룹으로 나눈 것
iteration : 전체 훈련 데이터 셋을 여러 개(=batch)로 나누었을때 배치가 학습되는 횟수

2. 딥러닝의 활용 예시

1) 자연어처리

인간의 언어를 데이터화 하는 것
Transformer모델을 통한 기계번역
자연어 처리 모델 - LLM(Large Language Medel)

2) 이미지

3차원 데이터를 모델에 학습 시킴
최근 이미지 모델은 텍스트, 이미지, 음성 등 다양한 유형의 데이터를 함께 사용하는 Mutimodal

3. 강의 마무리

1) 머신러닝의 기초

머신러닝의 기본, 개념

2) 회귀분석

가장 설명을 잘하는 직선을 그리는 법 - 선형회귀
실제 값과 예측 값의 오차를 계산하라 - Mean Squared Error

3) 분류분석

특정 범주에 대한 확률 예측하기 - 로지스틱회귀
맞춘 것에 대한 지표: 정확도, f1_score

4) 데이터 분석 프로세스

데이터 수집 → 전처리 → 모델링 → 평가

5) 회귀, 분류 모델링 심화

의사결정을 기반으로 한 모델 - 의사결정나무
나무를 여러 개 만들어서 다수결 원칙을 사용하자 - 랜덤포레스트
유유사종의 원리로 예측하자 - KNN
약한 학습기를 여러 개 합치자 - 부스팅 모델

6) 비지도학습

만약 Y(정답이 없다면) 특성을 이용해 그룹화 하자 - K-means 군집화

7) 인공 신경망

사람의 신경세포를 모방한 네트워크 - 인공 신경망

이전 포스트

머신러닝 활용 - 3회차

다음 포스트

[머신러닝] 머신러닝 빌드업 03

0개의 댓글

관련 채용 정보