[K-MOOC] 실습으로 배우는 머신러닝 (1)

BBakHye·2022년 11월 21일
0

🦁 AI SCHOOL 7기

목록 보기
29/52
post-thumbnail

K-MOOC - 실습으로 배우는 머신러닝

1. Introduction to Machine Learning

📌 1-1. 인공지능과 머신러닝 개요

처리 속도: GPU computing > CPU computing

✅ 머신러닝 알고리즘의 4가지 구성요소

  • Environmnet(E) : 학습 시스템이 상호작용하면서 데이터를 축적하는 대상
  • Data(D) : 환경과 상호작용을 통해 축적된 정보
  • Model(M) : 함수의 기본 구조를 입력하고 데이터를 통해 함수의 파라미터들을 학습한 결과물. input과 output의 관계를 적절하게 설명할 수 있는 모델을 만들어 학습
  • Performance(P) : 문제를 해결해 달성하고자 하는 결과물의 평가 지표

💡 오차가 작은 모델 == 좋은 모델

📌 1-2 머신러닝 학습 개념

Learning is optimisation

💡 loss를 최소화하는 최적의 모델 찾기
1) Linear Regression 모델
2) 손실함수 (위 사진에서는 MSE) 정의
3) 최적화 (오차(손실함수)를 가장 최소화로 만들어주는 과정)

예시)

그래프를 그려보면 아래와 같고, 오차의 최소점은 (2,0) 이라는 것을 알 수 있지만 컴퓨터는 이해하지 못한다.

미분을 해서 미분계수 (loss)가 0이 되는 지점을 찾으면 최소값을 구할 수 있다.

Loss가 0인 경우는 매우 드물기 때문에 0에 가까운 값을 찾는 것이 일반적이다.

📌 1-3. 머신러닝 프로세스 및 활용

✅ 머신러닝 최적화

  • Heuristic: 정확한 수리적인 최적화 기법을 적용하지 않고 대략적인 알고리즘으로 접근해서 loss가 최소화 되게끔 유도해 주는 방법

  • Numerical Optimisation: 정확한 수리적인 기법으로 loss function을 정의하고 최적화하는 방법

✅ 오차의 종류

  • Training error (loss): 학습 데이터 내에서 발생하는 오차
  • Validation error (Generalisation error): 테스트 데이터에서 발생하는 오차

💡 Validation error가 최소가 되는 모델을 찾는 것이 목적
검증오차가 최소가 되는 최적의 파라미터를 찾았을 때 일반화 오차가 최소가 됨.

profile
데이터 분석가가 되기 위한 기록 ✏️

0개의 댓글