[패스트캠퍼스] 머신러닝 강의 1주차 학습일지

김나래·2022년 8월 29일
0

학습일지

목록 보기
1/5

강의 제목 : 머신러닝 & AI 첫걸음 시작하기

#패스트캠퍼스 #내일배움카드취업 #국비지원교육 #K디지털기초역량훈련 #과정명

학습 요약

1. 수학적 개념 이해
- 통계학의 기초를 이해할 수 있다. (표본, 확률, 분포)
- 미분의 개념을 이해하고 벡터, 행렬일 경우에도 적용할 수 있다.
- likelihood의 개념을 이해하고, MLE를 직접 계산할 수 있다.

2. 머신러닝의 이해
- 머신러닝의 개념과 다양한 종류들을 이해할 수 있다.
- 모형의 적합성을 평가하는 방법을 이해할 수 있다.
- 모형의 전체적인 과정을 이해할 수 있다.

학습 내용

수학적 개념은 이미 배운 적이 있기 때문에 필기를 하고 있는 사진으로 대체하고 새롭게 배웠던 머신러닝(Machine Learning)만 정리하고자 한다.

  1. 머신러닝의 개념

    • 인공지능 > 머신러닝 > 딥러닝(Neural Network)
    • X(독립변수)와 종속변수(Y)와의 관계를 나타내는 ff, 알고리즘과 기술을 개발하는 분야
  2. 머신러닝의 종류

    • 지도학습(Supervied Learning): X가 주어지면 Y를 주어 학습
      * 회귀분석(regression, 선형회귀)
      • 분류(Classification, KNN, SVM, Ensemble)
    • 비지도학습(Unsupervised Learning): 비슷한 특징끼리 군집화
      * 클러스터링(Clustering, K-means clustering)
    • 강화학습(Reinforcement Learning):
      정답이 따로 정해져 있지 않고, 자신이 한 행동에 대해 보상을 받으며 학습
  3. 모형의 적합성 평가

    • 데이터 분할 (보통 5:3:2)
      original data = (training + validation) + test
      • training : 모형 ff를 추정한다.
      • validation : 추정한 모형 ff가 적합한지 검증한다.
      • test : 최종적으로 선택한 모형의 성능을 평가한다.
    • k-Fold 교차검증
      한 개와 나머지로 나누어 이를 총 K번 반복하고 성능 지표를 평균내서 적합성을 평가한다.
      1) | 1 | 2 | ... | K | 로 나눈다.
      2) | 1 |(검증) | 2 | 3 | ... | K |(학습)
      3) | 2 |(검증) | 1 | 3 | ... | K |(학습)
      ....
    • LOOCV(Leave-One-Out Cross Validation), sample 수 작을 때 사용
      k-Fold와 다르게 이번엔 하나씩 빼고 남은 샘플로 성능 지표를 평균내서 적합성을 평가한다.
      1) | 2 | 3 | ... | K-1 | K |, 1제거
      2) | 1 | 3 | ... | K-1 | K |, 2제거
      3) | 1 | 2 | ... | K-2 | K-1 |, K제거
      ....
  4. 모형의 분석 과정 : 데이터 -> 전처리 -> 실험 설계 -> 모형

    • 전처리: Raw 데이터를 분석에 바로 투입시킬 수 있도록 병합하거나 새로 변수를 만들어서 정리함
    • 모형설계: test와 training 데이터로 나누어 검증하고 모형의 성능을 평가함
  5. 주의해야 할 문제 : 과적합(overfitting)

    • 모형이 복잡할수록 데이터의 수가 적을수록 과적합이 일어나기 쉽다.
    • 편파성: 학습 알고리즘에서 잘못된 가정을 했을 때 발생하는 오차
    • 복잡한 모형을 사용하면 편파성은 줄어들지만, 오차는 커진다.
      반대로 오차를 줄이기 위해 단순한 모형을 사용하면 편파성이 커진다.
    • 따라서 편파성과 오차를 모두 최소화할 수 있도록 방법을 찾아야 한다.

느낀점

오랜만에 선형대수학과 수리통계학을 복습할 수 있었던 시간이었다.
AI와 머신러닝하면 먼저 어려울 것 같다는 생각에 두려움이 앞섰는데 아는 부분이 먼저 나오니까 앞으로 차근차근 공부해보면 생각보다 잘 배울 수 있을 것 같다는 생각이 든다. 안다고 대충 듣지 말고 누가 나중에 물어보더라도 자연스럽게 개념을 설명할 수 있을 만큼 머리 속에 확실하게 집어넣어놓자.

profile
김나래입니다.

0개의 댓글