2021년 성균관대학교에서 수강한 '인공지능개론' 수업을 2023년 복습 겸 정리한 내용입니다.
머신러닝이란?
데이터, 이전 결과 또는 경험에 기반해 프로그램을 향상시키는 것.
통계학과 비슷하지만 머신러닝은 알고리즘적 복잡성과 더 많은 휴리스틱 지식을 요구한다.
ML(머신러닝) 문제들의 종류
- Classification
여러 인식 문제, 추천, 필터링, 디텍션 등에 사용
- Regression
마케팅, 스톡 마켓 예측 등
- Clustering
웹 서치, document & information retrieval, Machine translation 등
- Dimension Reduction
Classification
- labeled 된 데이터셋이 주어진다.
- label들의 바운더리를 찾는 것이 목적
- query가 주어지면, label을 답해야 한다. 즉, 여러 주어진 label들 중 하나를 예측하는 것
Regression
- (x,y) 셋이 주어지면 x와 y 사이의 함수를 찾아내는 것이 목적
- x' 쿼리가 주어지면 x'에 대응하는 y를 찾아내야 함
- real number를 예측한다.
Clustering
- labeled 되지 않은 데이터들이 주어진다.
- 비슷한 data들끼리 그룹화 하는 것이 목적
- query가 주어지면, 이 query가 어느 그룹에 속하는지 결정해야 한다.
Dimension Reduction
- labeled 되지 않은 데이터들이 주어진다.
- 정보의 손실을 최소화하며 data의 차원을 줄이는 것이 목적
- 예를 들어, 2차원으로 mapping 된 데이터가 있다고 하자. 이때, dimension reduction 을 할 때 그냥 projection을 할지, 아니면 다른 방법을 사용해야 할지 정하기 어렵다.
-> ML을 통해 데이터의 패턴을 찾으면 된다.
학습 방법의 종류
Supervised Learning
- Classification, Regression
- 주어지는 모든 데이터가 labeled 되어 있음
Unsupervised Learning
- Clustering, Dimension Reduction, Association
- 데이터들이 labeled 되지 않음
Reinforcement Learning
- Strategy Learning
- 행동에 따른 reward가 주어진다.