목차
Learning의 4종류
1. Supervised Learning
지도학습 : 문제와 답을 전부 가르쳐주는 것.
1. 분류 문제
예를 들어, 고양이 사진을 주며 고양이라는 답도 함께 알려주고(가르치고)
강아지 사진을 주며 강아지라는 답도 함께 알려주면(가르치면)
이제 스스로 왜 고양이고 왜 강아지인지 유추할 수 있도록 특징들을 찾아내게한다.
2. 회귀 문제
- 어떤 문제에 대한 수치적인 답을 찾아내는 것
- 어떤 값을 넣었을 때 어떤 특정한 값을 내놓는 것
참고 : 이 때, 딥러닝에서는 특징을 찾아내는 것을 Encoder, 특징으로부터 정답을 도출하는 것을 Decoder라고 한다.
2. Unsupervised Learning
비지도학습 : 문제만 주어져 있는 상태. “정답은 너가 알아서 찾아봐”
보통 군집화되어 있는 패턴들을 주로 찾아내는 Clustering 작업,
혹은 연관 관계를 찾아내거나,
혹은 차원을 축소할 때 많이 사용한다.
정답을 주지 않아도 대규모 데이터를 통해 데이터의 내재된 패턴이나 숨겨진 구조를 효과적으로 발견하는 데 강점을 보인다.
3. Semi-Supervised Learning
세미-지도학습 : 문제만 주어진 것도 있고, 답이 함께 주어진 것도 있음
지도학습과 비지도학습을 합친 것.
마치 연습문제를 풀 때 예제문제 안에 답이 있어서 참고할 수 있는 느낌이다.
4. Reinforcement Learning
강화학습 : 문제만 주고 나서 답에 대해 점수를 부여한다. 이 점수를 최대화하도록 설계된 학습.
즉, 규칙이나 답을 아는 것이 아니라, 어떻게 하면 점수를 높게 받을 수 있을지 그 방법을 스스로 찾아나가며 행동하는 학습이다.
지도학습과 비지도학습의 차이
- “문제”만 주느냐, “정답”도 함께 주느냐?
- 지도학습은 입력값과 출력값을 함께 주어 학습시키고,
- 비지도학습은 입력값만 준다.
- 학습의 목적이 무엇이냐?
- 지도학습은 출력값이 정해져 있고, 이 정해진 출력값을 맞추게 하는 목적이다.
- 반면, 비지도학습은 입력값 속에서의 패턴이나 유사도를 학습하기 때문에 군집화에 많이 사용된다.
- 활용 사례 부분
- 지도학습은 “정확한 예측이 필요”한 곳(객체 인식, 가격 예측 등)에 주로 쓰이고
- 비지도학습은 “데이터를 이해하고 새로운 패턴을 찾아”야 하는 곳(이상 탐지, 추천 시스템 등)에 주로 쓰인다.
- 성능 평가
- 지도학습은 정답이 있으니 평가하기 쉽다. 단순 오차 제곱 합, 평균 제곱 오차, 평균 절댓값 오차 등으로 간단하고 명확한 수치로 평가할 수 있다.
- 비지도학습은 정답 레이블이 없기에 정확한 평가는 어려워도 방법은 있다.
클러스터링 평가로는 실루엣 지표라는 정량적 평가가 있고, 차원 축소 문제에서는 원본데이터와 복원된 데이터를 비교하는 재구성 오차방법이 있다.