[ML] 기계학습 유형 - 지도학습, 비지도학습, 강화학습, 준지도학습

Sue·2021년 10월 10일

Machine Learning

목록 보기

9/12

저는 해당 책과 ppt 자료를 바탕으로 포스팅하였습니다. 자세한 내용은 책과 ppt 자료를 참고하시면 감사하겠습니다.

이전 참고 글

기계학습 유형

기계학습으로 풀어야 하는 문제가 다양해진 만큼 기계학습의 유형도 다양하다. 여기서는 알고리즘을 지도 방식과 다양한 기준에 따른 유형으로 구분하는데 지도 방식에 따른 유형만 정리하고 넘어갈 예정이다.

지도 방식에 따른 유형

1. 지도 학습

지도 학습(supervised learing)은 데이터가 입력(feature vector)과 출력(value)이 쌍으로 주어진다. feature vector에 대해 출력이 이러해야 한다는 정보를 알려준다는 점에서 '지도(supervised)'라는 명칭을 사용한다.

예시) iris 데이터베이스에 입력 (5.1, 3.5, 1.4, 0.2)T, 출력 setosa라는 sample이 있는데, 이 샘플은 앞으로 꽃받침 길이가 5.1, 너비가 3.5, 꽃잎 길이가 1.4, 너비가 0.2거나 유사한 샘플이 입력되면 setosa라는 class로 classify하라고 지도하는 셈이다.

지도학습으로 해결할 수 있는 문제로는 회귀(regression)와 분류(classification)가 있다. 회귀는 출력이 연속된 실수로 주어지지만, 분류는 몇 가지 class로 주어진다.

최근 다른 예시로는 다른 형태의 문제도 해결하고 있다. rating - 검색 순위 매기기, 영상 변환(고흐 풍의 그림으로 변환하기) 등이 있다.

특징 벡터 𝕏와 목푯값 𝕐가 모두 주어진 상황
회귀와 분류 문제로 구분

2. 비지도 학습

비지도 학습(unsupervised learing)에서는 입력(feature vector)만 주어진다. value는 없으므로 지도하지 않는다의 의미에서 비지도 학습이라는 명칭이 붙었다.

예를 들어, iris 데이터에서 sample마다 주어진 class 정보를 모두 빼면 비지도 학습 문제로 바뀐다.

class 정보가 없는 상황에서 무엇을 할 수 있을까? 가장 기본적인 과업으로는 군집화(clustering)이 있다. 유사한 특징 공간에서 가까이 있는 sample을 군집으로 모으는 작업이다.

온라인 쇼핑몰에서 고객을 대상으로 맞춤식 광고를 하는 상황에서도 clustering이 필요하다. 고객을 sample로 한다면 직업, 성별, 나이, 선호 품목, 반품 내용 등과 같은 feature는 log data로부터 알아낼 수 있지만, class 정보는 없는 셈이다.

고객을 몇 가지 class로 구분하고, 각 그룹에 맞춤식 광고를 한다면 clustering이 필요하다.

비지도 학습의 다른 과업은 feature space의 변환이다. feature space가 커지고 database의 크기가 커질 수록 사람의 직관에 의존하기 어렵다. 비지도 학습을 이용하여 변환함수를 자동으로 알아낸다.

예로 LLE, lsoMap, t-SNE, PCA 등이 특징 변환 알고리즘이다. 또한, 깊은 신경망의 hidden layer에서 일어나는 변환을 포괄하여 representation learning, feature learning이라고도 한다.

특징 벡터 𝕏는 주어지는데 목푯값 𝕐 가 주어지지 않는 상황
군집화 과업 (고객 성향에 따른 맞춤 홍보 응용 등)
밀도 추정, 특징 공간 변환 과업

3. 강화 학습

강화학습(reinforcement learning)도 목푯값이 주어지지만, 지도학습과 다른 개념이다.

장기 게임을 예로 들어보면, 두 사람이 번갈아 가며 수를 놓는데, 각각의 수를 sample이라 볼 수 있다. 이때 sample마다 value를 주는 지도학습과 달리, 게임이 다 끝난 후 승패를 따져서 얻은 점수를 value로 둔다. 연속된 sample의 열에 value 하나만 주는 형식이다.

수를 두는 행위가 샘플인데, 게임이 끝나면 목푯값 하나가 부여됨
- 이기면 1, 패하면 -1을 부여
게임을 구성한 샘플들 각각에 목푯값을 나누어 주어야 함

책에는 준지도 학습까지 개념을 다루고 있지만, 지도학습, 비지도학습, 강화학습만 다루기로 했다.

Sue

AI/ML Engineer

이전 포스트

[ML] 규제 기법 - Data Augmentation, Weight Decay

다음 포스트