ISLR 읽고 이해하기 Chap.1

ThovYoon·2022년 7월 7일
1
post-thumbnail

Image Source

1. 통계학습의 개요

통계학습( Statistical Learning )은 데이터를 이해하기 위한 방대한 도구의 집합을 의미한다. 도구들은 쉽게 얘기하던 지도학습( Supervised Learning )과 비-지도학습( Unsupervised Learning ) 그리고 준-지도학습 ( Semi-Supervised Learning )으로 분류된다.

지도학습은 하나 이상( X >= 1 )의 Input Variable을 바탕으로 Output Variable을 예측(Predict)하거나, 추정(Presume)하는 통계적 모델을 만드는것과 관련이 있다. 또한 지도학습은 정답에 해당하는 Label이 존재한다. 이는 곧 정답 Label을 가지고, 예측 및 추정값과의 차이( MSE, MAE, RMSE 등과 같은 지표 )를 줄여가는 것을 목표로 하고 있다.

비-지도학습은 출력변수, 즉 정답 Label이 없으며, 입력변수를 기반으로 자료의 상관관계나 구조를 파악하여( 자료의 특성을 파악한다 라고도 한다 ) 분석을 수행한다.

준-지도학습은 지도학습과 비-지도학습 중간, 즉 Label이 있는 데이터와 없는 데이터가 혼재되어있다. 아무래도 비-지도학습과 지도학습 중간에 있는 학습이다보니, 많은 데이터가 label이 존재하지 않더라도, 소수의 label이 존재하는 데이터로 학습의 정확도를 개선시킬 수 있다.

profile
매일 성장할 나를 위하여

0개의 댓글