[머신러닝] 머신 러닝 알고리즘의 종류

hi·2022년 9월 27일
0

머신 러닝 워크북

목록 보기
2/3

머신 러닝의 학습법은 지도 학습과 비지도 학습으로 분류할 수 있음

✔️ 지도학습 (Supervised Learning)

지도 학습 (Supervised Learning) 훈련용(Training) 데이터로 작업한다. 모든 훈련용 (Training) 데이터에는 입력(문제)와 출력(해답, 결과물) 데이터 개체가 있다. 예를 들어, 트위터 데이터를 분류하는 것이 있는데 트위터에서 다음과 같은 데이터를 얻었다고 가정하면 다음은 입력 데이터 개체임.

Really loving the new St Vincent album!
fashion I'm selling my Louboutuns! Who's interested? louboutins
T've got my Hadoop Cluster working on a load of data

지도 학습 분류기가 각 트윗의 결과를 배울 수 있도록 손으로 해답을 입력해야 한다.

music Really loving the new St Vincent album!
clothing fashion I'm selling my Louboutuns! Who's interested? louboutins
bigdata T've got my Hadoop Cluster working on a load of data

지도 학습에선 편향-분산 딜레마 (Bias-Variance Dilemma)를 고려해야 한다. 편향-분산 딜레마는 머신 러닝 모델이 어떻게 여러 다른 훈련용 데이터 세트를 사용하여 정확하게 학습을 수행할 것인가에 대한 문제이다.


고편향 모델은 잘못된 가정으로 제한된 수의 학습데이터 (validation data) 세트로 얻은 특징과 결과 간의 관계를 놓칠 수 있다. (과소적합)

고분산 모델은 학습데이터 세트의 작은 변동으로 노이즈(noise)가 섞인 복잡한 데이터 세트를 포함할 수 있다. (과적합)

두 모델은 서로 상충되기에 적재적소에 알맞은 모델을 사용하고 두 모델을 모두 사용하여 서로의 단점을 보완하고 장점을 부각하는 적절한 지점을 찾아내는 것이 중요하다.



✔️ 비지도 학습 (UnSupervised Learning)

비지도 학습 (UnSupervised Learning)은 알고리즘으로 데이터에 숨겨진 패턴을 찾는 것을 말한다. 따라서 비지도 학습에는 정답, 오답이 존재하지 않으며 그저 머신 러닝 알고리즘을 실행하고, 어떤 패턴과 결과가 나오는지 지켜본다. 따라서 비지도 학습은 머신 러닝보다는 데이터 마이닝의 사례에 가깝다.







책 '머신 러닝 워크북'을 공부한 내용입니다.

0개의 댓글