머신 러닝 3가지 종류

목록 보기

1/13

아침의 맑은 정신으로 오전 10시에 사람들과 머신러닝 스터디를 진행하기로 했다.

주중에 20분동안 책을 읽고 각자 중요하게 생각하는 부분 또는 궁금한 점을 질문하는 식으로 진행하였다.

책은 「머신러닝 교과서 with 파이썬, 사이킷런, 텐서플로」로 정해서 읽고있다.

워낙 수학적인 개념이 많이 있는 분야이다보니, 자세히 파고들지는 못하겠지만 대략적인 흐름과 개념정도를 익히고자, 머신러닝의 분야에 조금 익숙해지고자 스터디를 시작했다.

어제 배운 내용을 정리해보자!

지도학습

: 레이블된 데이터를 사용해, 모델이 입력 데이터와 정답 간의 관계를 학습

[목적] 레이블된 훈련 데이터에서 모델을 학습하여 본 적 없는 미래 데이터에 대해 예측을 만드는 것.

[종류]

비지도 학습

1. 군집(클러스터, 서브그룹)

2. 차원 축소(데이터 압축)

강화 학습

: 보상(reward)과 벌점(penalty)을 통해, 에이전트가 최적의 행동(정책)을 학습하도록 하는 머신러닝 방법 *에이전트: 환경과 상호작용하며 행동을 수행하고 보상을 받는 주체

[목적] 환경과 상호 작용하여 시스템 성능 향상 *환경의 현재 상태 정보는 보상신호 포함 -> 피드백은 즉 레이블이나 값X

"레이블된 데이터" 는 뭐고, "레이블이 없는 데이터"는 무엇일까?

레이블이란? 쉽게 말해 데이터를 해석할 의미를 주는 이름표.
또는 출력데이터.

입력 데이터:
이메일 내용: "무료 쿠폰 받아가세요!" → 레이블: 스팸
이메일 내용: "내일 회의 일정 확인 부탁드립니다." → 레이블: 스팸 아님를 입력하세요

즉, 출력데이터가 있냐없냐.

레이블이 없는(출력이없는, 즉 특성(입력데이터)만 있는) 데이터는
그 데이터를 해석할 의미가 없어서 -> 비지도학습
문제들 간의 패턴을 발견하는것이 -> 클러스터링

정리하는게 공부가 될 지 모르겠지만, 정리를 하면 마음만큼은 편해

머신러닝