머신 러닝 3가지 종류

머신러닝

목록 보기
1/13

아침의 맑은 정신으로 오전 10시에 사람들과 머신러닝 스터디를 진행하기로 했다.

주중에 20분동안 책을 읽고 각자 중요하게 생각하는 부분 또는 궁금한 점을 질문하는 식으로 진행하였다.

책은 「머신러닝 교과서 with 파이썬, 사이킷런, 텐서플로」로 정해서 읽고있다.

워낙 수학적인 개념이 많이 있는 분야이다보니, 자세히 파고들지는 못하겠지만 대략적인 흐름과 개념정도를 익히고자, 머신러닝의 분야에 조금 익숙해지고자 스터디를 시작했다.


어제 배운 내용을 정리해보자!


머신 러닝의 3가지 종류

  • 지도 학습
  • 비지도 학습
  • 강화 학습

지도학습

: 레이블된 데이터를 사용해, 모델이 입력 데이터와 정답 간의 관계를 학습

  • 레이블된 데이터
  • 직접 피드백
  • 출력 및 미래 예측

[목적] 레이블된 훈련 데이터에서 모델을 학습하여 본 적 없는 미래 데이터에 대해 예측을 만드는 것.

[종류]

  1. 분류(어느 범주에 속하는지(클래스 레이블 예측))
  • 이진 분류
  • 양성클래스, 음성클래스, 결정경계
  • 예) 스팸 메일 필터
  1. 회귀(연속적 출력 값 예측)
  • 예측변수(특성,x)와 연속적인 반응변수(결과 ,타갓, y)가 주어졌을 때 출력값을 예측하기 위해 두 변수 사이의 관계를 찾는 것.
  • 예) 시험 공부 시간과 학생들의 수학 점수 예측

비지도 학습

  • 레이블 및 타깃 없음
  • 피드백 X
  • 데이터에서 숨겨진 구조, 패턴 찾기

1. 군집(클러스터, 서브그룹)

  • 어느정도 유사성을 공유하여 그룹 형성
  • 정보를 조직화하고 데이터에서 의미 있는 관계를 탐색

2. 차원 축소(데이터 압축)

  • 고차원의 데이터를 다루어야 하는 경우 多 -> 머신러닝 알고리즘의 계산 성능과 저장 공간의 한계에 맞닥뜨릴 수 있음 -> 공간 압축
  • 잡음 데이터를 제거하기 위해 종종 전처리 단계에서 사용

강화 학습

: 보상(reward)벌점(penalty)을 통해, 에이전트가 최적의 행동(정책)을 학습하도록 하는 머신러닝 방법 *에이전트: 환경과 상호작용하며 행동을 수행하고 보상을 받는 주체

  • 결정 과정
  • 보상 시스템
  • 연속된 행동에서 학습

[목적] 환경과 상호 작용하여 시스템 성능 향상 *환경의 현재 상태 정보는 보상신호 포함 -> 피드백은 즉 레이블이나 값X

  • 예) 체스 게임: 체스판의 상태(환경)에 따라 기물의 이동 결정. 보상은 게임 종료했을 때 승리나 패배.

궁금증

"레이블된 데이터" 는 뭐고, "레이블이 없는 데이터"는 무엇일까?

레이블이란? 쉽게 말해 데이터를 해석할 의미를 주는 이름표.
또는 출력데이터.

입력 데이터:
이메일 내용: "무료 쿠폰 받아가세요!" → 레이블: 스팸
이메일 내용: "내일 회의 일정 확인 부탁드립니다." → 레이블: 스팸 아님를 입력하세요

즉, 출력데이터가 있냐없냐.


레이블이 없는(출력이없는, 즉 특성(입력데이터)만 있는) 데이터는
그 데이터를 해석할 의미가 없어서 -> 비지도학습
문제들 간의 패턴을 발견하는것이 -> 클러스터링

profile
정리하는게 공부가 될 지 모르겠지만, 정리를 하면 마음만큼은 편해

0개의 댓글