machine learning

zoé·2021년 10월 13일
0

machine learning

목록 보기
2/6

Fall 2021 machine learning lecture

기계가 학습한다는 건, 프로그램이 특정 작업(T)을 하는데 경험(E)(= 데이터)을 통해 작업의 성능(P)을 향상시키는 것 - Tom Mitchell

  1. 세상에 사용 가능한 데이터가 많아졌다.
  2. 컴퓨터 성능이 좋아졌다.
  3. 활용성이 증명되었다.

빅데이터 : 데이터 보관/처리법, 데이터 분석 방법들
인공지능 : 프로그램이 인간처럼 생각/행동하게 하는 학문
머신러닝은 인공지능의 수단
딥러닝 : 머신러닝 기법 중 하나

머신러닝

머신러닝은 컴퓨터가 주어진 데이터를 학습해 스스로 새로운 규칙을 발견할 수 있도록 하는 기술
인간은 컴퓨터가 스스로 학습할 수 있도록 하는 알고리즘을 제공해야 한다. 머신러닝의 핵심은 다양한 알고리즘에 있다.
우리는 어떤 알고리즘을 통해 컴퓨터를 학습시켜야 하는가?
모든 상황에서 가장 우월한 알고리즘은 없다. 그렇기 때문에 우리는 상황별로 컴퓨터가 가장 효율적으로 작동하는 머신러닝 알고리즘에 대해 이해 필요

전통적인 통계 방법부터 최신 이론까지 학습하는 방향이 이런 한계점 극복하는 방법

training data vs test data

학습 데이터는 컴퓨터가 학습하기 위해 사용되는 데이터로 알고리즘을 통해 실제 모델이 생성되는데 사용되는 데이터
테스트 데이터는 학습 데이터로 생성된 모델이 잘 작동하는지 확인하기 위한 데이터, 사전에 전체 데이터에서 일부를 랜덤하게 구분해 놓는다.

테스트 데이터로 생성된 모델이 잘 잘동하는지 확인하는 구체적인 방법은 알고리즘을 학습하며 확인해 본다.

supervised learning vs unsupervised learning

지도 학습 (Supervised learning)

예측/분류 (Prediction)

고양이, 강아지 그림(x)와 '고양이', '강아지' 라는 정답(Y, label)이 있는 데이터의 경우 머신러닝 알고리즘으로 학습한 모델이 새로운 문제를 받았을 때, 그림에 해당하는 정답을 결과값으로 출력
문제와 정답 두 내용이 같이 포함된 데이터의 경우 예측/분류(prediction)가 가능한 머신러닝 알고리즘을 사용한 모델 생성 할 수 있다.

  • 답이 있고 이 답을 맞추는 것이 학습의 목적
    지도 학습을 할 떄는 그 학습 데이터에 대한 답을 꼭 알려줘야 한다.
  • 프로그램에게 수 많은 문제와 그 문제에 대한 답을 가르쳐줬다(지도했다)

분류 (Classification)

a이 인가 b 인가, 몇 가지 옵션 중에서 고르는 것

회귀 (Regression)

무수히 많고 연속적인 값들 중에 맞추는 것

비지도 학습 (Unsupervised learning)

군집

반대로 위의 그림처럼 고양이, 강아지 그림(x)만 주어진 경우, 즉 정답(label)이 주어지지 않은 경우 데이터 자체에 정답이 없기 때문에 예측/분류가 불가능
하지만 주어진 특성에 대한 정보(x)만을 활용하여 비슷한 데이터끼리의 군집화(clustering)하는 머신러닝 알고리즘을 사용한 모델 생성 가능

  • 답이 없고 이 답을 맞추는 게 학습의 목적
    프로그램이 알아서 기준을 만들도록 하는 것이 비지도 학습
    프로그램이 정답 없이 비슷한 기준대로 묶음

강화 학습

profile
archive for me

0개의 댓글