Machine Learning 1

김은비·2021년 9월 23일
0

Machine Learning

목록 보기
1/6
post-thumbnail

> 이 글은 스탠퍼드대학교 Andrew Ng 교수님의 강의를 수강한 것을 토대로 작성한 글입니다

📌 Introduction

What is Machine Learning?

  • 컴퓨터가 명시적인 프로그램 없이 스스로 학습할 수 있는 능력을 연구하는 분야

  • "A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E."

    컴퓨터 프로그램이 일정 수준의 과제를 수행 할 수 있는 성능(P)으로 작업(T)을 수행할 때 경험(E)이 증가함에 따라 과제를 수행 할 수 있는 성능(P)이 개선될 수 있다. 이때, 이를 경험(E)을 통해 학습한 프로그램이라고 한다.

📌 Supervised Learning

지도 학습

  • 정답이 있는 데이터를 활용해 데이터를 학습시키는 것
    • 회귀 문제 (regression problem)
      = 연속된 값을 가진 결과를 예측하는 것 (ex- 집값)

    • 분류 문제 (classification problem)
      = 0 또는 1, 악성 또는 양성과 같이 불연속적인 결과값을 예측하는 것 (ex- 암진단, 스팸메일분류)

📌 unsupervised learning

비지도 학습

  • 정답 라벨이 없는 데이터를 비슷한 특징끼리 클러스터링(군집화) 하여 새로운 데이터에 대한 결과를 예측하는 방법
    • 클러스터링 알고리즘 (clustering algorithm)
      = 데이터들을 서로 다른 클러스터로 구분 짓는 것 (ex- 유전자 검사)

📌 Model and Cost Function

모델 표현 (Model Representation)

  • 우선 모델(Model)이란, 어떤 현상을 수학적으로 표현하는 것을 의미

    데이터 집합(x)이 주어졌을 때, 함수 h : X → Y를 학습하여 h(x)가 해당 결과(y)값에 대한 "좋은" 예측 변수가 되도록 하는 것 (여기서 h는 가설이라 칭함)
    이것을 선형 회귀(Linear Regression) 라고 부름

비용함수 (Cost Function)

  • 원래의 값과 가장 오차가 작은 가설함수 를 도출하기 위해 사용되는 함수

📌 Gradient Descent Algorithm

경사 하강 알고리즘

  • 비용 함수 J(θ(0),θ(1))를 최소화 하는 θ를 구하는 알고리즘
  • 사용 빈도수 多
profile
레벨업중...

0개의 댓글