『Machine Learning 개론』 Part 1. Introduction to Machine Learning

김도연·2024년 7월 24일
0

LG AI Academy

목록 보기
7/9
post-thumbnail

기계학습의 정의 및 역사

기계학습의 정의

기계학습은 인공지능의 한 분야로, 실험적으로 얻은 데이터로부터 점점 개선되는 알고리즘을 설계하고 개발하는 학문입니다. 기계학습의 목표는 데이터로부터 학습하여 성능을 향상시키는 것입니다. 이를 통해 기계학습 시스템은 주어진 작업(T)을 통해 성능 지표(P)를 개선할 수 있습니다.

인공지능: 사람과 같은 지능을 만들기 위한 학문.
기계학습: 데이터로부터 스스로 개선되는 알고리즘을 다루는 학문.
딥러닝: 신경망 기반의 기계학습의 한 분야로, 특히 깊은 신경망(Deep Neural Networks)을 사용.

기계학습의 역사

  1. 허벌트 사이먼 (Herbert Simon): 기계학습을 경험을 통해 성능을 높이는 시스템이라고 정의.
  2. Arthur Samuel: 체스 프로그램을 개발하면서 기계가 직접 프로그래밍 없이 학습할 수 있는 능력을 강조.
  3. 탐 미첼 (Tom Mitchell): 기계학습을 T(작업), P(성능 지표), E(경험 데이터)로 정의. 이는 작업, 성능 지표, 학습 데이터를 명확히 정의함으로써 기계학습 문제를 설정.

기계학습과 전통적 프로그래밍의 비교

전통적 프로그래밍: 코드와 입력을 컴퓨터에 주어 결과를 도출.
기계학습: 입력과 원하는 출력을 컴퓨터에 주어 프로그램을 생성.

예시: 스펠체킹 프로그램

전통적 방식: 규칙과 예외를 일일이 코드로 작성.
기계학습 방식: 올바른 입력-출력 쌍을 학습 데이터로 주어 알고리즘이 규칙을 학습.

기계학습의 중요한 개념: 일반화

일반화란, 학습된 모델이 학습 데이터 외의 새로운 데이터에서도 좋은 성능을 보이는 능력입니다. 이는 기계학습의 핵심 목표입니다.

일반화의 예시

아이들은 다양한 나무를 보면서 공통된 특성을 파악하여 ‘나무’라는 일반적인 개념을 형성합니다. 이와 마찬가지로 기계학습 모델은 학습 데이터를 통해 패턴을 파악하여 새로운 데이터에 적용할 수 있습니다.

기계학습의 종류

  1. Supervised Learning (지도학습): 입력(X)과 그에 대응하는 출력(Y)의 쌍을 학습하여 모델을 구축. 주로 분류(Classification)와 회귀(Regression) 작업에 사용.
  2. Unsupervised Learning (비지도학습): 레이블이 없는 데이터(X)만을 사용하여 모델을 학습. 주로 클러스터링(Clustering)과 이상 탐지(Anomaly Detection) 작업에 사용.
  3. Semi-Supervised Learning (반지도학습): 일부 데이터는 레이블이 있고, 일부는 레이블이 없는 데이터를 사용하여 학습.
  4. Reinforcement Learning (강화학습): 에이전트가 환경과 상호작용하며 보상을 통해 학습.

Supervised Learning (지도학습)

입력(X): 예측하려는 데이터.
출력(Y): 예측 대상 데이터.
대표 작업: 분류(Classification), 회귀(Regression).

Unsupervised Learning (비지도학습)

입력(X): 레이블이 없는 데이터.
대표 작업: 클러스터링(Clustering), 이상 탐지(Anomaly Detection), 밀도 추정(Dense Estimation).

Semi-Supervised Learning (반지도학습)

입력(X): 일부는 레이블이 있고, 일부는 레이블이 없는 데이터.
레이블링: 비용과 시간 절약을 위해 일부 데이터만 레이블링.

Reinforcement Learning (강화학습)

에이전트와 환경: 에이전트가 환경과 상호작용하며 학습.
보상(Reward): 에이전트의 행동에 대한 피드백으로 학습.
예시: 바둑, 체스 등.

참고 도서

기계학습을 공부하는 데 유용한 책들을 소개합니다. 많은 책들이 온라인 튜토리얼이나 오픈소스 코드를 제공하므로 이를 활용하여 공부할 수 있습니다.

초보자용: 기초부터 시작하는 R 또는 Python 기반의 예제를 제공.
심화용: 기계학습 이론과 알고리즘을 깊이 있게 다룸.

이상으로 기계학습의 정의와 종류, 기계학습과 전통적 프로그래밍의 차이, 일반화의 중요성, 기계학습의 다양한 종류, 참고 도서에 대해 살펴보았습니다. 다음 강의에서는 기계학습의 구체적인 알고리즘과 응용에 대해 다룰 예정입니다.

이 요약본은 LG Aimers Academy의 교육 내용을 바탕으로 작성되었습니다.

0개의 댓글