UDL 1. Introduction (Kor)

박종명 ·4일 전
0

Chapter 1

Introduction

인공지능(AI)은 지능적인 행동을 모방하는 시스템을 구축하는 데 중점을 둡니다.
이는 논리, 탐색, 확률적 추론 등을 기반으로 하는 다양한 접근 방식을 포함합니다.
머신러닝은 AI의 하위 분야로, 관찰된 데이터를 기반으로 수학적 모델을 학습하여 결정을 내리는 방법을 연구합니다. 이 분야는 폭발적인 성장을 이루었으며, 현재는 ai라는 용어와 거의 동의어로 사용되고 있습니다.

deep neural network( 간단히 deep network)는 머신러닝 모델의 한 종류이며, 이러한 모델을 데이터에 맞게 학습시키는 과정을 딥러닝이라고 합니다. 딥 네트워크는 가장 강력하고 실용적인 머신러닝 모델로, 일상생활에서 자주 접할 수 있습니다. 예를 들어, 자연어 처리 알고리즘을 사용하여 텍스트를 다른 언어로 번역하거나, 컴퓨터 비전 시스템을 통해 특정 객체의 이미지를 검색하거나, 음성 인식 인터페이스를 통해 디지털 어시스턴트와 대화하는 등의 응용 분야가 모두 딥러닝 기술에 의해 구동됩니다.

이 책 제목에서 알 수 있듯이, 이 분야를 처음 접하는 독자가 딥러닝의 원리를 이해할 수 있도록 돕는 것을 목표로 합니다. 이 책은 지나치게 이론적이지도 않고(증명 없음), 지나치게 실용적이지도 않습니다 (코드 거의 없음). 목표는 근본적인 아이디어를 설명하는 것이며, 이 책을 읽은 후 독자는 기존의 성공적인 사례가 없는 새로운 상황에도 딥러닝을 적용할 수 있는 능력을 갖추게 될 것입니다.

머신러닝 방법은 크게 세 가지 영역으로 나눌 수 있습니다. 지도 학습, 비지도 학습, 강화 학습 입니다. 작성 시점기준 이 세 가지 영역의 최첨단 방법은 모두 딥러닝에 의존하고 있습니다. 이 introduction 1장에서는 세 가지 영역을 높은 수준에서 설명하며, 책의 구성에서도 대략적으로 반영됩니다.
그림 1.1

1.1 Supervised learning

지도 학습 모델은 입력 데이터로부터 출력 예측으로의 매핑을 정의합니다.
다음 섹션에서는 입력, 출력, 모델 자체, 그리고 "모델 학습(training)"의 의미에 대해 논의합니다.

1.1.1 Regression and classification problems

그림 1.2는 여러 회귀와 분류 문제를 보여줍니다. 각 사례에서, 실세계에세 의미 있는 입력(문장,음성 파일, 이미지 등)이 숫자 벡터로 인코딩됩니다. 이 벡터는 모델의 입력을 형성합니다. 모델은 입력을 출력 벡터로 매핑한 현재로서는 입력과 출력에 초점을 맞추며, 모델을 숫자 벡털를 입력받아 또 다른 숫자 벡터를 반환하는 블랙박스(Black Box)로 취급합니다.

그림 1.2a의 모델은 집의 면적과 침실 수와 같은 입력 특성에 기반해 집의 가격을 예측합니디다.
이는 모델이 연속적인 숫자(카테고리 할당이 아닌)를 반환하므로 회귀 문제(regression problem)입니다.

그림1.2c의 모델은 레스토랑 리뷰가 포함된 텍스트 문자열을 입력받아 리뷰가 긍정적인지 부정적인지를 예측합니다. 이는 입력을 두개의 카테고리 중 하나로 할당하려 하기 때문에 이진 분류 문제(binary classification problem)입니다. 출력 벡터는 입력이 각 카테고리에 속할 확률을 포함합니다.

그림 1.2d와 1.2e는 다중 클래스 분류 문제(multiclass classification problems)를 나타냅니다. 여기서 모델은 입력을 N>2개의 카테고리 중 하나로 할당합니다. 첫 번째 사례에서는 입력이 오디오 파일이며, 모델은 파일이 어떤 음악 장르인지 예측합니다. 두 번째 사례에서는 입력이 이미지이고, 모델은 이미지가 어떤 객체를 포함하고 있는지 예측합니다. 각 경우에서 모델은 N개의 카테고리에 대한 확률을 포함하는 크기 N의 벡터를 반환합니다.

그림 1.2

출처
https://udlbook.github.io/udlbook/

profile
안녕하세요. 자율주행을 공부하고 있는 학생입니다.

0개의 댓글