[DEEP LEARNIG with Python] 01장. 딥러닝이란 무엇인가?

ByungJik_Oh·2025년 4월 20일
post-thumbnail

📖 01. 딥러닝이란 무엇인가?

🗝️ 핵심내용

  • 핵심 개념에 대한 고수준 정의
  • 머신러닝의 발전 과정
  • 딥러닝이 인기를 끈 주요 원인과 미래의 가능성

📑 인공지능과 머신러닝, 딥러닝

인공지능 분야 : 보통의 사람이 수행하는 지능적인 작업을 자동화하기 위한 연구활동으로, AI는 머신러닝과 딥러닝을 포괄하는 종합적인 분야이다.

머신러닝 : 규칙과 데이터를 통해 해답을 찾는 전통적인 프로그래밍과 반대로, 데이터와 해답을 보고 훈련(training)되어 규칙을 찾는 것.

데이터에서 표현을 학습하는 방법

  • 입력 데이터 포인트 : 이미지 태깅에 관한 작업이라면 데이터 포인트는 사진
  • 기대 출력 : 이미지 작업에서 기대하는 출력은 '강아지', '고양이' 등과 같은 태그
  • 알고리즘의 성능을 측정하는 방법 : 알고리즘의 현재 출력과 기대 출력 간의 차이를 결정하기 위해 필요하며, 측정값은 알고리즘의 작동방식을 교정하기 위한 신호로 피드백되는데 이러한 수정단계를 학습(learning)이라고 한다.

딥러닝 : 층(layer)를 겹겹이 쌓아 올려 구성한 신경망(neural network)라는 모델을 사용하여 층 기반 표현을 학습하는 것.

딥러닝의 작동 원리

  1. 주어진 입력을 각 층의 가중치(weight)에 따라 예측값을 도출

  2. 손실 함수(loss function)를 통해 예측값과 실제 타깃의 차이를 점수로 계산

  3. 옵티마이저(optimizer)를 사용하여 손실 점수가 감소되는 방향으로 가중치 값을 조정

  4. 훈련 반복(training loop)을 통해 손실 함수를 최소화하는 가중치값 산출.


📑 딥러닝 이전: 머신러닝의 간략한 역사

확률적 모델링(probabilistic modeling)

로지스틱 회귀(logistic regression) : 가장 간단하고 다목적으로 활용가능한 분류 모델

커널 방법(kernel method)

커널 함수(kernel function) : 새로운 공간에서의 두 데이터 포인트 사이의 거리를 효율적으로 계산하는 함수

서포트 벡터 머신(Support Vector Machine, SVM) : 커널 함수를 사용하여 초평면과 각 클래스의 가장 가까운 데이터 포인트 사이의 거리가 최대가 되는 결정 경계(decision boundary)를 찾는 분류 알고리즘

결정트리, 랜덤 포레스트, 그레이디언트 부스팅 머신

결정 트리(decision tree) : 플로차트 같은 구조를 가지며 입력 데이터 포인트를 분류하거나 주어진 입력에 대해 출력값을 예측하는 모델

랜덤 포레스트(random forest) : 서로 다른 결정 트리를 많이 만들고 그 출력을 앙상블하는 방법을 사용하는 모델

그레이디언트 부스팅 머신(gradient boosting machine) : 랜덤 포레스트와 비슷하게 결정 트리를 앙상블하는 것을 기반하는 모델이며, 이전 모델에서 놓친 데이터 포인트를 보완하는 개로운 모델을 반복적으로 훈련함으로써 머신러닝 모델을 향상하는 방법인 그레이디언트 부스팅(gradient boosting)을 사용한다.

딥러닝의 특징

특성 공학(feature engineering)?
기존의 머신러닝 방법들로 처리하기 용이하게 사람이 초기 입력 데이터를 여러 방식으로 변환해야 한다. 즉, 데이터의 좋은 표현을 수동으로 만드는 것.

  • 딥러닝은 머신러닝에서 가장 중요한 단계인 특성 공학을 완전히 자동화하기 때문에 문제를 더 해결하기 쉽게 만들어준다.
  • 층을 거치면서 점진적으로 더 복잡한 표현이 만들어진다.
  • 위와 같은 점진적인 중간 표현이 공동으로 학습된다.

🔗 출처

https://www.gilbut.co.kr/book/view?bookcode=BN003496


profile
精進 "정성을 기울여 노력하고 매진한다"

0개의 댓글