[딥러닝]머신러닝과 딥러닝

권경민·2023년 7월 8일

딥러닝

목록 보기

1/8

1장 머신러닝과 딥러닝

1. 인공지능, 머신러닝과 딥러닝

인공지능이란?
인간의 지능을 모방하여 사람이 하는 일을 컴퓨터가 할 수 있도록 하는 기술

인공지능을 구현하는 방법

머신러닝
- 주어진 데이터를 인간이 먼저 처리(전처리)함.
- if 이미지 데이터라면, 그것을 컴퓨터가 인식할 수 있도록 사람이 학습 데이터를 준비해야함.
- 범용적 목적을 위해 제작됨.
- 데이터의 특징을 스스로 추출 불가 ➡️ 인간이 처리해야함.
딥러닝
- 인간의 작업을 생략
- 대량의 데이터를 신경망에 적용하면 컴퓨터가 스스로 분석 후 답을 찾음.

머신러닝과 딥러닝의 차이

동작원리

머신러닝 : 입력 데이터에 알고리즘을 적용해 예측 수행
딥러닝 : 정보를 전달하는 신경망을 사용해 데이터 특징 밀 관계 해석

재사용

머신러닝 : 입력 데이터 분석을 위해 다양한 알고리즘 사용 / 동일 유형의 데이터 분석을 위한 재사용은 불가
딥러닝 : 구현된 알고리즙은 동일 유형의 데이터 분석 재사용이 가능

데이터

머신러닝 : 일반적으로 수천개 데이터 필요
딥러닝 : 수백만개 이상의 데이터 필요

훈련 시간

머신러닝 : 단시간
딥러닝 : 장시간

결과

머신러닝 : 점수 or 분류 등 숫자값
딥러닝 : 점수/텍스트/소리 등 어떤 것이든 가능

2. 머신러닝이란?

인공지능의 한 분야로, 컴퓨터 스스로 대용량 데이터에서 지식이나 패턴을 찾아 학습 하고 예측을 수행하는 것
즉, 컴퓨터가 학습할 수 있게 하는 알고리즘고 기술을 개발하는 분야

2.1 머신러닝의 학습 과정

머신러닝은 크게 학습단계와 예측단계로 구분
학습단계 : 훈련 데이터를 머신러닝 알고리즘에 적용하여 학습 ➡️ 이 학습 결과로 모형이 생성됨.
예측단계 : 학습단계에서 생성된 모형에 새로운 데이터를 적용해 결과 예측

💡 특성 추출이란?
컴퓨터가 입력받은 데이터를 분석하여 일정한 패턴이나 규칙을 찾아내려면,
사람이 인지하는 데이터 -> 컴퓨터가 인지할 수 있는 데이터로의 변환이 필요.

이 때, 데이터별 특징을 찾아내고, 이를 토대로 데이터를 벡터로 변환하는 작업을 말함.

머신러닝의 주요 구성요소

데이터
- 머신러닝이 학습모델 만들때 사용
- 훈련데이터셋 - 테스트데이터셋으로 분리하여 사용
- 훈련데이터셋을 훈련데이터셋과 검증데이터셋으로 또 분리하기도 함.
- 보통 데이터의 80%는 훈련용, 20%는 테스트용으로 분리.
모델
- 머신러닝 학습단계에서 얻은 최종 결과물
- 가설이라고도 함

모델의 학습 절차
1. 모델(or 가설) 선택
2. 모델 학습 및 평가
3. 평가를 바탕으로 모델 업데이트

💡 검증 데이터셋을 사용하는 이유
훈련 데이터셋으로 모델을 학습시킨 후 모델이 잘 예측하는지 그 성능을 평가하기 위해 사용

💡 모델 성능평가가 필요한 이유
1. 테스트 데이터셋에 대한 성능 가늠
2. 과적합 방지

2.2 머신러닝 학습 알고리즘

지도학습 : 정답을 알려주고 학습
비지도학습 : 정답을 알려주지 않고 특징이 비슷한 데이터를 클러스터링하여 예측하는 학습방법
강화학습 : 자신의 행동에 대한 보상으로 학습

3. 딥러닝이란?

인간의 신경망 원리를 모방한 심층 신경망 이론을 기반으로 고안된 일종의 머신러닝 방법

딥러닝의 특징

머신러닝과는 달리, 인간의 뇌를 기초로 설계함.
인간의 뇌가 뉴런과 시냅스로 구성된 것에서 착안하여 컴퓨터에 뉴런과 시냅스 개념을 적용
각각의 뉴런은 복잡히 연결된 수많은 뉴런을 병렬 연산하여 기존에 컴퓨터가 수행하지 못했던 음성/영상 인식 등의 처리 가능.

그림 설명
수상돌기 : 뉴런에서 자극을 받아들이고 이 자극을 전기적 신호 형태로 세포체와 축삭돌기에 보냄
시냅스 : 신경 세포들이 이루는 연결 부위, 한 뉴런의 축삭돌기와 다음 뉴런의 수상돌기가 만나는 부분
축삭돌기 : 다른 뉴런(수상돌기)에 신호를 전달하는 기능을 하는 뉴런의 한 부분.
축삭말단 : 전달된 전기 신호를 받아 신경 전달 물질을 시냅스 틈새로 방출

3.1 딥러닝 학습 과정

데이터 준비
모델(모형) 정의
- 이 단계에서 신경망을 생성함.
- 은닉층 개수가 많을수록 성능은 좋아지지만, 너무 많으면 과적합 발생 우려
- 은닉층 개수에 따른 성능 ↔️ 과적합 (상충관계)
모델(모형) 컴파일
- 이 단계에서 활성화함수, 손실함수, 옵티마이저 선택
- 데이터 형태에 따라 다양한 옵션 가능
- if 훈련 데이터셋 형태 - {연속형 : MSE, 이진분류 : cross entropy}
모델(모형) 훈련
- 이 단계에서 한 번에 처리할 데이터양을 지정.
- 배치사이즈 / 에포크 선택
- 훈련과정에서 값의 변화를 확인하며 파라미터/하이퍼파라미터에 대한 최적값 찾아야 함.
모델(모형) 예측
- 생성한 모델에 검증데이터셋을 적용해 실제로 예측을 진행하는 단계

💡 Epoch란?
인공 신경망에서 전체 데이터에 대해서 순전파와 역전파가 끝난 상태
ex) 전체 데이터를 하나의 문제지에 비유한다면 문제지의 모든 문제를 끝까지 다 풀고, 정답지로 채점을 하여 문제지에 대한 공부를 한 번 끝낸 상태

💡 Batch_size란?
몇 개의 데이터 단위로 매개변수를 업데이트 하는지를 말함.

ex) 문제지에서 몇 개씩 문제를 풀고나서 정답지를 확인하느냐의 문제. 기계 입장에서는 실제값과 예측값으로부터 오차를 계산하고 옵티마이저가 매개변수를 업데이트함.
여기서 중요한 포인트는 업데이트가 시작되는 시점 = 정답지/실제값을 확인하는 시점

딥러닝의 핵심 구성 요소

신경망
심층 신경망에는 데이터셋의 어떤 특성이 중요한지 스스로에게 가르치는 능력이 있음.

역전파
가중치 값을 업데이트 하는 역할
역전파 계산 과정에서 사용되는 미분이 성능에 영향을 미치는 주요 요소임.
- 오차를 각 가중치로 미분

3.2 딥러닝 학습 알고리즘

지도학습
- 이미지분류
  - 이미지 or 비디오상의 객체를 식별하는 컴퓨터 비전 기술
  - 목적에 따라 이미지분류/이미지인식/이미지분할로 나뉨
  ex) CNN : 합성곱 신경망
- 시계열 데이터
  - RNN(순환신경망) : 시간에 따른 데이터에 사용, but 역전파 과정에서 기울기 소멸 문제 발생
  - LSTM : RNN의 문제점을 개선하고자 게이트 3개 추가. (망각게이트/입력게이트/출력게이트)
비지도학습
- 워드임베딩
  - 자연어를 벡터로 표현하여 컴퓨터가 이해할 수 있도록 변환
    ex) Word2Vec, GloVe
- 군집
  - 아무 정보가 없는 상태에서 데이터를 분류하는 방법
  - 신경망에서 군집 알고리즘 사용
전이학습
사전학습모델을 이용하여 미세조정기법을 통해 학습시키는 방법
- 사전학습모델 : 풀고자 하는 문제와 비슷하면서 많은 데이터로 이미 학습되어있는 모델
  ex) VGG, 인셉션, MobileNet

권경민

지식을 흡수하고 싶다!!!

다음 포스트