인공지능 기초부터 최신 딥러닝 트렌드까지

박경민·2023년 3월 4일
0

[Sessions]

목록 보기
1/7
post-thumbnail

인공지능이란?

인공지능이란 기능을 가진 기계.

인공지능에 대한 정의는 학자마다 조금씩 다르기도 하다. 많은 인공지능에서 가장 촉망받는 분야가 ML, 그 안에서도 DL 이다. 딥러닝이 가장 주목받는 분야인 이유는 그 중에서도 가장 정확도가 높은 방법론이기 때문이다.

딥러닝이란?

딥러닝은 기계학습의 한 갈래로, NN에 기반하여 정확도가 매우 뛰어난 기술 중 하나이다. 이미 여러 분야에서 인공지능은 인간을 뛰어넘게 되었고, 최근에는 AWS 와 같은 클라우드 서비스를 이용하여 개인도 빠르게 인공지능을 학습하고 배포할 수 있게 되었다.

딥러닝의 역할은 정확히 무엇일까?

현대의 딥러닝 모델은 Universal Approximation Theorem에서 출발했다. 위 이론의 핵심은, 특정한 조건을 만족하는 뉴럴 네트워크는 어떠한 함수도 근사할 수 있다는 것이다. 예컨대 데이터만 충분하다면 실제로 매우 복잡한 함수도 충분히 예측할 수 있다는 것이다. 입력과 출력만 보고도 내재된 함수를 예측한다는 점이 특징이다.

인간의 입력 (시각, 촉각, 청각) 출력 (몸짓, 발화) 를 학습 데이터를 잘 구성한다면 인간을 닮은 무언가를 딥러닝 모델로 학습할 수 있지 않을까 하는 생각이다.

인공지능 모델이란?

좋은 모델은 정확한 예측을 하는 모델이다. 예측한 결과와 실제 정답과 차이를 계산하는 MSE 비용이 낮은 상태를 뜻한다.

이러한 인공지능을 학습시키려면 '미분'이 매우 중요하다. MSE 등 비용함수를 최소화하는 과정이 필요하다는 것. 이를 모델을 업데이트한다고 한다. 미분을 해서 기울기를 구한 후, 타고 내려가며 비용을 줄이는 과정이 필요하므로 이를 경사하강법이라 한다. 이때 손실함수를 가중치로 미분하여 얻은 값으로 모델을 업데이트한다.

행렬의 중요성

GPU는 딥러닝에서 중요한 행렬을 빨리 연산하기 위해 고안되고 있다. 특히나 인공지능에서 특징마다 가중치를 계산하는데 행렬을 사용한다.

특징의 중요성을 가중치로 표현한다. 어떤 선택지가 최고의 선택지가 될지는 행렬의 곱으로 연산이 가능하다.

다만 현대의 딥러닝 모델은 매우 많은 레이어와 많은 행렬 곱셈으로 수행되므로 GPU 자원을 확보하기 위해 AWS 와 같은 클라우드 서비스를 활용한다.

딥러닝의 활용 분야

1. 이미지 분류 분야

2012 등장한 AlexNet 은 GPU 기반 CNN 모델이 이미지 분야에서 압도적인 성능을 보여준다는 기초적 사례가 되었다. 추후에는 ResNet 으로 정확도도 올렸다.
AmazonGo의 Computer Vision 시스템이 있다.

2. 자연어처리, 음성인식

Transformer 논문이 현재 가장 강력하다. 음성인식 분야에서도 활용되며, Amazon Alexa 서비스에서 확인할 수 있다.

3. 이미지 생성

2014년도 GAN 논문이 대표적이다. 생성자가 만드는 이미지를 판별자가 가짜 이미지라고 분류해내지 못하도록 하여 실제에 근접한 사진을 만드는 것이 목표이다. DCGAN 으로는 고해상도, StyleGAN 에서는 1024 X 1024 이상의 해상도를 이미지를 생성할 수 있게 되었다.

4. 이미지 분할

U-Net 아키텍쳐가 시조, 아직까지 기초적인 모델이 활용되고 있다.

최신 트렌드

1. 대규모 모델, 클라우드

ECCV 논문에 따르면 대규모 모델과 수천 만 개 이상의 큰 데이터는 폭발적인 정확도를 보인다. 거대한 모델은 파라미터의 수가 이미 10억개를 넘어선 것에서 확인할 수 있고, 이를 구현하기 위해 클라우드 서비스가 활성화되었다. 레이블링 작업에는 Amazon Mechanical Turk 와 같은 서비스도 떠올랐다.

2. Transformer 대중화

자연어처리 분야 트랜스포머가 이미지 분류에도 넘어왔다.

3. 전이학습

대규모 데이터세트로 학습된 모델을 내가 가진 작은 데이터세트와 합쳐 재학습 시키는 방식이다. 짧은 시간에 우수한 성능을 얻을 수 있다.

본 포스팅은 유튜브 동빈나님의 컨텐츠 를 바탕으로 제작되었습니다.

profile
Mathematics, Algorithm, and IDEA for AI research🦖

0개의 댓글