AI, 딥러닝, 머신러닝

ROK·2022년 1월 25일
0

AIFFEL

목록 보기
13/17

딥러닝과 머신러닝

AI하면 가장 먼저 떠오르는 것이 머신러닝, 딥러닝이다.

[출처 : https://wendys.tistory.com/136]

위 그림은 AI 인공지능, 머신러닝, 딥러닝에 대해서 가장 잘 설명해주는 그림이다
AI 인공지능안에 머신러닝이 있고 머신러닝 안에 딥러닝이 있다.

인공 지능이란?

인공지능은 기계를 지능적으로 만드는 과학으로, 일반적으로 기계는 알고리즘을 기반으로 문제를 해결한다. AI 알고리즘은 규칙 생성 과정이 기존 알고리즘과 차이가 있다.
기존 알고리즘은 개발자가 입력에 대한 출력을 정의하는 특정 규칙을 설정하는 반면 AI 알고리즘은 자체 규칙 시스템을 구축한다.

머신 러닝이란?

머신러닝은 정확한 결정을 내리기 위해 제공된 데이터를 통해 스스로 학습할 수 있다. 처리할 정보에 대해 많이 학습할 수 있도록 많은 양의 데이터를 입력해야한다.
일반적으로 머신러닝은 알고리즘을 이용해 데이터를 분석하고, 학습하고, 학습한 내용을 기반으로 판단이나 예측을 한다.
컴퓨터가 대량의 데이터와 알고리즘을 통해 학습하고 작업을 수행하도록 하는 것이 목표이다.

딥 러닝이란?

딥러닝은 인공신경망에서 발전한 형태의 인공지능이다. 뇌의 뉴런(신경망)과 유사한 정보 입출력 계층을 활용해 데이터를 학습한다. 기본적인 신경망조차 엄청난 양의 연산을 필요로 하기 때문에 과거에는 개발에 어려움이 있었지만, 토론토대학의 제프리 힌튼 교수 연구팀 등의 기관들이 연구를 통해 슈퍼컴퓨터를 기반으로 딥러닝 개념을 증명하는 알고리즘 병렬화를 성공했다. 이 병렬 연산에 최적화된 GPU의 등장으로 인해 신경망의 연산 속도는 획기적으로 가속화하여 딥 러닝 기반 인공 지능이 등장하게 되었다.

내재적 표현

위 사진은 꽃이라는 이미지 데이터를 네 가지 방법으로 표현한 사진이다.
1. 데이터는 분자 형태로 표현할 수 있다. 분자 형태는 실제 데이터 그 자체, 데이터가 존재하는 형태 그대로의 표현이라고 할 수 있다.
2. 이미지로 표현 일반적으로 컴퓨터에서 이미지를 표현할 때는 배열로 표현해 RGB 색상까지 3차원 배열로 표현할 수 있다. 흑백 사진이라면 한 개의 채널인 2차원 배열로 표현할 수 있다.
3. 로 표현, 해당 데이터의 특징(feature)을 각 열에 표시하고, 각 열에 대한 값을 표시하는 표로 나타낼 수 있다. 각 컬럼의 특징이 적절하도록 지정해줘야 한다.
4. 카테고리로 표현, 카테고리는 머신러닝에서 주로 예측하고자 하는 값으로 사용된다.
데이터를 카테고리로 표현하려면 어떤 카테고리가 있는지, 어떤 카테고리에 넣을지를 정하는 과정이 필요하다. 꽃이라는 데이터가 적절하게 들어갈 수 있는 카테고리를 지정해줘야 한다.

위 네 가지 표현 방법은 계층적(Hierarchical)인 관계를 갖고 있다.
1번에서 4번으로 갈 수록 사람의 개입이 필요한 표현이다.

분자와 이미지는 특별한 가공이 들어가지 않은 데이터이고, 표와 카테고리는 사람의 개입이 들어간 추상적이고 함축적인 내재적 표현을 할 수 있는 데이터이다.

딥러닝의 목표는 학습된 함수를 사용하여 내재적 표현을 뽑아내는 것이다. 위 네 가지 표현에서 표와 카테고리를 사람의 개입없이 딥러닝으로 나타낼 수 있도록 만드는 것이 궁극적인 목표이다.

이미지 영역에서 딥러닝 모델들은 이미지를 입력받게 되면 신경망 내부의 함수를 통해 Feature, Representation이라고 할 수 있는 벡터값을 추출해낸다.
대표적으로 VGG16 모델은 이미지 한 장을 입력받으면 데이터의 특징들을 뽑아내 3차원 배열 변환을 진행하다 마지막에 (1x1x1000) 1000개의 숫자로 이루어진 1차원 형태의 벡터를 출력한다.
[출처 : https://www.researchgate.net/figure/Fig-A1-The-standard-VGG-16-network-architecture-as-proposed-in-32-Note-that-only_fig3_322512435]

입력된 데이터의 크기가 얼마든 간에 1,000개의 숫자로 이미지의 내재된 특성들을 모두 표현할 수 있게 된다. 이 것이 데이터의 내재된 표현이고, 이 과정이 데이터에서 좋은 표현을 추출해내는 것이다.

데이터의 내재된 표현

데이터가 담고 있는 정보의 총체 혹은 함의를 나타내는 표현

데이터에서 표현을 추출한다는 것

데이터에서 표현을 추출한다는 것은 데이터의 내재된 추상적인 표현을 추출한다는 것이다. 예를 들어 고양이 이미지에서 좋은 표현을 추출하기 위해서는 픽셀에서 고양이를 담고 있는 벡터를 추출할 수 있어야 한다.

딥러닝의 본질

데이터에서 내재된 표현을 추출하는 것

profile
하루에 집중하자

0개의 댓글