인공지능(AI)은 현대 기술의 핵심으로 자리 잡고 있으며, 다양한 산업에서 활용되고 있다.
하지만 AI가 모두 같은 방식으로 작동하는 것은 아니다.
우리가 흔히 말하는 AI는 크게 머신러닝(ML), 그중에서도 딥러닝(DL), 그리고 강화학습(RL)으로 나뉜다.
이번 글에서는 이 세 가지 개념을 쉽게 이해할 수 있도록 정리해보겠다.
위 그림을 보면 AI는 가장 넓은 개념으로, 그 안에 머신러닝(ML)이 포함되어 있고, 머신러닝의 일부로 딥러닝(DL)이 위치한다. 강화학습(RL)은 머신러닝의 한 학습 방법으로 포함되지만, 딥러닝과는 별도로 연구되기도 한다.
👉 AI → ML → DL의 계층 구조를 가지며,
👉 RL은 ML과 DL 모두에서 적용될 수 있다.
이제 각각의 개념을 자세히 살펴보자.
머신러닝은 데이터에서 패턴을 학습하여 예측을 수행하는 알고리즘을 의미한다.
전통적인 프로그래밍 방식과 달리, 사람이 명시적으로 규칙을 정의하지 않아도 데이터를 기반으로 모델이 스스로 학습하는 것이 특징이다.
머신러닝은 크게
으로 나뉜다.
입력 데이터(X)와 그에 대응되는 정답(Y)이 주어진 상태에서 학습하는 방식
즉, 모델이 “무엇이 정답인지”를 알고 있는 상태에서 이를 맞추는 방향으로 훈련된다.
예를 들어, 고양이 사진에는 ‘고양이’, 강아지 사진에는 ‘강아지’라는 정답 레이블(label)이 함께 제공된다.
모델은 이러한 입력-정답 쌍을 반복해서 보며, 입력 이미지의 특징과 정답 간의 관계를 학습하여, 이후에 처음 보는 이미지가 들어왔을 때도 올바른 클래스를 예측할 수 있도록 훈련된다.
대표적인 알고리즘:
정답(Y) 없이 데이터(X)의 구조나 패턴을 스스로 파악하는 방식
위 그림처럼, 비슷한 데이터를 자동으로 군집(cluster)으로 묶는 것이 비지도 학습의 핵심이다.
입력에는 정답이 없지만, 알고리즘은 데이터의 유사성이나 분포를 바탕으로 의미 있는 구조를 찾아낸다.
대표적인 문제 유형:
대표적인 알고리즘:
시행착오를 통해 보상을 최대화하는 방향으로 학습하는 방식
에이전트(Agent)가 환경(Environment)과 상호작용하며 최적의 정책(Policy)을 학습하는 것이 핵심이다.
(예: 알파고, 로봇 제어, 게임 AI가 스스로 학습하는 과정)
(이 내용은 뒤에 강화학습 파트에서 더 자세히 다루겠다)
딥러닝은 머신러닝의 하위 개념으로,
인간의 뇌를 모방한 다층 인공신경망(Deep Neural Network, DNN)을 활용하여 복잡한 패턴을 학습하는 방법이다.
전통적인 머신러닝보다 더 많은 데이터와 연산량을 필요로 하지만, 뛰어난 성능을 보인다.
딥러닝의 주요 모델 :
: 이미지 및 영상 처리에 특화된 신경망으로, 합성곱(Convolution) 연산을 통해 특징을 추출한다.
(활용: 얼굴 인식, 자율 주행, 의료 영상 분석)
: 순차적 데이터(시계열 데이터, 자연어)를 처리하는 신경망으로, 내부 상태를 유지하며 문맥을 학습한다. LSTM, GRU 등의 변형 모델이 존재한다.
(활용: 음성 인식, 기계 번역, 주가 예측)
: 대규모 자연어 처리(NLP)에 특화된 모델로, 트랜스포머(Transformer) 기반의 GPT, BERT 등이 대표적이다.
(활용: 챗봇, 문서 요약, 코드 생성)
강화학습은 머신러닝의 한 분야로, 지도 학습 및 비지도 학습과는 다른 방식으로 작동한다.
스스로 시행착오를 통해 최적의 행동을 학습하는 방식
에이전트(Agent)가 환경(Environment)과 상호작용하며 보상(Reward)을 최대화하는 방향으로 학습하는 것이 특징이다.
에이전트(Agent) : 학습하는 주체로, 행동(Action)을 결정한다.
환경(Environment) : 에이전트가 상호작용하는 대상.
행동(Action) : 에이전트가 취할 수 있는 선택지.
보상(Reward) : 행동의 결과로 주어지는 값. 보상을 최대화하는 방향으로 학습.
정책(Policy) : 에이전트가 어떤 행동을 취할지를 결정하는 전략.
위 그림을 보면,
에이전트(강아지)가 환경(훈련장)과 상호작용하며, 행동 후 보상을 받고 학습해나가는 모습을 나타낸다. 올바른 행동을 했을 때 간식 보상을 받으며, 점점 더 나은 행동을 스스로 학습하게 된다.
인공지능은 단순한 개념이 아니라, 머신러닝 → 딥러닝 → 강화학습처럼 점점 더 발전하는 기술의 집합체다. 머신러닝은 데이터를 학습하여 패턴을 찾아내는 것이고, 딥러닝은 신경망을 활용하여 더 정교한 학습을 수행하며, 강화학습은 시행착오를 통해 최적의 전략을 학습한다.
최근 AI 개발의 중심은 딥러닝으로 이동하고 있다. 대형 언어 모델(LLM), 컴퓨터 비전, 생성형 AI 등 많은 혁신적인 기술들이 딥러닝을 기반으로 하고 있으며, 기업과 연구기관에서도 딥러닝을 중심으로 AI 모델을 개발하고 있다고 한다.
따라서 앞으로 블로그를 통해 딥러닝 위주의 더 자세한 내용을 다루면서 실전 프로젝트에도 적용해볼 예정이다.