기계 학습은 인공지능(Artificial Intelligence, AI)의 한 분야로, 명시적인 프로그래밍 없이 데이터를 통해 학습하고 성능을 향상시키는 컴퓨터 알고리즘의 연구입니다.
| 유형 | 알고리즘 | 설명 |
|---|---|---|
| 선형 모델 | 선형 회귀(Linear Regression), 로지스틱 회귀(Logistic Regression) | 입력 변수와 출력 변수 사이의 선형 관계를 모델링하며, 회귀(연속 값 예측) 또는 분류(이진 값 예측)에 사용됩니다. |
| 트리 기반 모델 | 의사 결정 나무(Decision Tree), 랜덤 포레스트(Random Forest) | 데이터를 규칙 기반으로 분할하여 예측을 수행하며, 해석이 용이하고 비선형 관계 모델링에 강점을 가집니다. |
| 인스턴스 기반 모델 | K-최근접 이웃(K-Nearest Neighbors, KNN) | 새로운 데이터 포인트를 가장 가까운 K개의 훈련 데이터 인스턴스에 기반하여 분류 또는 회귀합니다. |
| 확률 기반 모델 | 나이브 베이즈(Naïve Bayes) | 베이즈 정리(Bayes' Theorem)를 기반으로 하며, 특성들 간의 독립을 가정하여 분류를 수행합니다. |
| 군집화 모델 | K-평균 군집화(K-Means Clustering) | 데이터를 K개의 클러스터로 나누는 비지도 학습 알고리즘입니다. |
기계 학습은 데이터의 레이블(Label) 유무와 피드백 방식에 따라 크게 세 가지 주요 유형으로 분류됩니다.
| 분류 | 특징 (데이터 제공 방식) | 목표 및 사용 사례 | 주요 알고리즘 (학습 기술) |
|---|---|---|---|
| 지도 학습 (Supervised Learning, SL) | 정답(Label)이 있는 훈련 데이터를 사용합니다. | 입력 와 정답 간의 관계 를 학습하여 미지의 데이터를 예측합니다. | 회귀: 선형 회귀, SVR 분류: 로지스틱 회귀, SVM, 앙상블 기법 (Random Forest, GBM) |
| 비지도 학습 (Unsupervised Learning, UL) | 정답(Label)이 없는 훈련 데이터를 사용합니다. | 데이터의 내재된 구조, 패턴, 분포를 파악하여 데이터 자체의 특성을 이해합니다. | 군집화: K-평균, DBSCAN 차원 축소: PCA, t-SNE |
| 강화 학습 (Reinforcement Learning, RL) | 환경과의 상호작용을 통해 보상(Reward)을 받고, 이를 최대화하는 행동 정책을 학습합니다. | 특정 목표를 달성하기 위해 최적의 의사결정 순서를 학습합니다. | 가치 기반: Q-러닝, SARSA 정책 기반: 정책 경사 액터-크리틱: A2C, A3C |
무인 운전 장비 개발은 주로 심층 학습(Deep Learning)과 강화 학습(RL)이 핵심 기술로 활용됩니다.
무인 운전은 크게 인지 판단 제어의 3단계로 이루어집니다.
| 단계 | 주요 기능 | 기계 학습 적용 기술 |
|---|---|---|
| 인지 (Perception) | 주변 환경 인식, 객체 탐지 및 분류, 차선 감지 | CNN 기반의 객체 탐지 및 의미론적 분할 (Semantic Segmentation) |
| 판단 (Decision) | 주행 경로 계획, 돌발 상황 대처, 행동 결정 | 강화 학습(RL), 심층 신경망(DNN) 기반의 시퀀스 모델링 및 예측 |
| 제어 (Control) | 차량의 조향, 가속, 제동 장치를 실제로 조작 | 강화 학습 기반의 정밀 제어 정책 학습 |