기출 ML

agnusdei·2025년 11월 11일

Enterprise Information Technology

목록 보기

69/74

기계 학습은 인공지능(Artificial Intelligence, AI)의 한 분야로, 명시적인 프로그래밍 없이 데이터를 통해 학습하고 성능을 향상시키는 컴퓨터 알고리즘의 연구입니다.

정의: E(경험, Experience), T(작업, Task), P(성능 척도, Performance)를 가진 어떤 프로그램이 T에 대한 P로 측정된 성능이 E를 통해 향상될 경우, 해당 프로그램은 학습한다고 할 수 있습니다 (Tom Mitchell의 정의).
목표: 대규모 데이터에서 패턴을 인식하고, 이를 바탕으로 예측, 분류, 군집화 등의 작업을 수행하는 모델을 구축하는 것입니다.

유형	알고리즘	설명
선형 모델	선형 회귀(Linear Regression), 로지스틱 회귀(Logistic Regression)	입력 변수와 출력 변수 사이의 선형 관계를 모델링하며, 회귀(연속 값 예측) 또는 분류(이진 값 예측)에 사용됩니다.
트리 기반 모델	의사 결정 나무(Decision Tree), 랜덤 포레스트(Random Forest)	데이터를 규칙 기반으로 분할하여 예측을 수행하며, 해석이 용이하고 비선형 관계 모델링에 강점을 가집니다.
인스턴스 기반 모델	K-최근접 이웃(K-Nearest Neighbors, KNN)	새로운 데이터 포인트를 가장 가까운 K개의 훈련 데이터 인스턴스에 기반하여 분류 또는 회귀합니다.
확률 기반 모델	나이브 베이즈(Naïve Bayes)	베이즈 정리(Bayes' Theorem)를 기반으로 하며, 특성들 간의 독립을 가정하여 분류를 수행합니다.
군집화 모델	K-평균 군집화(K-Means Clustering)	데이터를 K개의 클러스터로 나누는 비지도 학습 알고리즘입니다.

기계 학습은 데이터의 레이블(Label) 유무와 피드백 방식에 따라 크게 세 가지 주요 유형으로 분류됩니다.

분류	특징 (데이터 제공 방식)	목표 및 사용 사례	주요 알고리즘 (학습 기술)
지도 학습 (Supervised Learning, SL)	정답(Label)이 있는 훈련 데이터를 사용합니다.	입력 $X$ 와 정답 $Y$ 간의 관계 $\mathbf{f(X) \rightarrow Y}$ 를 학습하여 미지의 데이터를 예측합니다.	회귀: 선형 회귀, SVR 분류: 로지스틱 회귀, SVM, 앙상블 기법 (Random Forest, GBM)
비지도 학습 (Unsupervised Learning, UL)	정답(Label)이 없는 훈련 데이터를 사용합니다.	데이터의 내재된 구조, 패턴, 분포를 파악하여 데이터 자체의 특성을 이해합니다.	군집화: K-평균, DBSCAN 차원 축소: PCA, t-SNE
강화 학습 (Reinforcement Learning, RL)	환경과의 상호작용을 통해 보상(Reward)을 받고, 이를 최대화하는 행동 정책을 학습합니다.	특정 목표를 달성하기 위해 최적의 의사결정 순서를 학습합니다.	가치 기반: Q-러닝, SARSA 정책 기반: 정책 경사 액터-크리틱: A2C, A3C

무인 운전 장비 개발은 주로 심층 학습(Deep Learning)과 강화 학습(RL)이 핵심 기술로 활용됩니다.

무인 운전은 크게 인지 $\rightarrow$ 판단 $\rightarrow$ 제어의 3단계로 이루어집니다.

단계	주요 기능	기계 학습 적용 기술
인지 (Perception)	주변 환경 인식, 객체 탐지 및 분류, 차선 감지	CNN 기반의 객체 탐지 및 의미론적 분할 (Semantic Segmentation)
판단 (Decision)	주행 경로 계획, 돌발 상황 대처, 행동 결정	강화 학습(RL), 심층 신경망(DNN) 기반의 시퀀스 모델링 및 예측
제어 (Control)	차량의 조향, 가속, 제동 장치를 실제로 조작	강화 학습 기반의 정밀 제어 정책 학습

데이터 수집 및 전처리: 고품질 센서 데이터 확보 (LiDAR, RADAR, 카메라) 및 정밀 레이블링, 시뮬레이션을 통한 데이터 증강.
인지 시스템 구현: CNN을 활용한 객체 탐지 및 시맨틱 세그멘테이션을 통한 주행 가능 영역 식별.
판단 시스템 구현: 강화 학습(RL)을 이용한 안전하고 효율적인 최적 주행 정책 학습 (예: DQN, DDPG).
시스템 통합 및 검증: 엔드-투-엔드 학습 고려, ISO 26262 및 SOTIF 등의 안전 표준 준수 및 모델 신뢰성 검증, 실시간성을 위한 모델 경량화 (양자화 등) 적용.

DevSecOps, Pentest, Cloud(OpenStack), Develop, Data Engineering, AI-Agent