데이터 예측 분석과 머신러닝

Yuno·2025년 5월 31일

데이터 사이언스

목록 보기

25/25

1️⃣ 기존 프로그래밍 vs 머신러닝

기존 프로그래밍
- 명확한 조건과 규칙에 따라 입력 → 출력 결정
- 조건 → 결과
머신러닝
- 데이터를 통해 규칙성을 학습하고 예측
- 데이터 + 정답 → 규칙성 → 예측
예시 : 강아지 사진, 고양이 사진을 주고 학습 → 새로운 사진이 강아지인지 고양이인지 예측

2️⃣ AI vs 머신러닝 vs 딥러닝

인공지능(AI): 인간의 지능을 컴퓨터가 모방한 포괄적 기술
머신러닝: 데이터를 기반으로 컴퓨터가 학습해 규칙을 찾는 AI 기술
딥러닝: 머신러닝의 하위분야로서 인간의 신경망을 모방한 인공신경망(ANN)을 활용한 알고리즘

3️⃣ 머신러닝의 학습

데이터에서 규칙성(패턴)을 찾아내는 과정
찾은 규칙으로 새로운 데이터에 대한 답을 예측

✨ 머신러닝과 기존 알고리즘의 차이

전통적 알고리즘	머신러닝
문제 명세 → 알고리즘 → 결과	데이터 → 결과 → 규칙(알고리즘)
조건 명확	조건 불명확 (복잡한 문제에 효과적)

4️⃣ 학습 데이터의 구성

📌 학습 데이터를 나누는 이유는 과적합(overfitting)을 방지하기 위함

훈련 데이터(Training set): 모델 학습
검증 데이터(Validation set): 모델의 성능 조정, 하이퍼파라미터 튜닝
테스트 데이터(Test set): 최종 모델 평가

용어	설명
하이퍼파라미터	사람이 설정해주는 파라미터 (학습률, 에폭 등)
매개변수	학습 중 자동으로 학습되는 값 (가중치, 편향 등)

5️⃣ 머신러닝의 분류

종류	설명	예시
지도학습(감독학습)	입력과 정답이 있는 데이터를 이용한 학습	분류, 회귀분석
비지도학습(무감독학습)	입력 데이터만으로 규칙성을 찾아 군집화	군집화(Clustering), 차원 축소
준지도학습	지도학습 + 비지도학습을 혼합한 방식	소수의 레이블 데이터와 다수의 비레이블 데이터를 함께 학습
강화학습	환경과의 상호작용에서 피드백을 통해 행동 결정	게임 플레이, 자율주행

6️⃣ 인공신경망(ANN)

인간의 뉴런 구조를 모방한 머신러닝 모델
입력(Input) → 가중치(Weight) → 활성화 함수(Activation function) → 출력(Output)

✨ 인공신경망의 문제점

과적합(overfitting) 가능성
파라미터의 최적값 찾기 어려움
학습 속도 느림

7️⃣ 딥러닝(DNN, Deep Neural Network)

ANN에서 발전하여 다수의 은닉층(hidden layers)을 구성한 형태
심층 구조를 통해 복잡한 패턴을 학습할 수 있도록 함
대규모 데이터, 반복학습, 오류 역전파를 통해 성능 향상

알고리즘	특징	용도
CNN (합성곱 신경망)	이미지의 특징을 추출해 학습	이미지 인식, 영상 분석
RNN (순환 신경망)	순차적 데이터(시계열, 텍스트)에 특화	텍스트 처리, 음성 인식
LSTM	장기 의존성을 개선한 RNN의 발전형	언어 모델링, 음성 인식
GRU	LSTM의 간소화 버전	자연어 처리

8️⃣ 주요 알고리즘 특징 요약

✨ RNN(순환 신경망)

순차적 데이터 처리에 특화
시간에 따른 데이터의 선후 관계 학습에 유리
음성, 텍스트 분석 등에 활용

✨ CNN(합성곱 신경망)

이미지의 시각적 특징(feature)을 추출
이미지 인식, 객체 탐지, 영상 분석에 뛰어난 성능

Hello World

이전 포스트

클라우드 가상화와 컨테이너 기술

0개의 댓글