시리즈

AI

1.[ML] 선형대수학이란? 머신러닝에 필요한 이유

선형대수학은 수학의 한 분야로, 벡터(vector), 행렬(matrix), 그리고 이들의 연산을 다루는 학문이다. 선형대수학은 공간(공간상에서의 위치, 방향)을 수학적으로 표현하고, 여러 차원에서 일어나

2025년 1월 12일

2.[ML] EDA(Exploratory Data Analysis)란?

탐색적 데이터 분석을 의미하며, 데이터 분석의 초기 단계에서 데이터의 특성을 파악하는 작업이다. 데이터를 시각화하고 분석하는 방법으로, 데이터의 분포, 패턴, 이상치, 변수 간의 관계를 이해하는 것을

2025년 1월 12일

3.[ML] 데이터 전처리란? (결측값, 중복값, 이상치 처리)

데이터 전처리(Data Preprocessing)는 데이터 분석이나 머신러닝 모델을 구축하기 전, 데이터를 정제하고 변환하는 과정을 의미한다. 우리가 사는 현실 세계의 정보는 잡음(

2025년 1월 12일

4.[ML] 지도 학습과 비지도 학습의 차이는?

지도 학습과 비지도 학습은 머신러닝의 학습 방식에 차이가 있다. 지도 학습은 입력 데이터(X)와 정답(라벨, Y)이 주어진 상태에서 학습한다. 즉, 알고리즘은 X와 Y의 관계를 학습하여 새로운 데이터에 대해 예측을 한다. 따

2025년 1월 19일

5.[ML] 손실 함수(loss function), 비용 함수(Cost Function)란?

손실 함수(Loss Function)란 머신러닝 모델에서 예측 값과 실제 값의 차이를 측정하는 함수이다. 이 값은 모델이 얼마나 잘못 예측했는지 알려주는 오류의 척도로 사용된다. 예를 들어 실제 값이 10

2025년 1월 19일

6.[ML] 모델 학습에서의 편향과 분산

편향은 모델이 실제 데이터의 패턴을 단순화해서 발생하는 예측 오류의 경향이다. (모델이 실제 데이터의 패턴을 충분히 표현하지 못하는 것) 즉, 너무 단순한 모델일수록 편향

2025년 1월 19일

7.[ML] K-폴드 교차 검증, K값 선택 기준은?

보통 머신러닝 모델을 학습시키기 위해서는 데이터를 훈련(train), 검증(validation), 테스트(test)의 3등분으로 나눈다. 여기에서 훈련과 검증 단계에 K-폴드 교차 검증이 사용된다

2025년 1월 19일

8.[ML] 결정 트리란(Decision Tree)? 결정 트리의 장점과 단점은?

결정트리는 규칙을 바탕으로 데이터를 분류하는 경로를 만들고, 그 결과로 예측을 수행하는 머신러닝 모델이다.결과 모델이 Tree 구조를 가지고 있기 때문에 Decision Tree라는 이름을 가진다. 위 사진처럼 특정 분류 기준(질문

2025년 1월 26일

9.[ML] 부스팅 알고리즘(Boosting)이란? AdaBoost, Gradient Boosting, XGBoost, LightGBM의 장단점

부스팅 알고리즘이란 여러 개의 약한 학습기(weak learner)를 순차적으로 학습-예측하면서, 잘못 예측한 데이터에 가중치를 부여**해 오류를 개선해나가는 학습방식이다. 최종적으로 여러 모델의 결과를 결합하여 강한 학습기(strong learner)를 만드는 방식이

2025년 1월 26일

10.[ML] 차원 축소 기법이란? 주성분 분석(PCA)과 요인 분석(FA)의 차이

차원 축소는 매우 많은 피처로 구성된 다차원 데이터 세트의 차원을 축소해 새로운 차원의 데이터 세트를 생성하는 것이다. 일반적으로 차원이 증가할수록 데이터 간의 거리가 기하급수적으로 증가하기 때문

2025년 1월 26일

11.[ML] 머신러닝과 딥러닝 간의 포함관계

머신러닝은 데이터를 학습하여 패턴을 찾아내고, 이를 기반으로 새로운 데이터에 대해 예측을 하는 인공지능(AI)의 한 분야이다. 머신러닝 모델은 사람이 직접 명시적으로 프로그래밍하지 않아도, 훈련 데이터를 이용해 스스로

2025년 2월 2일

12.[ML] 딥러닝의 성능을 극대화하는 하이퍼파라미터 종류 정리

하이퍼파라미터는 모델이 학습하는 동안 최적화되는 것이 아니라, 사용자가 직접 설정해야 하는 값들이다. 이때, 딥러닝 모델의 성능을 향상시키기 위해 조정할 수 있는 하이퍼파라미터에

2025년 2월 2일

13.[딥러닝] PyTorch와 TensorFlow의 차이점 비교

pytorch는 Facebook에서 개발한 오픈소스 딥러닝 프레임워크로, 2017년 github를 통해 1.0 버전이 open-source로 공개되었다. 2018년~2019년부터 TensorFlow보다 PyTorch 선호도가 높아지며 연구/논문에서는 PyTo

2025년 2월 8일

14.[딥러닝] PyTorch의 텐서 vs. NumPy의 Array 차이점 비교

딥러닝에서 텐서(Tensor) 는 데이터를 표현하고 연산하는 기본 구조이다. 즉, 텐서는 숫자, 벡터(1차원), 행렬(2차원), 또는 더 고차원적인 데이터를 담을 수 있는 컨테이너이다.

2025년 2월 9일

15.[딥러닝] CNN (Convolutional Neural Network) 정리, 레이어 구성

CNN을 구성하는 각 레이어의 역할에 대해 설명해보세요. CNN (Convolution Neural Network) CNN은 이미지나 시계열 데이터에서 특징을 추출하고 학습하는 데 특화된 인공신경망이다. CNN의 특징을 추출하는 Convolutional Layer와 정보를 압축하는 Pooling Layer의 반복으로 이루어져 있다. 1. 입력 레이어 ...

2025년 2월 16일

16.[딥러닝] 오토인코더(Autoencoder) 정리, 인코더와 디코더

오토인코더는 입력 데이터가 들어왔을 때, 해당 데이터를 최대한 압축시킨 후, 데이터의 특징을 추출하여 다시 본래의 입력 형태로 복시키는 신경망이다. 이때, 데이터를 압축하는 부분을 Encoder, 복원하는 부분을 Decoder라고 한다.

2025년 2월 16일

17.[딥러닝] 이미지 리사이징(Resizing)과 정규화(Normalization) 정리

리사이징(Resizing)은 원본 이미지의 크기를 특정한 크기로 조정하는 과정이다. 모든 입력 이미지의 크기를 통일할 때 사용한다. 딥러닝 모델은 고정된 크기의 입력을 받도록 설계되므로, 다양한 크기의 이미지를 일관된 형태로 맞춰야 한다. 이미지 크기가

2025년 2월 23일

18.[딥러닝] 데이터 증강(Data Augmentation) 기법 정리

데이터 증강(Data Augmentation)은 기존의 학습 데이터를 변형하여 새로운 학습 데이터를 만들어내는 기법이다. 딥러닝 모델은 많은 데이터를 필요로 하지만, 충분한 양의 데이터를 확보하기 어려운 경우가 많다.

2025년 2월 23일

19.[딥러닝] Transfer Learning(전이 학습) 정리, Feature Extraction & Fine-Tuning

Transfer Learning(전이 학습)이란 무엇이며, 이미지 분류 모델에서 어떻게 활용할 수 있나요? Transfer Learning(전이 학습) 전이 학습(Transfer Learning)이란 이미 학습된 모델의 가중치를 활용하여 새로운 데이터나 문제에 적용하는 기법이다. 딥러닝 모델을 처음부터 학습하려면 많은 데이터와 연산 자원이 필요하지만,...

2025년 2월 23일

20.[딥러닝] 이미지 분류 (Classification) vs. 이미지 분할 (Segmentation) 차이

Semantic Segmentation이란 무엇이며, 이미지 분류(Classification)와 어떤 차이가 있나요? 1. 이미지 분류 (Classification) 이미지 분류는 주어진 이미지가 무엇인지 판별하는 것이다. 즉, 이미지 전체에 대해 단 하나의 클래스

2025년 3월 6일

21.[딥러닝] Fully Convolutional Networks(FCN)의 특징 (+CNN과의 차이)

FCN은 이미지 분할(Segmentation)을 하는 딥러닝 모델이다. 기존의 CNN 기반 분류(Classification) 모델과 달리, Convolutional Layer만 사용하여 입력 이미지의 공간적 정보를 유지하고, 픽셀 단위로 클래스를 예측하는

2025년 3월 7일

22.[딥러닝] GAN에서 생성자(Generator)와 판별자(Discriminator)의 역할

GAN은 두 개의 신경망인 생성자(Generator)와 판별자(Discriminator)가 서로 경쟁하면서 데이터를 생성하는 모델이다. 생성자(Generator)는 새로운 데이터를 만들어내는 역할을 한다. 랜덤한 노이즈를 입력으로 받아, 실제 데이터와 구별할 수 없을

2025년 3월 9일

23.[제 7회 KDT 해커톤] 고용노동부 장관상(우수상) 후기 / 자유과제

1. 참가신청서 접수 코드잇 부트캠프 고급 프로젝트를 진행하던 중, 제 7회 KDT 해커톤을 알게 되었다. 팀원들과 논의 후, 현재 진행 중인 고급 프로젝트를 디벨롭하여 공모전에 출품하기로 결정했다. 참가 신청서는 "우리 서비스가 왜 필요한지" 논리적으로 설득하는

2025년 9월 18일