
일반 딕셔너리는 순서가 보장되지 않음순서 보장이 필요한 경우 OrderedDict 사용기본값: index=True, header=TrueNone 값이 있을 경우: 빈칸으로 저장됨 → 다른 값으로 대체하려면apply로 함수에 파라미터 전달:여러 컬럼을 사용한 apply:

이 문서는 머신러닝 실습 중 %timeit 명령어를 활용하며 공부한 내용을 직접 정리한 것입니다.단순히 코드 실행 시간을 재는 기능을 넘어, 어떤 상황에서 쓰면 좋은지, 내부적으로 어떤 구조로 작동하는지까지 학습하며 이해한 내용을 기록했습니다.%timeit은 Jupyt

이 문서는 머신러닝 실습에서 배우게 된 KNN(K-Nearest Neighbors) 알고리즘에 대한 이론과 실습 이해를 바탕으로 정리한 내용입니다.단순 개념뿐만 아니라 수학적 원리, 하이퍼파라미터 튜닝, 실무 적용 시 고려할 점까지 포함했습니다.KNN(K-Nearest

이 문서는 머신러닝 분류 알고리즘 중 하나인 의사결정트리(Decision Tree)에 대해 공부하면서 정리한 내용입니다.개념, 수학적 배경(엔트로피와 정보이득), 대표 알고리즘(ID3), 실습 예제 및 실무 팁을 포함하여 정리하였습니다.의사결정트리는 분류와 회귀 모두에

이 문서는 Decision Tree의 확장형인 Random Forest 알고리즘에 대해 정리한 학습 노트입니다.Random Forest의 작동 원리, Decision Tree와의 차이, 앙상블 기법, 실습 예제, 실무 팁까지 포함합니다.Random Forest는 여러

이 문서는 머신러닝 분류 알고리즘 중 나이브 베이즈(Naive Bayes)와 SVM(Support Vector Machine)에 대해 공부한 내용을 정리한 것입니다.조건부 확률과 베이즈 정리, SVM의 마진 개념, 커널 트릭, 하이퍼파라미터까지 시각 자료와 함께 체계적

이 문서는 머신러닝에서 SVM(Support Vector Machine) 알고리즘을마진, 서포트 벡터, 커널 트릭, 수학적 원리, 파라미터 설정 등 모든 핵심 요소를 중심으로 시각적이고 직관적으로 정리한 학습용 문서입니다.SVM 개념을 처음 접하는 분도 이해할 수 있도

선형 회귀(Linear Regression)에 대해 머신러닝 수업을 들으며 정리한 노트입니다. 영상 중 이해가 안 된 부분이나 핵심 개념을이미지와 함께 메모한 내용을 바탕으로 다시 정리했습니다.머신러닝의 지도학습(Supervised Learning)은 크게 두 가지로

이 문서는 로지스틱 회귀(Logistic Regression)에 대해 강의를 들으면서 정리한 내용입니다. > 처음엔 선형 회귀랑 뭐가 다른지 혼동했는데, 확률 기반 분류라는 점과 > 시그모이드 함수, 코스트 펑션(Log Loss)의 구조가 꽤 직관적으로 이어져 있어서

이 문서는 머신러닝 수업 중 학습한 앙상블(Ensemble) 기법과하드 보팅 / 소프트 보팅의 차이, 그리고 피처 스케일링(Feature Scaling)의 필요성에 대해 정리 핵심 개념뿐 아니라, 실제 예시와 비교 표를 통해 보다 명확하게 이해할 수 있도록 정리하였다.

이 문서는 머신러닝 강의를 실습하면서 다양한 모델을 비교하고K-Fold Cross Validation 기법을 활용해 최적의 모델을 선택하는 과정을 정리한 내용입니다. 머신러닝 프로젝트에서는 하나의 모델만 사용하는 것보다여러 모델을 실험하고 성능을 비교하는 것이 일반

이 문서는 비지도학습(unsupervised learning) 알고리즘 중 대표적인 K-Means 클러스터링에 대한 학습 내용을 정리했다.강의를 보며 함께 실습한 내용을 바탕으로 개념, 작동 방식, 적용 예시를 정리K-Means는 비지도 학습(Unsupervised L

이 문서는 머신러닝 강의를 실습하면서 정리한 오버피팅(Overfitting) 개념과,이를 이해하고 극복하기 위한 바이어스-베리언스 트레이드오프,그리고 실제 모델 학습 시 나타나는 현상에 대한 내용현재 학습한 데이터에서는 매우 높은 정확도를 보이지만,새로운 데이터에서는

이 문서는 머신러닝 학습 중 가장 중요한 개념 중 하나인 오버피팅(Overfitting)과언더피팅(Underfitting)을 이해하고 극복하기 위한 개념인바이어스(Bias)와 베리언스(Variance)를 중심으로 정리한 학습 기록입니다.언더피팅은 바이어스가 높은 상태오

이 문서는 선형대수학과 머신러닝에서 자주 등장하는 벡터의 Norm(놈) 개념을L1 Norm, L2 Norm 중심으로 정리한 학습 기록벡터의 크기 또는 길이를 측정하는 방법으로, 정규화, 거리 계산, 정규화 손실 함수(Loss) 등에서 활용된다.Norm은 벡터 공간에서

이 문서는 고차원 데이터를 저차원으로 효과적으로 축소할 수 있는대표적인 차원 축소 기법인 PCA (주성분 분석)의 개념과 알고리즘을 정리한 학습 기록이다.PCA는 고차원 데이터를 저차원으로 투영하여데이터의 핵심적인 정보(분산)를 최대한 보존하는 차원 축소 기법일반적으로

이 문서는 분류 문제에서 모델의 성능을 평가하는 대표 지표인Confusion Matrix (혼동 행렬)의 개념, 구성 요소, 해석 방법을 정리이진 또는 다중 분류 모델의 예측 성능을 직관적으로 표현하는 행렬실제 클래스와 모델이 예측한 클래스 간의 상관 관계를 2차원 표

이 문서는 다중 분류(Multiclass Classification) 문제에서 모델 성능을 측정하는 주요 지표인 Accuracy, Precision, Recall, F1 Score의 개념과 사용 기준을 시각 자료와 함께 정리한 학습 기록 1. 다중 분류에서의 성능