profile
열정 가득한 공간

[머신러닝 완벽 가이드] 5장_회귀 - 다항 회귀

회귀가 독립변수의 단항식이 아닌 2차, 3차 방정식과 같은 다항식으로 표현되는 것을 다항(Polynomial) 회귀라고 한다.한 가지 주의할 것은 다항 회귀를 비선형 회귀로 혼동하기 쉽지만, 다항 회귀는 선형 회귀라는 점이다.회귀에서 선형 회귀/비선형 회귀를 나누는 기

2023년 1월 14일
·
0개의 댓글
·

[머신러닝 완벽 가이드] 5장_회귀 - 선형 회귀

LinearRegression()예측값과 실제 값의 RSS를 최소화해 OLS(Ordinary Least Squares) 추정 방식으로 구현한 클래스입력 파라미터fit_intercept: 불린 값, intercept(절편) 값 계산 여부 지정 (default=True)n

2023년 1월 13일
·
0개의 댓글
·

[머신러닝 완벽 가이드] 5장_회귀 - 개요

📌 회귀 (Regression) ✅ 소개 데이터 값이 평균과 같은 일정한 값으로 돌아가려는 경향을 이용한 통계학 기법 여러 개의 독립변수와 한 개의 종속변수 간의 상관관계를 모델링하는 기법을 통칭 머신러닝 관점에서 보면 독립변수는 피처에 해당되며 종속변수는 결

2023년 1월 12일
·
0개의 댓글
·

[머신러닝 완벽 가이드] 4장_분류 - 스태킹 앙상블

개별적인 여러 알고리즘을 서로 결합해 예측 결과를 도출한다는 점에서 배깅(Bagging) 및 부스팅(Boosting)과 공통점을 가진다.하지만 가장 큰 차이점은 개별 알고리즘으로 예측한 데이터를 기반으로 다시 예측을 수행한다는 것이다.즉, 개별 알고리즘의 예측 결과 데

2023년 1월 11일
·
0개의 댓글
·

[머신러닝 완벽 가이드] 4장_분류 - 실습

레이블이 불균형한 분포를 가진 데이터 세트를 학습시킬 때 예측 성능의 문제가 발생할 수 있다.이상 레이블을 가지는 데이터 건수는 매우 적기 때문에 제대로 다양한 유형을 학습하지 못하는 반면에 정상 레이블을 가지는 데이터 건수는 매우 많기 때문에 일방적으로 정상 레이블로

2023년 1월 10일
·
0개의 댓글
·

[머신러닝 완벽 가이드] 4장_분류 - LightGBM

XGBoost와 함께 부스팅 계열 알고리즘에서 가장 각광을 받고 있다.(1) 트리 분할 방식일반 GBM 계열: 균형 트리 분할 (Level Wise)최대한 균형 잡힌 트리를 유지하면서 분할하기 때문에 트리의 깊이가 최소화될 수 있다.균형 잡힌 트리를 생성하는 이유는 오

2023년 1월 9일
·
0개의 댓글
·

[머신러닝 완벽 가이드] 4장_분류 - XGBoost

트리 기반의 앙상블 학습에서 가장 각광받고 있는 알고리즘 중 하나뛰어난 예측 성능GBM 대비 빠른 수행 시간: 병렬 학습 가능과적합 규제 (Regularization): 과적합 규제 기능 제공나무 가지치기 (Tree pruning): 더 이상 긍정 이득이 없는 분할 가

2023년 1월 8일
·
0개의 댓글
·

[머신러닝 완벽 가이드] 4장_분류 - GBM

📌 GBM (Gradient Boosting Machine) ✅ 개요 부스팅: 여러 개의 약한 학습기를 순차적으로 학습, 예측하면서 잘못 예측한 데이터에 가중치 부여를 통해 오류를 개선해 나가면서 학습하는 방식 (1) AdaBoost 개별 약한 학습기에 각각 가

2023년 1월 8일
·
0개의 댓글
·

[머신러닝 완벽 가이드] 4장_분류 - 랜덤 포레스트

배깅의 대표적인 알고리즘앙상블 알고리즘 중 비교적 빠른 수행 속도를 가지고 있으며, 다양한 영역에서 높은 예측 성능을 보이고 있다.여러 개의 결정 트리 분류기가 전체 데이터에서 배깅 방식으로 각자의 데이터를 샘플링해 개별적으로 학습을 수행한 뒤 최종적으로 모든 분류기가

2023년 1월 8일
·
0개의 댓글
·

[머신러닝 완벽 가이드] 4장_분류 - 앙상블

여러 개의 분류기(Classifier)를 생성하고 그 예측을 결합함으로써 보다 정확한 최종 예측을 도출하는 기법다양한 분류기의 예측 결과를 결합함으로써 단일 분류기보다 신뢰성이 높은 예측값을 얻는 것이 목표대부분의 정형 데이터 분류 시에는 앙상블이 뛰어난 성능을 나타내

2023년 1월 7일
·
0개의 댓글
·

[머신러닝 완벽 가이드] 4장_분류 - Decision Tree

📌 Decision Tree (결정트리) 데이터에 있는 규칙을 학습을 통해 자동으로 찾아내 트리(Tree) 기반의 분류 규칙을 만드는 것 룰 기반의 프로그램에 적용되는 if, else를 자동으로 찾아내 예측을 위한 규칙을 만드는 알고리즘으로 이해해 볼 수 있다. >

2023년 1월 6일
·
0개의 댓글
·

[머신러닝 완벽 가이드] 3장_평가 - 분류 모델

accuracy_score(y_test, y_pred)실제 데이터에서 예측 데이터가 얼마나 같은지를 판단하는 지표분류의 경우, 데이터 구성에 따라 ML 모델의 성능을 왜곡할 수 있음불균형한 레이블 값 분포에서 ML 모델의 성능을 판단할 경우, 적합한 평가지표가 아님co

2023년 1월 5일
·
0개의 댓글
·

[머신러닝 완벽 가이드] 2장_사이킷런으로 시작하는 머신러닝 (2)

문자열 값을 숫자형 카테고리 값으로 변환단순 코드일 뿐, 숫자 값에 따른 순서나 중요도 의미 X선형 회귀에는 적용 X -> 원-핫 인코딩 사용트리 계열은 상관없음encoder = LabelEncoder()encoder.fit() : 데이터 학습encoder.transf

2023년 1월 5일
·
0개의 댓글
·

[머신러닝 완벽 가이드] 2장_사이킷런으로 시작하는 머신러닝 (1)

Estimator 클래스: 지도학습 -> fit(), predict() Classifier: 분류 알고리즘 클래스Regressor: 회귀 알고리즘 클래스sklearn.datasets: 내장된 예제 데이터 세트 제공sklearn.preprocessing: 데이터 전처리

2023년 1월 4일
·
0개의 댓글
·

[프로그래머스] 기능개발

progresses: 먼저 배포되어야 하는 순서대로 작업의 진도가 적힌 정수 배열speeds: 각 작업의 개발 속도가 적힌 정수 배열각 기능은 진도가 100%가 넘으면 배포 가능각 배포마다 몇 개의 기능이 배포되는지를 반환(단, 뒤에 있는 기능이 앞에 있는 기능보다 먼

2023년 1월 4일
·
0개의 댓글
·

[프로그래머스] 올바른 괄호

s: "(" 또는 ")"로만 이루어진 문자열문자열 s가 올바른 괄호인지 여부 (True/False) 반환(단, 올바른 괄호는 "(" 문자로 열렸으면 반드시 짝지어서 ")" 문자로 닫혀야 한다.)문자열이 "("로 시작하고, ")"로 끝나는지 확인"("는 +1, ")"는

2023년 1월 3일
·
0개의 댓글
·

[프로그래머스] 같은 숫자는 싫어

arr: 배열의 각 원소는 숫자 0부터 9까지 중의 정수로 이루어짐배열 arr에서 연속적으로 나타나는 같은 숫자는 하나만 남기고 전부 제거하여 반환(단, 제거된 후 남은 수들을 반환할 때는 배열 arr 원소들의 순서를 유지)arr의 원소를 앞에서부터 순서대로 꺼내 리스

2023년 1월 2일
·
0개의 댓글
·

스택(Stack)과 큐(Queue)

데이터를 임시 저장할 때 사용하는 자료구조데이터의 입력과 출력 순서는 후입선출(LIFO) 방식LIFO: Last In First Out, 가장 나중에 넣은 데이터를 가장 먼저 꺼냄push: 스택에 데이터를 넣는 작업pop: 스택에서 데이터를 꺼내는 작업top: 푸시하고

2023년 1월 1일
·
0개의 댓글
·

[머신러닝 완벽 가이드] 1장_Pandas

Pandas: 2차원 데이터(DataFrmae)를 효율적으로 가공/처리할 수 있는 기능 제공pd.read_csv('파일 경로', sep='필드 구분 문자'): csv 파일 불러오기df.head(N): 앞에서부터 N개의 로우 반환 df.shape: 크기를 (행, 열) 형

2022년 12월 30일
·
0개의 댓글
·

[머신러닝 완벽 가이드] 1장_Numpy

np.array(): 입력된 객체를 ndarray로 변환ndarray.shape: 차원과 크기를 (row, col) 튜플 형태로 반환 (단 1차원은 (개수,))ndarray.ndim: 차원ndarray.dtype: 데이터 타입 (1가지만 올 수 있음)ndarray.as

2022년 12월 30일
·
0개의 댓글
·