# scikit learn

34개의 포스트
post-thumbnail

[TIL] Linear Regression

선형 회귀는 머신러닝 중 지도 학습(Supervised Learning)의 한가지다. 선형 회귀는 일차함수의 개념인 y = ax + b의 직선을 임의로 그려놓고, 그 직선을 바탕으로 예측하는 것이다.독립변수가 증가하고, 종속 변수도 증가한다면 위의 그림의 검은 점선처럼

1일 전
·
0개의 댓글
post-thumbnail

1.1 사이킷런과 머신러닝

: 정답(Label)이 존재. 수치를 예측하는 것이면 Regression, 분류의 문제는 ClassificationClassification -> https://scikit-learn.org/stable/supervised_learning.htmlRegress

2021년 9월 13일
·
0개의 댓글
post-thumbnail

[Machine Learning] 파이썬 머신러닝 완벽 가이드(권철민, 위키북스) : 3장 평가(2)

F1스코어, ROC 곡선과 AUC, 피마 인디언 당뇨병 예측

2021년 9월 6일
·
0개의 댓글
post-thumbnail

[Machine Learning] 파이썬 머신러닝 완벽 가이드(권철민, 위키북스) : 3장 평가(1)

📐3.1. 정확도(Accuracy) 평가의 개요 머신러닝은 데이터 가공/변환 -> 모델 학습/예측 -> 평가 프로세스를 가짐 성능 평가 지표 (evaluation metric) 회귀 모델 : 대부분 실제값과 오차값의 오차 평균값에 기반. 예측오차를 가지고 정규화 수준을 재가공하는 방식 분류 모델 : 일반적으로 실제 결과 데이터와 예측 결과 데이터가...

2021년 9월 5일
·
0개의 댓글
post-thumbnail

[Machine Learning] 파이썬 머신러닝 완벽 가이드(권철민, 위키북스) : 2장 사이킷런으로 시작하는 머신러닝(1)

사이킷런(scikit-learn) 개요 및 프레임워크, Model Selection 모듈, 데이터 전처리

2021년 9월 5일
·
0개의 댓글
post-thumbnail

세팅이 반이다 _JUPYTER NOTEBOOK

현재 필자가 이 포스팅을 작성하고 있는 시점은 토요일 점심이 조금 지난 오후다. 이전 포스팅 끝에서 예고한대로 오늘은 JUPYTER NOTEBOOK 을 조금 더 편리하게 사용하기 위한 세팅을 하기 위한 팁을 작성하려고 한다. 이미 알고 있는 닝겐들사람들도 있겠지만,

2021년 7월 24일
·
0개의 댓글
post-thumbnail

[Project-서울시 초미세먼지 예측]2. Feature engineering과 모델링을 위한 데이터 형태 변환

서울시 초미세먼지 예측 프로젝트. Feature Categorizing, Feature engineering, Re-scaling 과정

2021년 7월 17일
·
0개의 댓글

학습데이터와 테스트 데이터 나누기

훈련 데이터와 테스트 데이터 직접 분리하기 traintestsplit() 사용해서 분리하기 훈련 데이터와 테스트 데이터 분리는 필수 기능입니다. 훈련에 쓴 데이터를 예측에 사용하면 항상 정확도는 100%가 나올 것이기 때문이죠. 사이킷런에서는 이 필수 기능을 당연히 A

2021년 7월 12일
·
0개의 댓글

dataset modules

loading datasets dictionary 와 유사 Bunch datatype data들의 key값들을 알아내는 메소드 데이터의 nsamples(데이터 갯수. row), nfeatures(데이터 특성. columns)의 모양을 알아보기 위해 shape 데

2021년 7월 12일
·
0개의 댓글
post-thumbnail

regression model

mean squared error from sklearn.metrics import meansquarederror error = np.sqrt(meansquarederror(y, y_new)) print(error)

2021년 7월 12일
·
0개의 댓글

scikit-learn 데이터 표현법

NumPy의 ndarray, Pandas의 DataFrame, SciPy의 Sparse Matrix를 이용해 나타낼 수 있습니다. 그리고 훈련과 예측 등 머신러닝 모델을 다룰 때는 CoreAPI라고 불리는 fit(), transfomer(), predict()과 같은

2021년 7월 12일
·
0개의 댓글
post-thumbnail

scikit-learn에 대하여

choosing right algorithm 의존성 (Dependencies) 사이킷런은 파이썬 기반 머신러닝 라이브러리입니다. 따라서 사이킷런은 다음과 같은 파이썬, 파이썬 라이브러리에 의존성을 갖습니다. Scikit-Learn 0.20까지는 Python 2.7과

2021년 7월 12일
·
0개의 댓글
post-thumbnail

Machine learning algorithms, 알고리즘 선택시 고려사항

머신러닝의 알고리즘 종류는 크게 3가지로 나눌 수 있습니다. 지도학습 (Supervised Learning) 비지도학습 (Unsupervised Learning) 강화학습 (Reinforcement Learning) 참고사이트 지도학습 분류(Classificati

2021년 7월 12일
·
0개의 댓글
post-thumbnail

파이썬(Python) 데이콘 오늘의 파이썬 1-3 [모델링, 사이킷런(scikit-learn)]

scikit-learn 라이브러리를 사용해 모델링을 시작해볼 것입니다. 강좌 바로가기

2021년 7월 7일
·
0개의 댓글

21.2.21 / scikit-learn / 복습, kaggle 에임스 지방 주택 가격 예측

선형 회귀 및 kaggel 실습kaggle 아이오와 주의 에임스 지방 주택 가격 예측 dataMSE는 평균((실제값 - 예측값)^2) 이다.RMSE는 MSE에 root를 씌운 값이다.선형 회귀LinearRegression 의 rmse 값은 0.1335481829784

2021년 2월 21일
·
0개의 댓글

21.2.20 / scikit-learn / 강의 복습, kaggle 공유 자전거 수요 예측

파이썬 머신러닝 완벽 가이드 (목표 진도 끝)회귀 파트 개념 복습다항회귀 및 kaggle 실습 복습kaggle 자전거 수요 예측 데이터 사용import numpy as npimport pandas as pdfrom sklearn.metrics import mean_sq

2021년 2월 20일
·
0개의 댓글