# sklearn

23개의 포스트

[AI] K-최근접 이웃알고리즘과 라이브러리

참고자료 : 혼자공부하는 머신러닝 딥러닝

2021년 9월 13일
·
0개의 댓글

머신러닝 (모델) 2

그리드 탐색은 랜덤 트리모델에서 이름 그대로 탐욕법을 사용한 것이다.여러 하이퍼 파라미터(estimator, max)를 부여하고 해당 수많큼 노드와 트리를 조정해서 최적의 랜덤트리를 찾는것이다.

2021년 8월 13일
·
0개의 댓글
post-thumbnail

Feature Selection

This content deals with how we select some effective features for machine learning modelling.

2021년 8월 13일
·
0개의 댓글

머신러닝 (모델) 1

이제 이론은 배웠으니 직접적으로 모델에 대해 다뤄보겠다.여러 모델이 있지만 일단 sklearn 모듈에 있는 모델을 다뤄본다이 둘 중 오늘 다뤄볼 것은 수치 예측 모델이다.수치 예측 모델은 이것 아님 그것 또는 저것 이런 류의 분류모델이 아니라부동산 집값 예측이라거나 나

2021년 8월 12일
·
0개의 댓글

머신러닝 (sklearn) - 1

앞서 말하기를 지금 하는 것은 아직 머신러닝의 ㅁ자에도 못 들어갈 정도지만, 일단 찍어 먹고 내부를 보는 것이 후폭풍이 덜하기도 해서 찍먹 구간이다!머신러닝에서 중요한것은 데이터와 데이터 전처리 그리고 모델로 이루어져 있다.아무리 데이터가 안 좋으면 모델이 좋다한들 원

2021년 8월 10일
·
0개의 댓글

sklearn 모델 품질 측정하기

헷갈리는 metrics 정리

2021년 5월 10일
·
0개의 댓글
post-thumbnail

[Python] 선형 회귀 이론 및 실습

하나 이상의 특성과 연속적인 타깃 변수 사이의 관계를 모델링 하는 선형 회귀에 대해 파헤쳐보자!

2021년 4월 17일
·
0개의 댓글

21.2.21 / scikit-learn / 복습, kaggle 에임스 지방 주택 가격 예측

선형 회귀 및 kaggel 실습kaggle 아이오와 주의 에임스 지방 주택 가격 예측 dataMSE는 평균((실제값 - 예측값)^2) 이다.RMSE는 MSE에 root를 씌운 값이다.선형 회귀LinearRegression 의 rmse 값은 0.1335481829784

2021년 2월 21일
·
0개의 댓글

21.2.20 / scikit-learn / 강의 복습, kaggle 공유 자전거 수요 예측

파이썬 머신러닝 완벽 가이드 (목표 진도 끝)회귀 파트 개념 복습다항회귀 및 kaggle 실습 복습kaggle 자전거 수요 예측 데이터 사용import numpy as npimport pandas as pdfrom sklearn.metrics import mean_sq

2021년 2월 20일
·
0개의 댓글

21.2.19 / scikit-learn / 강의 수강 및 복습, kaggle 파마 인디언 당뇨병 예측

Today 강의 파이썬 머신러닝 완벽 가이드 (목표 진도 끝) 스터디 내용 회귀 파트 강의 마무리 데이터 전처리 교차검증 평가 회귀 결과 Tomorrow 회귀 복습 및 분류 복습 Summary

2021년 2월 19일
·
0개의 댓글

Metrics

사이킷런에 있는 서브패키지로, 분류문제의 여러 성능평가 명령을 제공한다. 일반적으로 정확도(accuracy_score)를 많이 사용하는데, 이밖에도 여러 종류의 성능평가 지표가 있다.타겟의 정답인 클래스와 모형이 예측한 클래스가 얼마나 일치하는지 세서 표로 나타낸 것이

2021년 2월 19일
·
0개의 댓글

21.2.17 / scikit-learn / 강의 수강 및 kaggle 타이타닉 생존자 예측

파이썬 머신러닝 완벽 가이드 (25%)머신러닝 강의 복습 scikit-learn 이용 titanic 생존자 예측 코드 복습 및 실제 작성scikit-learn 복습분류 파트 공부텐서플로를 아주 얇게 다뤄본 경험이 있는데 scikit-learn이 좀 더 lowlevel

2021년 2월 17일
·
0개의 댓글

피마 인디언 당뇨병 예측 데이터 세트로 머신러닝 평가하기

이번에는 Kaggle의 피마 인디언 당뇨병(Pima Indian Diabetes) 데이터 세트를 이용해 당뇨병 여부를 판단하는 머신러닝 예측 모델을 수립하고, 저번에 작성한 평가 지표를 적용해 보자.

2020년 12월 27일
·
0개의 댓글

머신러닝 평가(Evaluation)

머신러닝은 데이터 가공/변환, 모델 학습/예측 그리고 평가의 프로세서로 구성된다.

2020년 12월 26일
·
0개의 댓글

사이킷런으로 수행하는 타이타닉 생존자 예측

매번 kaggle 노트북으로만 보던 타이타닉 생존자 예측을 책을 따라서 해보자

2020년 12월 24일
·
0개의 댓글

데이터 전처리

사이킷런의 ML 알고리즘을 적용하기 전에 데이터에 대해 미리 처리해야 할 기본 사항이 있다.

2020년 12월 21일
·
0개의 댓글

사이킷런으로 붓꽃 품종 예측하기

iris 데이터 이용해서 머신러닝 공부하기

2020년 12월 21일
·
0개의 댓글