# sklearn

15개의 포스트

sklearn 모델 품질 측정하기

헷갈리는 metrics 정리

2021년 5월 10일
·
0개의 댓글
post-thumbnail

[Python] 선형 회귀 이론 및 실습

하나 이상의 특성과 연속적인 타깃 변수 사이의 관계를 모델링 하는 선형 회귀에 대해 파헤쳐보자!

2021년 4월 17일
·
0개의 댓글

21.2.21 / scikit-learn / 복습, kaggle 에임스 지방 주택 가격 예측

선형 회귀 및 kaggel 실습kaggle 아이오와 주의 에임스 지방 주택 가격 예측 dataMSE는 평균((실제값 - 예측값)^2) 이다.RMSE는 MSE에 root를 씌운 값이다.선형 회귀LinearRegression 의 rmse 값은 0.1335481829784

2021년 2월 21일
·
0개의 댓글

21.2.20 / scikit-learn / 강의 복습, kaggle 공유 자전거 수요 예측

파이썬 머신러닝 완벽 가이드 (목표 진도 끝)회귀 파트 개념 복습다항회귀 및 kaggle 실습 복습kaggle 자전거 수요 예측 데이터 사용import numpy as npimport pandas as pdfrom sklearn.metrics import mean_sq

2021년 2월 20일
·
0개의 댓글

21.2.19 / scikit-learn / 강의 수강 및 복습, kaggle 파마 인디언 당뇨병 예측

Today 강의 파이썬 머신러닝 완벽 가이드 (목표 진도 끝) 스터디 내용 회귀 파트 강의 마무리 데이터 전처리 교차검증 평가 회귀 결과 Tomorrow 회귀 복습 및 분류 복습 Summary

2021년 2월 19일
·
0개의 댓글

Metrics

사이킷런에 있는 서브패키지로, 분류문제의 여러 성능평가 명령을 제공한다. 일반적으로 정확도(accuracy_score)를 많이 사용하는데, 이밖에도 여러 종류의 성능평가 지표가 있다.타겟의 정답인 클래스와 모형이 예측한 클래스가 얼마나 일치하는지 세서 표로 나타낸 것이

2021년 2월 19일
·
0개의 댓글

21.2.17 / scikit-learn / 강의 수강 및 kaggle 타이타닉 생존자 예측

파이썬 머신러닝 완벽 가이드 (25%)머신러닝 강의 복습 scikit-learn 이용 titanic 생존자 예측 코드 복습 및 실제 작성scikit-learn 복습분류 파트 공부텐서플로를 아주 얇게 다뤄본 경험이 있는데 scikit-learn이 좀 더 lowlevel

2021년 2월 17일
·
0개의 댓글

피마 인디언 당뇨병 예측 데이터 세트로 머신러닝 평가하기

이번에는 Kaggle의 피마 인디언 당뇨병(Pima Indian Diabetes) 데이터 세트를 이용해 당뇨병 여부를 판단하는 머신러닝 예측 모델을 수립하고, 저번에 작성한 평가 지표를 적용해 보자.

2020년 12월 27일
·
0개의 댓글

머신러닝 평가(Evaluation)

머신러닝은 데이터 가공/변환, 모델 학습/예측 그리고 평가의 프로세서로 구성된다.

2020년 12월 26일
·
0개의 댓글

사이킷런으로 수행하는 타이타닉 생존자 예측

매번 kaggle 노트북으로만 보던 타이타닉 생존자 예측을 책을 따라서 해보자

2020년 12월 24일
·
0개의 댓글

데이터 전처리

사이킷런의 ML 알고리즘을 적용하기 전에 데이터에 대해 미리 처리해야 할 기본 사항이 있다.

2020년 12월 21일
·
0개의 댓글

사이킷런으로 붓꽃 품종 예측하기

iris 데이터 이용해서 머신러닝 공부하기

2020년 12월 21일
·
0개의 댓글

20.10.27-20.11.14

머신러닝 프로젝트 후기

2020년 11월 10일
·
0개의 댓글
post-thumbnail

분류 모델의 평가 방법

분류모델의 평가방법에 대해 알아봅시다.정확도만 가지고 분류 모델을 평가하면 안될까?(정확도: 전체의 데이터 중에서 올바르게 예측한 비율)결론은 아니다.다음과 같은 예시가 있다.전체 데이터에서 90%는 고양이, 10%는 강아지다.데이터가 뭐든지 상관없이 전부 모든데이터를

2020년 4월 11일
·
0개의 댓글
post-thumbnail

[kaggle] 타이타닉 생존자 예측, python

캐글 입문, 머신 러닝 가이드로 사용되는 타이타닉 문제입니다. 하지만, 튜토리얼 이라고 하기에는 조금 어렵습니다. 예를 들어, 기본으로 주어진 gender_submission..csv(여자 생존, 남자 사망)를 그대로 제출하면 76.55의 점수를 받습니다. 이 점수는

2020년 3월 4일
·
2개의 댓글