# 캐글

24개의 포스트

[캐글] Courses - Python(4)

2021.06.24 캐글 공부

약 15시간 전
·
0개의 댓글

[캐글] Courses - Python(3)

2021.06.23 캐글 공부

1일 전
·
0개의 댓글

[캐글] Courses - Python(2)

2021-06-22 캐글 공부

3일 전
·
0개의 댓글

[캐글] Courses - Python(1)

2021.06.20 캐글

5일 전
·
0개의 댓글

[캐글 가이드]

2021-06-19 캐글 공부

6일 전
·
0개의 댓글

[캐글 가이드] 책 구매

2021-06-13 캐글 공부 시작!

2021년 6월 13일
·
0개의 댓글
post-thumbnail

R code for Titanic - Machine Learning from Disaster

가장 유명한 캐글 입문용 대회, 타이타닉이다.일단 데이터 전처리를 하기 전에 train 데이터와 test 데이터의 Cabin, Embarked 변수에 ""로 표시된 레벨이 있었기 때문에 이를 NA로 바꾸었다.또한 Name 변수와 Ticket 변수는 일단 제외하고 (문

2021년 6월 7일
·
0개의 댓글
post-thumbnail

R code for Kaggle Tabular Playground Series - Mar 2021

다중선형회귀모형과 xgboost:reg linear 모형을 사용해 제출을 하였다.다중선형회귀모형은 auc값이 0.86860,xgboost:reg linear 모형은 0.86975가 나왔다. (소폭 성능 향상)전처리 방식으로는 매우 간단하게 문자형 cat 변수들을 범주형

2021년 6월 5일
·
0개의 댓글
post-thumbnail

R code for Kaggle Tabular Playground Series - May 2021

이번 데이터는 다항 분류 예측 유형이기 때문에 xgboost multi:softprob 모델을 사용하였다.연속형 변수들을 범주형 변수들로 바꾸기 위해 summary() 함수를 통해 전체적인 요약 통계량을 보았는데, 일부 변수에서 음수의 값이 존재하였기 때문에 이들의 값

2021년 6월 5일
·
0개의 댓글
post-thumbnail

[kaggle] Otto Group Product Classification Challenge

세계 최대의 전자상거래 회사 중 하나인 Otto Group에서 주최하는 Otto Group Product Classification Challenge 입니다.Otto Group은 익명화(anonymization)된 상품 정보에 대한 데이터를 제공하는데, 경진대회 참석자

2021년 5월 25일
·
0개의 댓글
post-thumbnail

[Kaggle] Titanic: Machine Learning from Disaster (4)

이번에 따라할 노트북은 Introduction to Ensembling/Stacking in Python이다. (1)에서 전반적인 플로우를, (2)에서 EDA와 feature engineering을, (3)에서 modeling과 여러 classifiers를 집중적으로

2021년 4월 1일
·
0개의 댓글

3/25~3/31 Project1(비디오 게임 출고량)

AI 부트캠프 16일차 ~ AI 부트캠프 20일차캐글 데이터 링크비디오 게임 데이터셋을 이용하여 다음 분기 게임 설계하기비디오 게임의 장르 결정게임을 지원하는 플랫폼 선정주요 출고 지역 선정데이터 생성 및 설명EDA 및 전처리Feature engineering분석 및

2021년 3월 31일
·
0개의 댓글
post-thumbnail

[Kaggle] Titanic: Machine Learning from Disaster (3)

이번에는 Titanic Top 4% with ensemble modeling 글을 따라할 참이다. 글을 쓰는 시점에서는 score가 0.78인데 더 올릴 수 있을지 확인해보자.이 글은 feature engineering을 하기 전에 outlier를 찾아 제거하는 과정을

2021년 3월 23일
·
0개의 댓글
post-thumbnail

[Kaggle] Titanic: Machine Learning from Disaster (2)

이번에 따라할 글은 EDA To Prediction(DieTanic)이다. EDA 부터 prediction까지의 과정을 설명한 글인데 처음 튜토리얼에서 EDA를 자세히 뜯어보았기 때문에 추가로 고려할만한 사항을 간단히 짚고 EDA 후 과정을 중점적으로 다루기로 했다.

2021년 3월 16일
·
0개의 댓글
post-thumbnail

[Kaggle] Titanic: Machine Learning from Disaster (1)

캐글 시작은 이유한님의 캐글 스터디 전용 커리큘럼으로 하기로 했다. 제일 처음은 Binary classification: Tabular data의 Titanic이다. Exploratory data analysis, visualization, machine learnin

2021년 3월 12일
·
0개의 댓글
post-thumbnail

Hello Kaggle! 캐글이 처음인 분들을 위한 캐글 가이드

Hello Kaggle은 제가 직접 작성한 문서이며 아래는 문서의 깃허브 레포지터리 링크입니다. 만약 Hello Kaggle이 도움이 되셨다면 🌟 꾸욱 눌러주시면 감사하겠습니다!

2021년 1월 10일
·
4개의 댓글

[kaggle] 공공자전거 수요 예측

캐글 도전 - 공공자전거 수요 예측하기

2020년 10월 25일
·
1개의 댓글
post-thumbnail

분류 모델의 평가 방법

분류모델의 평가방법에 대해 알아봅시다.정확도만 가지고 분류 모델을 평가하면 안될까?(정확도: 전체의 데이터 중에서 올바르게 예측한 비율)결론은 아니다.다음과 같은 예시가 있다.전체 데이터에서 90%는 고양이, 10%는 강아지다.데이터가 뭐든지 상관없이 전부 모든데이터를

2020년 4월 11일
·
0개의 댓글