# kaggle

282개의 포스트

[ML Study 2022] 1주차

PROBLEM Problem info > Theme > Data preprocessing & basic ML 서울시 따릉이 대여량 예측 경진대회 (DACON) > metric > RMSE > notes > 기온, 풍속, 습도 등의 데이터를 활용해 시간별 따릉

약 9시간 전
·
0개의 댓글
·
post-thumbnail

Big Data Derby 2022

Big data 2022에 관해 살펴볼 예정이다.이 competition은 경마 관련 데이터를 이용해 어느 말이 우승할지 예측하는 competition이다.우선 데이터셋을 살펴보자.네가지 종류의 데이터로 이루어져 있는데 첫번째는 말과 기수의 상관관계에 대한 데이터이다.

6일 전
·
0개의 댓글
·
post-thumbnail

Titanic - Kaggle

survival : 생존 여부 (0 : 사망 / 1 : 생존)pclass : ticket에 따른 객실 등급sex : 성별Age : 나이sibsp : 동반한 형제자매와 배우자의 수parch : 동반한 부모 자식의 수ticket : ticket numberfare : ti

2022년 9월 18일
·
0개의 댓글
·
post-thumbnail

Kaggle_beginner :자전거 대여 수요 예측

자전거 대여 수요 예측 경진대회 대회 링크 :링크텍스트 문제 유형 : 회귀 평가 지표 : RMSLE 참조 코드 : 링크텍스트 EDA 및 시각화

2022년 9월 10일
·
0개의 댓글
·
post-thumbnail

Anomaly Detection in Credit Card Transactions

https://www.kaggle.com/code/yoontaeklee/credit-card-fraud-detection통계나 데이터 분석에서, outlier는 대다수의 데이터에서 벗어난 데이터를 말한다. 이는 해당 데이터가 다른 데이터와는 다른 메커니즘으로

2022년 9월 3일
·
0개의 댓글
·
post-thumbnail

python 모듈 함수 리스트(캐글 필사)

kaggle 대회에서 사용된 python 모듈 함수

2022년 8월 29일
·
0개의 댓글
·
post-thumbnail

Costa Rican Household Poverty Level Prediction - 3. Individual Level Variables

Individual level variable에는 2가지 종류가 있다참/거짓을 나타내는 Boolean값순서를 나타내는 값필요 없는 변수들을 제거하기 위해 상관계수 절댓값이 0.95가 넘어가는 것만 남기도록 한다female 상관계수가 굉장히 높으므로 그 반대인 male

2022년 8월 28일
·
0개의 댓글
·
post-thumbnail

SpaceX Falcon9 First Stage Landing Prediction

Kaggle Link : https://www.kaggle.com/code/yoontaeklee/spacex-falcon-9-firsts-stage-landing-prediction데이터셋 확인 (null data)EDA (Exploratory Data Ana

2022년 8월 27일
·
0개의 댓글
·
post-thumbnail

[HUFSTUDY] Kaggle Getting Started 데이터 분석 -Spaceship Titanic

HUFS Data Scientist : Kim Juwon, Cho Kwonwhi, Baek GunwooSummary :This Data Analysis is done by Juwon Kim and for ML ModelingUsing Pandas(Histogram),

2022년 8월 21일
·
0개의 댓글
·
post-thumbnail

Kaggle Progression System

Kaggle Progression SystemKaggle Progression System은 kaggle의 Data Scientist로서 Tier를 나타내며, 본인의 데이터 사이언티스트 역량을 확인할 수 있도록 만들어졌습니다. 메달을 따고 다양한 대회를 참여를 통해 티

2022년 8월 21일
·
0개의 댓글
·
post-thumbnail

Kaggle 이란 + 회원 가입 방법

Kaggle이란?Kaggle은 전 세계에 있는 모두가 데이터를 분석할 수 있도록 대회를 개최하고, 분석 내용을 토론할 수 있는 커뮤니티를 제공하는 플랫폼입니다.데이터 분석 대회 뿐만 아니라 데이터 분석을 위한 여러가지 데이터 셋, 파이썬, R로 개발 할 수 있는 Not

2022년 8월 21일
·
0개의 댓글
·
post-thumbnail

Kaggle Platform 알아보기

처음 회원가입 후 홈페이지 방문을 하면 kaggle competition에 참여할 것인지, 강의 course를 들을 것인지 물어본다.좌측 메뉴에는 주로 사용하는 것이 Competitions, Datasets, Code, Discussions, Courses 가 있다.우

2022년 8월 17일
·
0개의 댓글
·
post-thumbnail

Spaceship Titanic - kaggle

1. 필요 라이브러리 import 가끔 출력 되는 에러 메세지 출력을 없애기 위한 코드입니다. 2. 데이터 확인 Data Dictionary PassengerId : 승객 ID HomePlanet : 출발 행성(거주지) CryoSleep - 취침 방식 여부 Ca

2022년 8월 17일
·
0개의 댓글
·
post-thumbnail

KNN 예제

코드 : https://github.com/PacktPublishing/Machine-Learning-for-Algorithmic-Trading-Second-Edition_Original/blob/master/06_machine_learning_process/

2022년 8월 15일
·
0개의 댓글
·
post-thumbnail

GTSRB(교통표지판 분류 문제)에 대한 분류기 비교

목적 : 교통 표지판 이미지 데이터를 이용하여 여러 분류 모델을 구현하고 분류기별 성능 비교과정 : 대량의 이미지 데이터를 전처리 - support vector machine, random forest, cnn 세 모델의 성능 차이 확인 \- 캐글에서 제공하는 교통표지

2022년 8월 8일
·
0개의 댓글
·
post-thumbnail

Costa Rican Household Poverty Level Prediction - 2. Feature Engineering(1)

전 포스트에 이어, Feature Engineering을 진행하며 머신러닝 모델에 들어갈 데이터를 가공한다가정 레벨과 개인 레벨 변수 나누기개인 레벨의 데이터에서 적당히 합칠 수 있는 변수들 확인순서를 확인할 수 있는 변수는 통계에 사용참/거짓 변수 또한 통합할 수 있

2022년 8월 8일
·
0개의 댓글
·
post-thumbnail

Costa Rican Household Poverty Level Prediction - 1. 데이터셋 확인

해당 코드는 https://www.kaggle.com/code/willkoehrsen/a-complete-introduction-and-walkthrough/notebookInteger type이 130개, float type이 8개, object type이

2022년 8월 7일
·
0개의 댓글
·
post-thumbnail

[kaggle/python] House Price prediction

📌 주제: House Price prediction 📖 참고 솔루션 Stacked Regressions : Top 4% on LeaderBoard(by Serigne) ✔️ Understand the problem ⚡ 변수, 데이터셋 살펴보기 ✏️ 필요한 라이브러

2022년 8월 6일
·
0개의 댓글
·