# kaggle

DB 2_Porto Seguro's Safe Driver Prediction
🔶Introduction ✔️ PorteSeguro Competition data에 대한 good insight를 얻는 것이 목표 ✔️ 운전자가 내년에 자동차 보험 청구를 시작할 확률을 예측하는 모델 구축 ✔️ predict_proba 함수를 통해 확률 값 예측 ✔️
Kaggle [1] 타이타닉
titanicpd.info() : 엔트리의 개수, 칼럼 별 데이터 타입을 알려준다.pd.describe() : 숫자형 변수의 count, mean, standard deviation, min/max, quantile을 알려준다.pd.describe(include = \

[DB] kaggle 데이터 분석 해보기(1)
E-commerce 시장의 고객 구매 데이터를 활용하여 E-commerce 비즈니스에서 중요한 시장 수요 예측과 고객 관리 등에 도움이 되는 유의미한 데이터를 분석합니다.
[kaggle] 선인장 식별하기 - Baseline model
Must Have - 머신러닝, 딥러닝 문제해결 전략__(신백균 저) 11장 항공 사진 내 선인장 식별 경진대회에 대한 내용

[kaggle] 선인장 식별하기 - EDA
Must Have - 머신러닝, 딥러닝 문제해결 전략(신백균 저) 11장 항공 사진 내 선인장 식별 경진대회에 대한 내용

2022 동계 모각코 6회차
Machine Learning에서 Supervised Learning의 대표적인 유형 중 하나인 Classification에 대하여 학습하였다.
Intermediate Machine Learning - 02. Missing Values
이번 튜토리얼에서는, 결측값에 대해 어떻게 처리하는지 세 가지 방법에 대해 알아볼 것입니다. 그런 다음 실제 데이터 셋에서 이러한 접근 방식의 효과를 비교합니다.데이터가 결측값으로 끝나는 경우는 다양합니다. 예를 들어서:2개의 침실이 포함된 주택의 경우 세 번째 침실의
Intermediate Machine Learning - 01. Introduction
kaggle의 Intermediate Machine Learning 코스에 오신 것을 환영삽니다!기계 학습에 대한 배경 지식이 있고 모델의 품질을 빠르게 향상시키는 방법을 배우고 싶다면 여기 잘 오셨습니다! 이 과정에서는 다음의 방법을 학습하여 머신 러닝 전문 지식을
Intro to Machine Learning - 07. Machine Learning Competitions
머신러닝대회는 여러분의 데이터 과학 기술이 어떤지, 그리고 잘 하고 있는지 확인하기 좋은 방법입니다.Kaggle 유저들을 위한 주택 가격 예측 대회에 모델 예측을 작성하고, 제출합니다.이 과정에서 배운 내용을 활용하여 Kaggle 대회에 참가하세요!
Intro to Machine Learning - 06. Random Forests
의사 결정 트리는 여러분께 어려운 결정을 남깁니다. 이파리가 많은 깊은 트리에서는 각각의 예측값이 이파리에 있는 적은 수의 주택 데이터로부터 나오기 때문에 과적합이 발생합니다. 반대로 잎이 거의 없는 얕은 트리의 경우에는 기존 데이터에서 패턴을 포착하기 어렵기 때문에
Intro to Machine Learning - 05. Underfitting and Overfitting
이 단계를 마치면 여러분은 과소적합과 과적합의 개념을 이해하고, 이러한 개념을 적용하여 모델을 보다 정확하게 만들 수 있습니다.이제 여러분들은 모델의 정확도를 측정할 수 있는 신뢰할 수 있는 방법을 사용하여 여러 모델을 실험하고 어떤 모델이 가장 적합한 예측을 제공하는
Intro to Machine Learning - 04. Model Validation
여러분은 모델을 만들었습니다. 하지만 이 모델은 어느정도의 성능을 가질까요?이번 레슨에서는, 여러분의 모델 성능을 측정할 수 있는 model validation에 대해서 배울 것입니다.모델 성능을 측정하는 것은 여러분 모델을 반복적으로 향상시키는데 큰 도움이 됩니다.여
Intro to Machine Learning - 03. Your First Machine Learning Model
📖 Tutorial Selecting Data for Modeling 여러분의 데이터셋은 멋지게 출력하기에는, 머리를 감쌀 정도로 많은 변수를 가지고 있습니다. 어떻게 하면 이 엄청난 양의 데이터를 이해할 수 있는 수준으로 줄일 수 있을까요? 우리는 직관을 사용
Intro to Machine Learning - 02. Basic Data Exploration
모든 기계학습 프로젝트의 첫 번째 단계는 데이터에 익숙해지는 것입니다. 당신은 이를 위해서 판다 라이브러리를 사용할 것입니다. 판다는 데이터 과작하들이 데이터를 탐색하고 조작하기 위해서 사용하는 주요 도구입니다. 대부분의 사람들은 판다를 pd로 줄여서 말합니다. 이 명
Intro to Machine Learning - 01. How Models Work
우리는 기계학습 모델이 어떻게 동작하고 사용되는지에 대한 개요로 시작할 것입니다. 이전에 통계 모델링이나 기계 학습을 해본 적이 있다면 기본적으로 느껴질 수 있습니다. 걱정하지 마세요. 우리는 이제 곧 강력한 모델을 만들 것입니다.이번 코스에서 여러분은 다음 시나리오를

Lv_1.Titanic - 1
타이타닉 탑승 고객들의 정보를 활용 --> 승선한 사람들의 생존여부를 예측하는 모델 생성파이썬 이용, 주피터 노트북을 이용하여 데이터 분석 예정파이썬 가상환경 사용 (가상환경 사용 방법 파악)각 커널 3번씩 반복 작성 --> 파이썬 이용하여 빅데이터 분석 문법 파악각종