Intermediate Machine Learning - 01. Introduction

d2n0s4ur·2023년 2월 3일
0

Introduction

kaggle의 Intermediate Machine Learning 코스에 오신 것을 환영삽니다!

기계 학습에 대한 배경 지식이 있고 모델의 품질을 빠르게 향상시키는 방법을 배우고 싶다면 여기 잘 오셨습니다! 이 과정에서는 다음의 방법을 학습하여 머신 러닝 전문 지식을 가속화합니다:

  • 실제 데이터 셋에서 자주 발견되는 데이터 유형(결측값, 범주형 변수)을 해결
  • 머신러닝 코드의 성능을 올리기 위한 파이프라인을 설계
  • 모델 성능 검증을 위한 고급 기술(cross-validation, 교차검증)
  • kaggle 대회에서 우승하는 데 널리 사용되는 최첨단 모델 구축(XGBoost)
  • 평범하고 중요한 데이터 과학 실수 피하기(leakage).

이 과정에서 여러분의 지식을 활용하여 각 새로운 주제에 대한 실제 데이터를 사용한 실습을 진행합니다. 실습에서는 주택 가치 예측 데이터셋을 사용합니다. 이 데이터셋에는 79개의 다른 설명 변수(예: 지붕 유형, 침실 수, 욕실 수)를 사용하여 주택 가격을 예측합니다. 이 대회에 예측 모델을 제출하고 리더보드에서 자신의 위치가 상승하는 것을 지켜보면서 자신의 진행 상황을 측정할 수 있습니다!

Prerequisites

이 전에 머신러닝 모델을 구축한 경험이 있고, 모델 검증, 과적합과 과소적합, Random Forests와 같은 개념에 익숙하다면 이 과정을 수강할 준비가 되었습니다.

머신러닝이 완전히 처음인 경우에는 이 과정에 필요한 것들을 알려주는 Intro to Machine Learning course를 먼저 학습하세요.

Your Turn

Kaggle 대회에 예측을 제출하는 방법과 시작하기 전에 검토해야 할 사항을 결정하는 방법에 대해 알아보려면 첫 번째 연습을 진행하세요.

0개의 댓글