갓생살기를 하기위해 적는 9일차 일기!

어제부터 개인 흡연관련 프로젝트를 하기시작했다.
흡연데이터 test.csv , train.csv , sample.csv 파일을 다운을 받았고,
처음 어떻게 짤것인가 계획을 먼저 정했다
큰계획으로는

데이터 탐색(EDA) -> 데이터 전처리 -> 모델링 -> 평가 및시각화로 잡았고
일단 받은 파일부터 하나씩 뜯어본뒤 시작했다.

우선 데이터 품질 점검으로
결측치 확인 , 범주형 확인, 이상치 발견을 시행했다

그뒤 변수들 간의 상관관계를 분석하여 확인했고,
label과의 상관관계가 무엇인지 분석했다.
다음으로 모델링 및 평가 했다.

데이콘 리더보드에 올린 점수는 0.744이다.
하이퍼파라미터도 고쳐보고 이것저것 다른 모델 또는 다른 모듈이있는지
찾아보고있땋ㅎ.... 점수가 멈춰버렷닿...
일기를 다쓴후에도 내가 쓴 코드들 외에 다른 방법으로도 시도해서
점수를 올려볼 생각이다.

profile
곽숭아_놀이터

0개의 댓글