[TIL]데이터 분석 부트캠프(4기) 39일차

Data_Student·2024년 12월 2일
0

TIL

목록 보기
39/54

[TIL]데이터 분석 부트캠프(4기) 39일차

0. 들어가며

  • 심화 프로젝트..!
  • 전처리가 중요한데 다행스럽게도 어느정도 전처리가 된 것 같다!
  • 내일은 오늘 정리한 내용을 다시 깔끔하게 정리 및 모델링 시작

1. 오전 일과

1-1 코드카타 및 내용 정리

내용 정리 링크
https://velog.io/@dav74/%EC%BD%94%EB%93%9C%EC%B9%B4%ED%83%80-SQL-55-Restaurant-Growth

  • 코드카타 1문제 풀이 완료
    • limit와 offset를 활용한 정렬
    • sum() over을 통한 누적합

1-2 심화 프로젝트

  • 데이터 전처리를 위한 EDA 진행
  • 결측치에 대해서는 dropna()를 활용하여 제거
  • 그리고 이후 분석에서 활용할 수 있는 파생변수 생성

2. 오후 일과

2-1 심화 프로젝트(이어서)

  • 이상치 제거
  • 튜터님께 질문 후 이상치에 대해서 z-score와 IQR에 근거하여 진행하는 것도 좋지만
    팀의 특정한 기준에 의한 제거를 진행하여도 된다고 하셨기에 팀의 기준을 선정하여 제거

3. 마치며

  • 비지도 학습은 답이 없는 만큼 데이터 전처리가 중요하다.
  • 오늘 전처리를 통해 결측치와 이상치를 제거하였으며, 이를 통해 내일부터 모델링 예정

0개의 댓글