Node 02. Data cleaning 택시요금 데이터 다루기 [프로젝트]

이하얀·2024년 10월 30일
0
post-thumbnail

🔗 프로젝트 링크

github.com/hayannn/AIFFEL_MAIN_QUEST/taxi.ipynb


Data Cleaning 순서


  1. 데이터 불러오기

  2. 데이터 정보 확인하기

  3. 결측치 확인 및 제거하기

  • 결측치 유뮤 및 비율 살펴보기
  • 결측치 제거하기
  • Step2의 택시 주행 시간, 주행 거리, 요금 상관관계 파악
    • 주행 시간 계산하기
    • 주행 시간 - 주행 거리 사이의 상관관계 분석하기
    • 주행 거리 - 주행 요금 사이의 상관관계 분석하기
    • 주행 시간 - 요금 사이의 상관관계 분석하기
    • (참고) 상관 행렬을 사용해 모든 상관관계 분석하기(ChatGPT 활용)
  1. payment_method 형태 통일하기

  2. 이상치 탐지 & 처리하기

  • 이상치 탐지
  • 이상치 제거하기
  1. 클리닝한 데이터 CSV로 저장하기

  2. trip.csv vs cleaned_trip csv

profile
언젠가 내 코드로 세상에 기여할 수 있도록, BE&Data Science 개발 기록 노트☘️

0개의 댓글