데이터 전처리 & 시각화 개인과제 문제 풀이(2)

라라·2025년 6월 11일
0

문제 1-3 : 날짜 데이터 전처리

- 요구사항
campaign_start_date 컬럼의 데이터 타입을 확인하고, 날짜 관련 파생 컬럼을 생성합니다.

  • 날짜 컬럼의 데이터 타입 확인
    • campaign_start_date 컬럼이 문자열(object) 타입인지 확인하세요.
  • 문자열을 날짜 타입으로 변환
    • 문자열을 날짜 타입으로 변환하세요 (pd.to_datetime() 사용).
  • 변환 후 데이터 타입 확인
    • 변환 후 데이터 타입이 datetime64[ns] 인지 확인하세요.
  • 연도, 월 파생 컬럼 생성
    • Year, Month 파생 컬럼을 생성하세요.
      예시)
      df['Year'] = df['Date'].dt.year
      df['Month'] = df['Date'].dt.month

1) 라이브러리, csv 파일 불러오기

# 라이브러리 불러오기
import pandas as pd

# CSV 파일 불러오기
df = pd.read_csv('/content/drive/MyDrive/Data/marketing_campaign_data.csv')
df

[결과 값]

2) Date 컬럼의 데이터 타입 확인

df['campaign_start_date'].info()

➡️ 데이터 타입 = object ▶️ 날짜를 계산하려면 날짜타입(ns)으변환 해야 함

[결과 값]

3) 문자열을(object) datetime(ns) 타입으로 변환

df['campaign_start_date'] = pd.to_datetime(df['campaign_start_date']) 

df['campaign_start_date']

[결과 값]

➡️ dtype: datetime64(ns)로 변환 된 것을 확인

4)변환 후 데이터 타입 확인

print("After conversion:", df['campaign_start_date'].dtype)

[결과 값]

5) 연도, 월, 일 파생 컬럼 생성

(1) 연도

df['Year'] = df['campaign_start_date'].dt.year
df['Year']

[결과 값]

(2) 월

df['Month'] = df['campaign_start_date'].dt.month
df['Month']

[결과 값]

(3) 일

df['Day'] = df['campaign_start_date'].dt.day
df['Day']

[결과 값]

6) 결과 일부 출력

(1) .head() 사용

df[['campaign_start_date', 'Year', 'Month', 'Day']].head()

(2) .tail() 사용

df[['campaign_start_date', 'Year', 'Month', 'Day']].tail()

오늘의 인사이트

디버깅 해가면서 문제를 풀고 하나씩 짚어가면서 풀어보니까 안풀리는 문제가 없었다.

profile
공부를 위해 기록하는 공간

0개의 댓글