Python 관통 프로젝트 -2 (Netflix)

이남경·2024년 1월 26일
0

SSAFY 11기

목록 보기
13/67

관통프로젝트 2 (Netflix)


사용할 패키지 import 받기

csv 경로를 지정하고 불러올 파일 선택

원하는 열만 지정하고 싶을 땐, usecols를 사용해서 원하는 범위 지정

df 를 쓰면 원하는 Dataframe 을 출력할 수 있다.

처음 df의 타입 정보를 확인했을 땐, Date의 정보가 object인 것을 확인할 수 있다!

pd.to_datetime(df['Date']) 를 통해 Date의 속성을 변경해주면 Date의 속성이 datetime64[ns] 로 변한 것을 확인할 수 있다.

데이터 필터링을 할 범위를 지정해서 df를 출력한다. 이때 파일이 서로 헷갈리는 걸 방지하기 위해 df_after_2021로 변경해준다.

df_after_2021_max = df_after_2021.Close.max()

df_after_2021_min = df_after_2021.Close.min()

을 사용해서 최고 종가, 최소종가를 구한다!

여전히 데이터 타입은 유지되어야 한다!

월별 그룹화를 위해 strftime()함수를 사용해서 년도와 월로만 나타내야 한다. 그리고 이렇게 변경한 요소를 'Date_month'라는 열로 추가한다.

'Date_month'로 그룹화 한 데이터를 더한 값을 정리한 데이터 이다!

월별 그룹화 한 그래프로 나타내면 위와 같다

아래 내용은 정확한 정답이 나오진 않았지만, 그래도 그래프가 나름 그려졌다!

0개의 댓글

관련 채용 정보