Day 38. 4/12(수) EDA 03

이동은·2023년 4월 13일
post-thumbnail

오늘의 목표

  • EDA 범죄 파트 끝내기

달성 목표

  • 범죄 파트 1 진행중

오늘을 마치며

-확실히 EDA파트에 들어오면서 코딩이 재밌어지기 시작했다.
앞으로 더 열심히 배워야지!!!


4/12일 서울시 범죄현황

데이터 개요

  • info(): 데이터의 개요 확인하기
  • 특정 컬럼에서 unique 조사
    === > crime_raw_data['죄종'].unique()
  • null값이 들어가 있음
    ===> crime_raw_data['죄종'].isnull()
    을 통해서 null값이 불리언 타입으로 출력된다.
    ===> crime_raw_data[crime_raw_data['죄종'].isnull()].head()
    raw_data에[]마스킹 값을 통해 데이터를 표형식으로 출력할 수 있음

Pandas pivot_table

  • Pivot_table을 이용하여 데이터를 사용자의 입맛에 따라 배열할 수 있다.
  • index, columns, values, aggfunc
  • 멀티 인덱스는 []안에 담아준다.
  • margins=True) => 총 합계(All)를 나타냄

아래 그림과 같은 문구가 떴는데 상관없겠지..?

***트러블 슈팅
아래와 같은 Pandas에러가 발생하여
[Missing optional dependency 'openpyxl'. Use pip or conda to install openpyxl.]
주피터 노트북에서 !pip install openpyxl을 설치하여 해결하였다. 터미널에서 설치했을때는 같은 에러가 발생함.

profile
또 다른 나를 찾아서

0개의 댓글