오늘의 목표
달성 목표
오늘을 마치며
-확실히 EDA파트에 들어오면서 코딩이 재밌어지기 시작했다.
앞으로 더 열심히 배워야지!!!
4/12일 서울시 범죄현황
데이터 개요
- info(): 데이터의 개요 확인하기
- 특정 컬럼에서 unique 조사
=== > crime_raw_data['죄종'].unique()
- null값이 들어가 있음
===> crime_raw_data['죄종'].isnull()
을 통해서 null값이 불리언 타입으로 출력된다.
===> crime_raw_data[crime_raw_data['죄종'].isnull()].head()
raw_data에[]마스킹 값을 통해 데이터를 표형식으로 출력할 수 있음
Pandas pivot_table
- Pivot_table을 이용하여 데이터를 사용자의 입맛에 따라 배열할 수 있다.
- index, columns, values, aggfunc
- 멀티 인덱스는 []안에 담아준다.
- margins=True) => 총 합계(All)를 나타냄
아래 그림과 같은 문구가 떴는데 상관없겠지..?


***트러블 슈팅
아래와 같은 Pandas에러가 발생하여
[Missing optional dependency 'openpyxl'. Use pip or conda to install openpyxl.]
주피터 노트북에서 !pip install openpyxl을 설치하여 해결하였다. 터미널에서 설치했을때는 같은 에러가 발생함.