EDA(8)_서울시 범죄 현황 데이터 분석 : 데이터 읽어오기(실습) with Google Maps

Jio.B·2023년 7월 3일
0

thounds=","

  • 천의 단위마다 콤마(,)를 표시한 숫자는 문자로 인식될 수 있음
  • thousands="," : 콤마를 제거하고 숫자형으로 읽어오라는 명령어

encoding="euc-kr"

  • 한글 깨짐 현상 방지
  1. 데이터 읽어오기 : null값이 다수

isnull( ), notnull( )

pandas pivot table

  • pivot table 구성요소 : index, columns, values, aggfunc(연산식)

1) index 설정

2) value 설정


(참고) pivot_table에서 index, value를 2개 이상 지정할 땐 리스트로 묶어주기


3) 연산식 적용

4) column 설정

fill_value

[참고] NaN값 처리 --> 여기에선 0으로 처리

margins=True

[참고] pivot table에 총계(all) 추가하기

  1. 데이터 정제하기

droplevel[ ]

1) 인덱스 지정하여 필요 없는 컬럼 제거


Google Maps

  1. 구글맵스 이용한 데이터 정리
  • tmp 변수에 담아 get( ) 함수로 샘플링 테스트

split( )

4-1. crime_station 테이블에 컬럼 추가하기 : 구, 위도, 경도

4-2. 반복문으로 빈 값 채우기

  • 경찰서 이름에서 소속된 구 이름 추출하기
  • 구 이름과 위도, 경도 정보를 저장할 (비어있는) 리스트 준비하기
  • 반복문을 이용해서 nan값을 추출된 정보로 채워주기

  1. 원본 테이블 인덱스명을 슬라이싱&합치기하여 가독성 높이기

(인덱스 수정결과 확인)

  1. 데이터 저장

0개의 댓글

관련 채용 정보