[Zero-Base]데이터 취업 스쿨 스터디 노트(서울시 범죄 현황 데이터 분석-3)

강현정·2024년 5월 6일

zero_base

목록 보기
18/54

🧹데이터 정리

iterrows()

  • 데이터프레임의 인덱스와 안의 내용들을 반복문으로 반환해준다.

  • 이때 개수를 잘 가져오고 있는지 확인하기 위해서 print(cnt)를 써도 된다. 이때 컬럼의 이름을 합쳐주기 위해 아래와 같이 for 문을 사용해서 합쳐준다. 이때 list comprehension을 사용하여 리스트로 담아준다.
crime_station.to_csv('../data/02.crime_in_seoul_raw.csv',sep = ',', encoding = 'utf-8')

(...중간 데이터 저장...)

🧹구별 데이터로 변경하기

  • 구별로 각 범죄발생을 합계로 나타낸다.

+컬럼 나누는 방법들


  • 필요없는 컬럼들을 제거하고 100보다 큰 검거율은 100으로 변경한다.
  • 컬럼명을 간단하게 바꾼다.

🧹서울시 범죄현황 데이터 최종정리

  • 범죄 발생 건수에 대해 그 정도를 비교하기 쉽게 하기위해 정규화를 시킨다.
  • 정규화시킨 데이터에 원래 있던 검거율 컬럼을 추가시킨다.
  • 구별 cctv자료 정리했던 것을 불러와 인구수와 cctv수 컬럼을 추가시킨다.

-정규화된 범죄발생 건수 전체의 평균을 구해서 범죄 컬럼 대표값으로 사용한다.

  • 검거율의 평균을 구해서 검거 컬럼의 대표값으로 사용한다.

0개의 댓글