EDA 07

조천룡·2023년 6월 5일

EDA

목록 보기
7/12
post-thumbnail

Pandas Pivot table

  • index, column, values, aggfunc

  • crime_raw_data.head()

crime_station = crime_raw_data.pivot_table(
    crime_raw_data, 
    index='구분', 
    columns=['죄종','발생검거'],
    aggfunc=[np.sum])
crime_station.head()

  • crime_station.columns # multiindex
  • crime_station.columns = crime_station.columns.droplevel([0,1])
  • 다중 컬럼에서 특정 컬럼 제거
  • crime_station.columns

Python 모듈 설치

pip 명령

  • pip list
  • pip install module_name
  • pip uninstall module_name
    - get_ipython().system('pip list)

conda 명령

  • conda list
  • conda install module_name
  • conda uminstall module_name
  • conda install -c channel_name module_name
    -지정된 배포 채널에서 모듈 설치
  • window, mac(intel)

Google Maps API 설치

  • 구글 계정
  • pip install googlemaps
import googlemaps
gmaps_key = 'aaa'
gmaps = googlemaps.Client(key=gmaps_key)

gmaps.geocode('서울영등포경찰서', language='ko')

Pandas에 잘 맞춰진 반복문용 명령 iterrow()

  • Pandas 데이터 프레임은 대부분 2차원
  • 이럴 때 for문을 사용하면, n번째라는 지정을 반복해서 가독률이 떨어짐
  • Pandas 데이터 프레임으로 반복문을 만들때 iterrows() 옵션을 사용하면 편함
  • 받을 때, 인덱스와 내용으로 나누어 받는것만 주의

np.mean()

profile
10√2 Data

0개의 댓글