[zero-base/] DS Part 4. EDA - 24일차 스터디 노트

손윤재·2024년 1월 5일

제로베이스 DS 22기

목록 보기
25/55
post-thumbnail

실습 도구 2️⃣

【서울시 범죄 현황 데이터 분석】에 사용된 라이브러리


✅ Pandas Pivot Table

pandas에서 pivot_table() 함수는 DataFrame의 데이터를 재구성하고 집계하는 데 사용되는 함수로 재구성된 DataFrame을 반환한다.

➡ pandas.pivot_table(df_data, index=, columns=, values=, aggfunc=)
  • index: 새로운 테이블의 인덱스로 사용될 열
  • columns: 새로운 테이블의 열로 사용될 열
  • values: 피벗할 값으로 재집계가 가능한 numeric value 여야 한다.
  • aggfunc: 집계 함수로, 겹치는 값이 있는 경우 어떻게 처리할지 지정한다.
                  Default 함수는 '평균'이다.

✅ Google Maps API

googlemaps 패키지는 파이썬에서 구글 맵스 API를 사용할 수 있도록 도와주는 서드파티 라이브러리(Third Party Library)이다.

  • 이 패키지를 사용하면 파이썬 프로그램에서 구글 맵스의 위치 기반 서비스, 지리적 정보 처리, 길찾기 등 다양한 기능을 활용할 수 있다.
    import googlemaps

    # 구글 클라우드 플랫폼에서 발급받은 API 키 입력
    api_key = 'your_api_key'

    # Google Maps 클라이언트 생성
    gmaps = googlemaps.Client(key=api_key)

    # 주소를 좌표로 변환
    gmaps.geocode('서울영등포경찰서', language="ko")


✅ Seaborn

Python의 데이터 시각화 라이브러리 중 하나로 통계 데이터를 시각화하는 데 사용한다.

  • seaborn은 matplotlib와 함께 실행된다.

  • seaborn에는 실습용 데이터가 몇 개 내장되어 있다.

    • “tips” data, “flights” data, “iris” data, “anscombe” data, …
  • 그래프 형태

    1. boxplot
    2. swarmplot
    3. lmplot
    4. heatmap
    5. pairplot

✅ Folium

Python에서 지리적 데이터 시각화를 위한 라이브러리로 지도를 만들고 다양한 형태의 데이터를 지도 위에 시각적으로 나타낼 수 있다.

import folium

folium.Map(location=[37.544564958079896, 127.05582307754338], zoom_start=14)

  • Folium을 사용하여 지도를 생성하고 Marker, CircleMarker, PolyLine, GeoJSON과 같은 다양한 기호를 사용하여 데이터를 지도에 표시할 수 있다.

  • Folium은 지도의 확대/축소, 스크롤, 팬 등과 같은 상호작용도 지원한다.

profile
ISTP(정신승리), To Be Data Scientist

0개의 댓글