파이썬 데이터분석 2주차

Lina Lee·2021년 5월 9일
0

데이터분석 4단계

데이터 불러오기 - 데이터 살펴보기 - 데이터 가공하기 - 데이터 시각화

데이터분석 그래프 종류

바 그래프
라인 그래프
파이 차트
히트맵
지도

데이터 가공하기

셀 자르기

commercial[['시', '구', '상세주소']] = commercial['도로명주소'].str.split(' ', n=2, expand=True)

특정 데이터만 남기기

seoul_data = commercial[commercial['시']=='서울특별시']

데이터 합치기

new_chicken_count_gu = pd.DataFrame(chicken_count_gu).reset_index()
gu_chicken = new_chicken_count_gu.join(new_sum_of_population_by_gu.set_index('군구'), on='구')

데이터 분석하기

gu_chicken['유동인구수/치킨집수'] = gu_chicken['유동인구수']/gu_chicken['상권업종소분류명']
gu_chicken = gu_chicken.sort_values(by='유동인구수/치킨집수')

시각화

지도에 표현하기

import folium
import json

map = folium.Map(location=[37.5502, 126.982], zoom_start=10)
folium.Choropleth(geo_data=geo_data,
data=chicken_count_gu,
columns=[chicken_count_gu.index, chicken_count_gu],
fill_color='PuRd',
key_on='feature.properties.name').add_to(map)
map

지도에 표현하기 2

map = folium.Map(location=[37.5502, 126.982], zoom_start=11, tiles='stamentoner')
https://raw.githubusercontent.com/southkorea/seoul-maps/master/kostat/2013/json/seoul_municipalities_geo_simple.json
seoul_state_geo = './data/seoul_geo.json'
geo_data = json.load(open(seoul_state_geo, encoding='utf-8'))
folium.Choropleth(geo_data=geo_data,
data=sum_of_population_by_gu,
columns=[sum_of_population_by_gu.index, sum_of_population_by_gu],
fill_color='PuRd',
key_on='feature.properties.name').add_to(map)
map

날짜별 그래프 보여주기

  • 날짜를 string 타입으로 변경해야 숫자로 인식하지 않아 값이 줄여지지 않습니다.
    plt.figure(figsize=(12, 5))
    date = []
    for day in population_gangnam_daily.index:
    date.append(str(day))
    plt.plot(date, population_gangnam_daily)
    plt.title('2020년 7월 서울 강남구 날짜별 유동인구 수')
    plt.xlabel('날짜')
    plt.ylabel('유동인구 수(천만명)')
    plt.xticks(rotation=-90)
    plt.show()

0개의 댓글