오,, 자꾸 미천한 코딩 실력으로 데이터 시각화를 해야 할 것 같아서 걱정했는데, 대용량 데이터 가공하는 걸 배우는 건 좋은 것 같다!!
import pandas as pd
commercial = pd.read_csv('./data/commercial.csv')
commercial.tail(5)
등을 사용하여 내가 가공한 데이터의 서머리를 본다.list(commercial)
category_range = set(commercial['상권업종소분류명'])
category_range, len(category_range)
commercial['도로명']
commercial[['시', '구', '상세주소']] = commercial['도로명'].str.split(' ', n=2, expand = True)
이것은... 띄어쓰기를 기준으로 n=2는 뭐였지.. 여튼 잘라주고 expand는 뭘 늘려주는거지? 여튼 시, 구, 상세주소라는 컬럼을 만들어 값들을 넣어주는 함수다.
이 마법을 사용하니 시 밑에 서울시 / 구 밑에 강남구 / 상세주소 밑에 나머지 도로명 주소 (선릉로93길) 이 들어가 새로운 컬럼이 생겼다!
commercial.tail(5)
seoul_data = commercial[commercial['시'] == '서울특별시']
seoul_data.tail(5)
city_type = set(seoul_data['시'])
city_type, len(city_type)
seoul_chicken_data.tail(5)
set(seoul_chicken_data['상권업종소분류명'])
groupdata = seoul_chicken_data.groupby('구')
group_by_category = groupdata['상권업종소분류명']
chicken_count_gu = group_by_category.count()
sorted_chicken_count_gu = chicken_count_gu.sort_values(ascending=False)
sorted_chicken_count_gu
결과:
다음 강의는, 이렇게 잘라낸 데이터를 시각화하는 것이다! 고고!
덧.
sort_values(ascending=false)
false 를 소문자로 쓰면 안된다.. (헐ㅋ)