딕셔너리로 지역코드 명 변환
loc_code = {11530*** : '서울특별시 구로구 수궁동',
11530*** : '서울특별시 구로구 항동',
11530*** : '서울특별시 구로구 오류제2동',
41210*** : '경기도 광명시 광명6동',
11530*** : '서울특별시 구로구 오류제1동',
...
}
sorted(loc_code.items())
output
[(11530***, '서울특별시 구로구 신도림동'),
(11530***, '서울특별시 구로구 구로제1동'),
(11530***, '서울특별시 구로구 구로제2동'),
(11530***, '서울특별시 구로구 구로제3동'),
(11530***, '서울특별시 구로구 구로제4동'),
(11530***, '서울특별시 구로구 구로제5동'),
...
)]
loc_code[41210***]
'경기도 광명시 학온동'
지역코드 컬럼과 딕셔너리 맵핑
df_total['ad'] = df_total['code'].map(loc_code)
df_total['ad'].nunique()
df_total['code'].nunique()
52
지역 주소 분할 및 데이터 프레임 생성
df_total['ad'].str.split(' ',expand=True)
output
행정동만 추출
df_total['ad'].str.split(' ',expand=True)[2]
output
0 수궁동
1 수궁동
2 수궁동
3 수궁동
4 수궁동
...
1048570 영등포동
시도 / 시군구 / 행정동별 분할
test['시도'] = test['ad'].str.split(' ',expand=True)[0]
test['시군구'] = test['ad'].str.split(' ',expand=True)[1]
test['행정동'] = test['ad'].str.split(' ',expand=True)[2]