지역코드명 주소 변환 및 분할

SOOYEON·2022년 8월 23일
0

pandas

목록 보기
10/37

딕셔너리로 지역코드 명 변환

# dic = {local code : '지역'}
loc_code = {11530*** : '서울특별시 구로구 수궁동',
            11530*** : '서울특별시 구로구 항동',
            11530*** : '서울특별시 구로구 오류제2동',
            41210*** : '경기도 광명시 광명6동',
            11530*** : '서울특별시 구로구 오류제1동', 
            ...
            }
            
            
# 딕셔너리 정렬
sorted(loc_code.items())

output

[(11530***, '서울특별시 구로구 신도림동'),
 (11530***, '서울특별시 구로구 구로제1동'),
 (11530***, '서울특별시 구로구 구로제2동'),
 (11530***, '서울특별시 구로구 구로제3동'),
 (11530***, '서울특별시 구로구 구로제4동'),
 (11530***, '서울특별시 구로구 구로제5동'),
                     ...
 								      )]

# in
loc_code[41210***]

# out
'경기도 광명시 학온동'

지역코드 컬럼과 딕셔너리 맵핑

df_total['ad'] = df_total['code'].map(loc_code)

# 지역 갯수 확인
df_total['ad'].nunique()
df_total['code'].nunique()
52

지역 주소 분할 및 데이터 프레임 생성

df_total['ad'].str.split(' ',expand=True)

output


행정동만 추출

df_total['ad'].str.split(' ',expand=True)[2]

output

0            수궁동
1            수궁동
2            수궁동
3            수궁동
4            수궁동
           ...  
1048570     영등포동

시도 / 시군구 / 행정동별 분할

test['시도']   = test['ad'].str.split(' ',expand=True)[0]
test['시군구'] = test['ad'].str.split(' ',expand=True)[1]
test['행정동'] = test['ad'].str.split(' ',expand=True)[2]

0개의 댓글