population = pd.read_excel('../data/07_population_raw_data.xlsx', header=1) # 1번은 없애자
population.fillna(method='pad',inplace=True) # pad??
population
population = population[populationp['소계'] !='소계']
population.loc[population['구분']=='총인구수 (명)','구분'] = '합계'
.get_level_values()
for idx, row in pop.iterrows():
if row["광역시도"][-3:] not in ["광역시", "특별시", "자치시"]:
si_name[idx] = row["시도"][:-1]
elif row["광역시도"] == "세종특별자치시":
si_name[idx] = "세종"
else:
if len(row["시도"]) == 2:
si_name[idx] = row["광역시도"][:2] + " " + row["시도"]
else:
si_name[idx] = row["광역시도"][:2] + " " + row["시도"][:-1]
#### 행정구
for idx, row in pop.iterrows():
if row["광역시도"][-3:] not in ["광역시", "특별시", "자치시"]:
for keys, values in tmp_gu_dict.items():
if row["시도"] in values:
if len(row["시도"]) == 2:
si_name[idx] = keys + " " + row["시도"]
elif row["시도"] in ["마산합포구", "마산회원구"]:
si_name[idx] = keys + " " + row["시도"][2:-1]
else:
si_name[idx] = keys + " " + row["시도"][:-1]
#### 행정구
for idx, row in pop.iterrows():
if row["광역시도"][-3:] not in ["광역시", "특별시", "자치시"]:
if row['시도'][:-1] == '고성' and row['광역시도'] == '강원도':
si_name[idx] = '고성(강원)'
elif row['시도'][:-1] == '고성' and row['광역시도'] == '경상남도':
si_name[idx] = '고성(경남)'
밑 처럼 바꾼다
set(draw_korea['ID'].unique()) - set(pop['ID'].unique()) # 차집합이 없어야 한다
set(pop['ID'].unique()) - set(draw_korea['ID'].unique()) # 차집합이 없어야 한다
tmp_list = list(set(pop['ID'].unique()) - set(draw_korea['ID'].unique()))
for tmp in tmp_list:
pop = pop.drop(pop[pop['ID'] == tmp].index) # 드랍은 인덱스 기준?
print(set(pop['ID'].unique()) - set(draw_korea['ID'].unique()))
...?