공모전명 2023 강서구 빅데이터 활용 공모전
공모기간 ~ 23. 3. 24. 18:00
진행기간 23. 3. 10. ~ 23. 3. 24. (약 2주)
진행인원 4명
🗓️ 노션 페이지
💬 github
팀원들과 함께 주제와 분석 프로세스를 직접 탐색하면서, 목적에 부합하는 계획과 방법을 찾아내는 과정이 매우 중요했다. 기술적인 측면보다도 아이디어를 구체화하고 정리하는 데에 중점을 두었던 것 같다. 특히, 정해진 분석 프로세스가 없었기 때문에 선택한 주제에 대한 데이터 수집부터 분석 방법까지 직접 고민하고 탐색해보는 경험이 가장 가치있었다.
어떤 주제를 분석하고자 할 때, 어떤 방식으로 이를 진행할지에 대해 의논하고, 이에 대해 어떤 지표를 생성할 수 있을 지에 대해 고민해볼 수 있어 좋았다.
또 팀원들과의 협업을 통해 일을 분업하고 각자의 업무에 대한 어려움과 진행 상황을 공유하면서 문제를 함께 해결하는 연습을 할 수 있었다. 비록 좋은 결과와 썩 깔끔한 분석은 아니지만 아이디어를 고민해보고 이를 직접 시도해보는 연습을 한 것 같아 도움이 된 시간이다.
분석 보고서에 더 상세한 내용이 첨부되어 있습니다.
PCA, 지표 탐색 및 선정, 군집분석(K-means, 계층적, GMM, AffinityPropagation), 입지후보 데이터 탐색
서울형 키즈카페 운영 및 설치 가이드라인 중
https://icare.seoul.go.kr/icare/user/kidsCafe/BD_selectKidsCafeList.do
→ 기존 서울형 키즈카페 8곳의 수용인원 평균 25.75명, 26명을 수용하려면 182제곱미터의 면적 필요
< 계산식 >
① 기존 아동 커버율
현재 행정동 내 키즈카페로 아동수를 얼마나 수용할 수 있는 지에 대한 지표
② 취약계층 비율
행정동 내 취약계층 비율 (서울형 키즈카페에서 제시한 무료로 이용할 수 있는 취약계층인 기초생활수급자, 한부모가정 고려)
[1] K-means
K-means
inertia_
를 이용하여 시각화하였을 때 n=2 지점에서 elbow point를 가짐
실루엣지수는 0.653061
타겟군집(보라색) - 가양제2동, 가양제3동, 공항동, 등촌제3동, 발산제1동, 화곡제2동, 화곡제6동
[2] 계층적 군집
계층적 군집
덴드로그램을 이용해 시각화
계층적 군집 방법인 AgglomerativeClustering을 사용하여 실루엣 계수 계산
n=2에서 0.639294로 가장 높은 실루엣 계수 점수를 가짐
타겟군집(빨간색) - 가양제2동, 가양제3동, 공항동, 등촌제3동, 발산제1동, 화곡제2동
[3] GMM
[4] AffinityPropagation
AffinityPropagation
AffinityPropagation의 경우 군집수를 정하지 않고 사용하는 모델로 결과가 n=3인 군집으로 형성됨
타겟군집(보라색) - 가양제2동, 가양제3동, 공항동, 등촌제3동, 발산제1동, 화곡제2동
결과적으로 클러스터링별 다음과 같은 행정동이 선택됨
이 중 중복된 가양제2동, 가양제3동, 공항동, 등촌제3동, 발산제1동, 화곡제2동 순으로 타겟 행정동 선정
선정된 가양제2동, 가양제3동, 공항동, 등촌제3동, 발산제1동 화곡제2동은 강서구 내에서도 취약계층 비율이 높고, 기존 키즈카페의 수용 가능 인원이 행정동 내 아동 수 커버율이 낮다고 볼 수 있음
따라서 제시한 순서에 따라 키즈카페를 우선적으로 고려해야 할 필요가 있음