[미니프로젝트 2] 프로젝트 정리 및 회고

young·2022년 9월 18일
3

회고 및 피드백

목록 보기
1/7
post-thumbnail

프로젝트 개요

일정

  • 2022.08. 11 ~ 09. 07

주제

폭염예방키트 배부를 위한 최적의 위치 찾기

사용 데이터

  • 서울시 사회복지시설(노인여가복지시설) 목록 (서울시 제공)
  • 서울시 무더위 쉼터 (서울시 제공)
  • 체감온도 (기상청 제공)
  • 최고온도 (기상청 제공)
  • 서울시 국민기초생활보장 연령별 일반수급자(구별)통계 (서울시 제공)

세부 분석 과제

  • 폭염예방키트 배부 타겟을 좁혀 배부 타겟이 많은 곳을 찾은 후, 더위 피해 방지 시설인 무더위쉼터나 사회복지시설에 접근하기 어려운 곳으로 키트 배부 최적의 위치를 찾고자 함
  • 현 프로젝트는 분석 기획으로써, 예상되는 결과까지만을 산출하고 분석 결과는 산출하지 않음

분석 진행 세부 과정

주제 선정 및 구체화

폭염 예방 키트를 왜 배부해야 하는가?

기후 위기로 인한 폭염 증가로 폭염 피해가 심각해지면서 지자체도 이에 따라 여러 정책을 두고 있음. 그중에서도 폭염 예방 키트에 초점을 두어 이 키트가 어디에 배부될 때 가장 효율적인지 분석을 통해 찾아보고자 함

폭염 예방 키트를 받아야 하는 사람은 누구인가?

폭염 취약 계층이 어떤 집단인지, 현재 이 정책이 누구에게 시행되고 있는지 논문과 기사를 통해 추려봄

  • 현재 폭염 취약 계층은 노인, 장애인, 영유아, 야외노동자 등이 있으며, 그 중에서도 본 프로젝트는 집에 에어컨을 달기 어려우며 이동이 어려운 저소득 노인에 초점을 두어 분석을 진행함.

폭염 예방 키트가 배부되어야 하는 곳은 어디인가?

현재 서울시는 더위를 피할 수 있는 곳으로 무더위쉼터를 운영하고 있음. 더위를 피할 수 있다고 생각되는 곳(ex. 무더위쉼터)에 접근하기 어렵고 주변에 더위를 피할 수 있는 시설이 부족한 곳에 우선적으로 키트를 배부하는 것이 효율적인 운영이 될 수 있을 것이라 사료됌

언제 폭염 예방 키트를 배부해야 하는가?

폭염이 가장 심한 날을 분석하여 그 시기에 키트를 배부하는 부스를 설치하는 것이 효율적이라고 판단함
기온 비교를 위해 6, 7, 8, 9월의 데이터를 수집하기로 결정.
최종적으로 2021년 6월 ~ 9월의 일자별 기온과 최고기온, 체감기온을 분석에 사용하기로 함

데이터 수집

  • 인구, 위치, 기온으로 수집할 데이터를 분류
  • 각 분류에 맞는 여러 데이터 수집
  • 최종적으로 각 분류에 맞는 데이터이면서 분석 목적을 달성할 수 있는 데이터들로 최종 선택

데이터 예시 : 서울시 국민기초생활보장 연령별 일반수급자(구별)통계

데이터 전처리

컬럼 선택 및 삭제

데이터를 보면서 조원들끼리 필요없는 컬럼 논의 후 삭제
선택한 컬럼으로만 분석용 데이터 생성

기온 데이터 전처리

필요한 열만 남기고 삭제


데이터 예시


인구 데이터 전처리

통계 데이터이므로, 가져온 데이터에서 노년층인 65세 이하 컬럼 모두 삭제
65세 이상 인구 데이터를 구별로 합쳐 새로운 컬럼 생성
저소득 노인 수를 구별로 순위를 매김

위치 데이터 전처리

전처리 관련 파이썬 코드
데이터에서 결측치를 찾아서 제거하고 무더위를 정말로 피하기는 어려울 것이라 생각되는 공원, 정자, 야외 쉼터 삭제
지역구 컬럼 추가

분석 과정 및 기대 결과

키트 배부를 위한 최적의 구 선정

서울시에서 현재 가장 많은 저소득 노인이 거주하는 곳은 노원구로 밝혀짐
배부 대상자인 저소득 노인이 가장 많은 노원구에 폭염 예방 키트를 우선 배부하는 것이 효율적일 것

배부 부스 위치 선정을 위한 최적 위치 찾기

전처리한 무더위쉼터와 사회복지시설 데이터를 파이썬을 이용하여 지도에 plotting하고, 노인이 이동하기 쉬울 것이라고 생각되는 반경 500m를 기준으로 표시하였음
분석을 통해 저소득 노인이 많이 거주하면서도 폭염 피해 방지가 어려운 사각지대 위치를 찾음

최적의 운영을 위한 운영 기간 찾기

체감온도와 최고 기온을 분석하여 폭염 피해를 예방하기에 적합할 가장 더운 기간을 산출할 수 있을 것이라 기대됌

추후 개선 방안

  • 기온 데이터를 분석하여 실제 폭염이 심한 기간을 산출할 수 있을 것임
  • 폭염 피해 취약 계층을 타겟팅하는 과정에서 추가적인 변수 고려 요함

프로젝트 리뷰

분석 결과를 도출하지 못한 것에 대한 아쉬움

  • 분석을 통해 원하는 결과를 도출한 팀이 많았고, 분석 결과에 따라 피드백의 질이 달라졌음
  • 구체적 분석, 진행 과정이 나아갈수록 더 좋은 피드백을 얻을 수 있음을 깨달음

주제 구체화에 대한 어려움

  • 프로젝트 시작부터 구체적인 주제로 시작했음에도, 어떤 데이터를 쓰는 것이 좋을지, 주제가 정확히 어떤 것인지 정의하는 과정에서 팀원들 간 의견 조율이 필요했음
  • 프로젝트에서 어떤 것은 무엇을 의미하는지 구체적으로 정의하고 이 정의는 팀원간에 통일되어야 하는 것이 중요함을 깨달음

차별화에 대한 어려움

  • 프로젝트 초반 주제와 거의 동일한 연구가 이미 시행되었고, 본 프로젝트에서 고려중인 변수보다도 더 많은 요인을 고려하여 폭염 피해 취약 계층과 위치를 찾아낸 것을 발견함
  • 기존 연구나 분석과의 차별성을 위해 타겟팅 집단을 구체화하는 것으로 결정
  • 기존 연구에서 이미 고려할 수 있는 요인은 모두 고려한 상황에서, 어떤 점에 차별점을 둘 것인지에 대해 팀원들 간 의견도 많이 나누고 많은 시간을 소요함
  • 사람이 하는 생각은 정말 똑같고, 어떤 인사이트를 얻어내느냐가 중요하다는 결론을 얻음

배운 것과 해보는 것은 다르다

  • 분명 공부하고 실습한 부분임에도 코딩하는 과정에서 검색하는 부분이 생김
  • 지속적인 복습과 기록을 습관화하자는 결론
profile
한 걸음씩 쌓아가는 데이터 분석

0개의 댓글