Docker 기반 OpenRouteService를 활용한 도보 소요 시간 계산(2)

cmkkws·2025년 7월 13일

관측값 필터링

50,670건의 거래내역을 도보시간을 통해 필터링하는 작업을 진행하였다.

연수구 송도동과 서구 전체 지역의 관측값 중 서구 전체 지역에 대한 필터링을 진행하였다.

필터링 조건은 다음과 같다.

  • 인근 7개의 역을 포함한 10개의 역 중 연장 개통된 3개의 역(아라역, 신검단중앙역, 검단호수공원역)의 도보소요시간 값이 최소인 주택
  • 주택 ~ 역간 도보소요시간이 1800초 이내인 경우(30분 이내, 기준에 대한 근거 확인하지 못함, 세분화 필요)

또한 어느 역에 제일 가까운지 알 수 있도록 역 코드를 기입했다.
(0: 아라역, 1: 신검단중앙역, 2: 검단호수공원역)

분류 결과를 folium 라이브러리를 통해 간단하게 시각화를 해보았다.

역 코드별 필터링된 주택의 갯수는 다음과 같다.

50,670 건의 거래내역에서 3,248 건만큼 필터링 된 것을 알 수 있다.

또한 아라역에 대한 주택 거래 건수가 약 85%를 차지하고 있어. 3개의 역을 각각 나눌 경우 관측값이 적어 함께 분석을 진행하는 것이 옳다고 판단해 분류 없이 분석을 진행하였다.

접근도 변수 생성

도보시간을 이용해 도보시간을 이용해 권역에 대한 변수를 생성하였다.

주택의 가격에 근처의 교육환경, 의료환경, 문화 환경 등의 권역 별로 영향을 받기 때문에 접근도에 대한 변수를 구할 필요가 있었다.

우선 교육환경에 대한 접근도 변수를 생성하는 활동을 진행하였다.

학교, 학원, 유치원에 대한 위도, 경도 데이터이다.(1,517건)
위의 데이터와 앞서 필터링 했던 관측값의 위도, 경도 데이터를 매핑을 통해 도보소요시간을 구했다.

도보소요시간에 대한 변수를 나누는 기준은 다음과 같다.

  • A,B,C 집단으로 구분(A: 학교, B: 학원, C: 유치원, 구분 별 가중치를 따로 두어야 하기 때문에)
  • 구간을 3가지 구간으로 구분(~10분, ~20분, ~30분)

앞으로...

  • 학교, 학원, 유치원의 가중치를 어떻게 두어야 할지 판단을 할 수 없어 관련 연구에 대한 논문을 찾아보면서 설정하려고 한다.
  • 교육환경 접근도 변수(1,517) * 주택 건수(3,248) = 4,927,216 건의 호출이 필요해 50퍼센트 정도 완료하였고, 다음 세미나 전까지 다른 접근도 변수(의료, 문화)를 구하는 것을 목표로 한다.
  • 거래가격 관련 예측 분석 방법론에 대한 논문을 읽어보면서 설명력이 높은 모델을 찾아보려고 한다.

0개의 댓글