50,670건의 거래내역을 도보시간을 통해 필터링하는 작업을 진행하였다.
연수구 송도동과 서구 전체 지역의 관측값 중 서구 전체 지역에 대한 필터링을 진행하였다.
필터링 조건은 다음과 같다.
또한 어느 역에 제일 가까운지 알 수 있도록 역 코드를 기입했다.
(0: 아라역, 1: 신검단중앙역, 2: 검단호수공원역)

분류 결과를 folium 라이브러리를 통해 간단하게 시각화를 해보았다.

역 코드별 필터링된 주택의 갯수는 다음과 같다.

50,670 건의 거래내역에서 3,248 건만큼 필터링 된 것을 알 수 있다.
또한 아라역에 대한 주택 거래 건수가 약 85%를 차지하고 있어. 3개의 역을 각각 나눌 경우 관측값이 적어 함께 분석을 진행하는 것이 옳다고 판단해 분류 없이 분석을 진행하였다.
도보시간을 이용해 도보시간을 이용해 권역에 대한 변수를 생성하였다.
주택의 가격에 근처의 교육환경, 의료환경, 문화 환경 등의 권역 별로 영향을 받기 때문에 접근도에 대한 변수를 구할 필요가 있었다.
우선 교육환경에 대한 접근도 변수를 생성하는 활동을 진행하였다.

학교, 학원, 유치원에 대한 위도, 경도 데이터이다.(1,517건)
위의 데이터와 앞서 필터링 했던 관측값의 위도, 경도 데이터를 매핑을 통해 도보소요시간을 구했다.
도보소요시간에 대한 변수를 나누는 기준은 다음과 같다.
