오늘은 지하철역 EDA에 대해서 더 심화로 들어갔다.
할당: @ChoonB
전세가격과 최근접 지하철역과의 거리는 -0.22의 상관관계가 있다.
각각 로그 변환시 -0.27로 늘어난다.
평당가격과 최근접 지하철역과의 거리는 -0.29의 상관관계가 있다.
각각 로그 변환시 -0.41로 매우 강한 상관관계가 보인다.
전세가격과 1km이내 지하철역의 수는 상관계수 0.314987, 평당가격과는 0.419536가 나온다.
500m로 할 시 상관계수는 0.221344, 0.311769로 오히려 떨어진다.
1km이내 지하철역 수를 클래스로 만들어 평균 전세가격과 평균 평당가격을 봤을때는 강한 상관관계가 보인다.
평당가격이 오히려 더 설명이 잘되어 보인다.
추후 외부 행정구역 데이터를 공급해준다고 하니 큰 변화가 있을 것 같다.
index를 제외한 나머지 열이 모두 동일한 행들을 중복데이터로 여겨서 뺄지, 의미있는 데이터로 볼지에 대해 논의를 해봐야할 것 같다.
연휴 시작이지만 늘어지지말고 코테 준비 열심히해보자!!