📄 앞서 배운 다양한 회귀 분석을 통해서 보스턴 주택 가격을 예측해봅시다.
https://www.rdocumentation.org/packages/spdep/versions/0.6-15/topics/boston
각 변수의 의미는 다음과 같습니다:
( 저희 데이터에는 원문 링크에 있는 열이 일부 없지만 무시하셔도 괜찮습니다 🙂 )
- TOWN: 소속 도시 이름
- TOWN_Number : 소속 도시의 고유 번호
- LON : 경도(Longitudes)
- LAT : 위도(Latitudes)
- CMEDV: 주택 가격 중앙값
- CRIM: 도시시(Town) 별 1인당 범죄율
- ZN: 25,000 평방 피트를 초과하는 거주지역의 비율
- INDUS: 비소매상업지역이 점유하고 있는 토지 비율
- CHAS: 찰스강에 대한 더미 변수(강의 경계에 위치한 경우는 1, 아니면 0)
- NOX: 소속 도시의 농축 일산화질소
- RM: 주택 1가구당 평균 방의 개수
- AGE: 1940년 이전에 건축된 소유주택의 비율
- DIS: 5개의 보스턴 직업센터까지의 접근성 지수
- RAD: 방사형 도로까지의 접근성 지수
- TAX: 10,000 달러 당 재산세율
- PTRATIO: 자치시(Town)별 학생/교사 비율
- B: 1000(Bk - 0.63)^2, 여기서 Bk는 도시(Town)별 흑인의 비율을 말한다.
- LSTAT: 하위 계층 비율
👻 Q1. 탐색적 데이터 분석을 통해 히트맵으로 시각화해봅시다.
Q2. 앞서 자전거 수요 예측하기에서 사용했던 다음의 선형 회귀 모델을 학습합니다.
Q3. 자전거 수요 예측 때와 마찬가지로 각 특성들의 coefficients 값을 출력해보세요.