1) 숙제 설명
해당 데이터의 각 열에 대한 설명 원문(영어)은 아래의 링크에서 확인 가능합니다.
▶[코드스니펫] - 보스턴 주택 가격 칼럼 설명 원문
https://www.rdocumentation.org/packages/spdep/versions/0.6-15/topics/boston
각 변수의 의미는 다음과 같습니다:
( 저희 데이터에는 원문 링크에 있는 열이 일부 없지만 무시하셔도 괜찮습니다 🙂 )
TOWN: 소속 도시 이름
TOWN_Number : 소속 도시의 고유 번호
LON : 경도(Longitudes)
LAT : 위도(Latitudes)
CMEDV: 주택 가격 중앙값
CRIM: 도시시(Town) 별 1인당 범죄율
ZN: 25,000 평방 피트를 초과하는 거주지역의 비율
INDUS: 비소매상업지역이 점유하고 있는 토지 비율
CHAS: 찰스강에 대한 더미 변수(강의 경계에 위치한 경우는 1, 아니면 0)
NOX: 소속 도시의 농축 일산화질소
RM: 주택 1가구당 평균 방의 개수
AGE: 1940년 이전에 건축된 소유주택의 비율
DIS: 5개의 보스턴 직업센터까지의 접근성 지수
RAD: 방사형 도로까지의 접근성 지수
TAX: 10,000 달러 당 재산세율
PTRATIO: 자치시(Town)별 학생/교사 비율
B: 1000(Bk - 0.63)^2, 여기서 Bk는 도시(Town)별 흑인의 비율을 말한다.
LSTAT: 하위 계층 비율
👻 Q1. 탐색적 데이터 분석을 통해 히트맵으로 시각화해봅시다.
Q2. 앞서 자전거 수요 예측하기에서 사용했던 다음의 선형 회귀 모델을 학습합니다.
Q3. 자전거 수요 예측 때와 마찬가지로 각 특성들의 coefficients 값을 출력해보세요.
▶선형회귀 모델 학습 코드 참고
▶Coefficients 값 출력 예시