데이터 분석 4-13 4주차 끝 & 숙제 설명

addison·2022년 5월 5일
0

데이터 분석

목록 보기
9/48

📄 앞서 배운 다양한 회귀 분석을 통해서 보스턴 주택 가격을 예측해봅시다.

https://www.rdocumentation.org/packages/spdep/versions/0.6-15/topics/boston

각 변수의 의미는 다음과 같습니다:
( 저희 데이터에는 원문 링크에 있는 열이 일부 없지만 무시하셔도 괜찮습니다 🙂 )

  • TOWN: 소속 도시 이름
  • TOWN_Number : 소속 도시의 고유 번호
  • LON : 경도(Longitudes)
  • LAT : 위도(Latitudes)
  • CMEDV: 주택 가격 중앙값
  • CRIM: 도시시(Town) 별 1인당 범죄율
  • ZN: 25,000 평방 피트를 초과하는 거주지역의 비율
  • INDUS: 비소매상업지역이 점유하고 있는 토지 비율
  • CHAS: 찰스강에 대한 더미 변수(강의 경계에 위치한 경우는 1, 아니면 0)
  • NOX: 소속 도시의 농축 일산화질소
  • RM: 주택 1가구당 평균 방의 개수
  • AGE: 1940년 이전에 건축된 소유주택의 비율
  • DIS: 5개의 보스턴 직업센터까지의 접근성 지수
  • RAD: 방사형 도로까지의 접근성 지수
  • TAX: 10,000 달러 당 재산세율
  • PTRATIO: 자치시(Town)별 학생/교사 비율
  • B: 1000(Bk - 0.63)^2, 여기서 Bk는 도시(Town)별 흑인의 비율을 말한다.
  • LSTAT: 하위 계층 비율

👻 Q1. 탐색적 데이터 분석을 통해 히트맵으로 시각화해봅시다.
Q2. 앞서 자전거 수요 예측하기에서 사용했던 다음의 선형 회귀 모델을 학습합니다.
Q3. 자전거 수요 예측 때와 마찬가지로 각 특성들의 coefficients 값을 출력해보세요.

0개의 댓글