1. a, b, c 특성으로 이루어진 훈련 세트를 PolynomialFeatures(degree=3)으로 반환했습니다. 다음 중 이 변환된 데이터에 포함되지 않는 특성은 무엇인가요?
① 1
② a
③ a b
④ a b^2
2. 다음 중 특성을 표준화하는 사이킷런 변환기 클래스는 무엇인가요?
① Ridge
② Lasso
③ StandardScaler
④ LinearRegerssion
3. 다음 중 과대적합과 과소적합을 올바르게 표현하지 못한 것은 무엇인가요?
① 과대적합인 모델은 훈련 세트의 점수가 높습니다.
② 과대적합인 모델은 테스트 세트의 점수도 높습니다.
③ 과소적합인 모델은 훈련 세트의 점수가 낮습니다.
④ 과소적합인 모델은 테슨트 세트의 점수도 낮습니다.
<풀이>
1. 답 ④ 최고 차수가 3이므로 추가되는 특성은 1, a, b, c, a^2, b^2, c^2, ab, bc, ac, abc, ab^2, ac^2, bc^2, ca^2, cb^2, a^3, b^3, c^3 이다.
2. 답 ③ 특성을 표준화로 변환하는 전처리 클래스는 StandardScaler 이다.
① Ridge는 릿리 회귀를 위한 클래스
② Lasso는 라쏘 회귀를 위한 클래스
④ LinearRegression은 선형 회귀를 위한 클래스
3. 답 ② 과대적합인 모델은 훈련 세트의 점수에 비해 테스트 세트의 점수가 크게 낮다.