맵리듀스가 실행되는 절차로 적절한 것은?
① Input - Split - Shuffle & Sort - Map - Combine - Reduce - Output
② Input - Split - Map - Shuffle & Sort - Combine - Reduce - Output
③ Input - Map - Split - Combine - Shuffle & Sort - Reduce - Output
④ Input - Split - Map - Combine - Shuffle & Sort - Reduce - Output
정답 ④
해설
Sort 바로 이후에 Reduce를 해야 한다.
분석 프로젝트 영역별 주요 관리 항목이 아닌 것은?
① 품질
② 시간
③ 가격
④ 자원
정답 ③
해설
분석 프로젝트 영역별 주요 관리 항목은 범위, 시간, 원가, 품질, 통합, 조달, 자원, 리스트, 의사소통, 이해관계자 등이 있다.
다중선형회귀분석에서 종속변수를 설명하는데 가장 중요한 독립변수로 적절한 것은?
① p-value가 가장 작은 변수
② 표준화 자료로 추정한 계수가 가장 큰 변수
③ 원 자료로 추정한 계수가 가장 큰 변수
④ 종속변수와의 상관관계분석에서 상관관계가 가장 큰 변수
정답 ②
해설
다중선형회귀분석에서 종속변수를 가장 잘 설명하는 중요한 독립변수는 추정한 계수가 클수록 종속변수에 가장 영향을 많이 미치게 된다.
특히, 가 없는 표준화된 추정식을 만들게 되면 각 계수의 크기를 더욱 정확히 알 수 있게 된다.
다음 보기 프로그램의 그래프의 carat 종류는 어디에 표시되는가?
k <- ggplot(diamonds, aes(carat, ..density..)) + geom_histogram(binwidth = 0.2)
k + facet_grid(, ~ cut)
① 아래
② 위
③ 좌
④ 우
정답 ②
해설
(, ~ cut)
이라고 쓰면 위라고 한다.
사실 답이 될 수 있는 것이 위밖에 없는 것 같은데?
그것보다 사실 모르겠다.