Data Science 2 필기 - 0317

Goodis·2023년 3월 19일
0

DataScience

목록 보기
2/2

20문제 중 기억에 남는 부분만 기록

1. T 분포의 확률 밀도함수는 대칭 함수이다?

-> O


2. ROC Curve 에서 면적이 0에 가까운 경우 성능이 좋다?

-> X
면적이 클수록 좋다.


3. 잔차분석에 대한 내용도 문제로 하나 출제됨(기억안남)


4. 로지스틱 회귀모델에서 승산에 대한 문제 출제됨

 1. odd = p / (1-p) 이다?
 2. odd 는 음의 값을 가질 수 있다? V
 3. odd 에 자연 로그를 씌우면 음의 무한대부터 양의 무한대까지 값을 가진다?
 4. 기억안남

이렇게 나온듯?


5. 지니 지수에 대한 문제도 나온 것 같은 느낌,,

gini = 1- (p^2 + (1-p)^2), 0<=gini<=0.5


6. bagging에 대한 문제

- 모델의 안정성과 정확도를 향상시키기 위한 기법
- 분산을 줄이고 과적합을 방지
- 각 모델을 생성하기 위해 사용하는 데이터는 부트스트랩 샘플 데이터
- 각 모델의 예측값을 취합할 때 평균(회귀 모델) 또는 투표(분류 모델) 활용

7. 트리 문제

연산 시간이 빠르다?
-> X
트리 개수가 많을 경우 연산 시간이 오래 걸리고 RAM 소모가 크다.


8. 표준 정규 분포

- 평균은 0이고, 표준 편차는 1인 정규 분포를 표준 정규 분포라고 한다.
- 좌우 대칭이며 첨도가 0이고 왜도도 0이다.

기억이 난다면 추가로 적어볼 예정

profile
software developer

0개의 댓글