
주 2회 ML & DL Study & Q&A 피드백 진행
해당 포스트
📗 나이브 베이즈
스터디원🙎♀️ @dbswls6685
Q. 연속적인 경우에 가우시안 나이브베이즈 말고 나이브베이즈 회귀를 사용해도 되는가?
A. 이론상으로는 연속적인 값이면 베이지안 회귀를 사용할 수는 있다. 하지만 가우시안과 회귀 모델 중 어떤 것이 효율적인지는 따지기 힘들다.
Q. 단점에 피처간의 독립성이 있어야한다고 적었는데, 독립성 가정 자체가 단점이라는 뜻인가?
A. 독립성이 있어야만 나이브베이즈를 쓸 수 있으니까 다양한 데이터를 분석에 활용할 수 없어 제한적이다.
Q. 스무딩에서 빈도수에 1만 더하는 이유는 무엇인가?
A. 조금이라도 다른 단어가 나오면 0이 되어버려 확률이 무력화된다.따라서 의미 소실을 막기 위해 1을 더하는것.
Q. 보통 알고리즘에서 학습 데이터에 없는 신규 데이터를 잘 분류하기 위해 학습을 잘 시시켜 모델을 만든다. 스무딩으로 빈도수를 조정해도 결과에 영향을 미치지 않는가?
A. 0인거를 1로 바꿈으로써 결과가 나오기 때문에, 결과에 큰 영향을 미친다고 말할 수 있다.
Q. 베르누이 나이브베이즈는 0,1이니까 이진분류만 가능한데, 가우시안은 상관없는가?
A. 가우시안은 다중분류가 가능하다. 정규분포 가정이 있으면 가우시안 쓸 수 있다.
Q. 나이브베이즈는 시각화 할 수 없는가, 그래프로 결과를 볼 수 있나?
A. 데이터의 확률분포를 그래프로 시각화해 분포를 볼 순 있지만, 분류 모델이기 때문에 매트릭스와 정확도 이외의 결과를 시각화하긴 힘들다. 회귀와 달리 시각화 없이도 모델의 성능을 확인할 수 있다.
Q. 베이지안 회귀와 다른점
A. 가능도를 최대화하는 것이 목적