[딥러닝 홀로서기] Lec6. Binary / Multi-label Classifciation

YJ·2024년 10월 7일

딥러닝 홀로서기

목록 보기

6/24

이 블로그글은 2019년 조재영(Kevin Jo), 김승수(SeungSu Kim)님의 딥러닝 홀로서기 세미나를 수강하고 작성한 글임을 밝힙니다.

→ 각각을 0과 1로 encoding할 필요가 있다.

Study Hours에 따른 Pass(1)/Fail(0) 문제가 예가 될 수 있음
Linear Regression Hypothesis를 적용해서 문제를 풀 수 있을까?
- 새로운 데이터로 모델이 변하여 잘못 분류가 일어날 수 있음
- Continuous한 값이므로 0보다 작거나 1보다 큰값이 나올 수 있음

→ Linear Regression Hypotheis에 적절한 함수를 적용해서 Binary Classifciation Hypothesis를 정의하자.

Sigmoid (Logistic) Function

Logisitc Hypothesis

Linear Regression에서 썼던 cost function을 그대로 사용하면 되지 않을까?
- 그래프를 그려보면 saddle point가 많음을 알 수 있음
- trainning을 계속해도 학습해도 학습이 되지 않고 local minimum에 갖혀버리게 됨

💡 saddle point (안장점)
함수의 기울기가 0이지만, 최소값이나 최대값이 아닌 지점으로, 한 방향에서는 함수값이 증가하고 다른 방향에서는 감소하는 지점

Cross Entropy

두 확률 분포의 차이를 측정하는 지표
- P(x) : 실제확률
- Q(x) : 예측확률
- 예측이 정확할수록 값이 작아지고, 예측하기 어려울수록 값이 커짐.

💡 Entropy(엔트로피)
어떤 일이 일어날지 예측하기 어려운 정도를 나타내는 값
사건들이 모두 비슷한 확률로 일어나면 엔트로피는 높고, 어떤 사건이 일어날 가능성이 훨씬 크면 엔트로피는 낮아짐

→ 즉 잘 예측한 경우 값이 작아지고 예측을 잘못하면 값이 커짐