ㅤ
ㅤ
ㅤ
ㅤ
Linear regression
Hypothesis
cost
grafient decent
ㅤ
ㅤ
ㅤ
ㅤ
Supervised Learning의 한 종류로, 예측된 확률이 0.5보다 크면 1(양성)로, 0.5(음성)보다 작으면 0으로 판단한다.
Binary Classification
으로 할 수 있는 것
ㅤ
ㅤ
ㅤ
ㅤ
Logistic Regression Classification
알고리즘은 classification algorithm 중에서 가장 정확도가 높은 알고리즘으로 알려져 있으며, 실제 문제에 바로 적용할 수 있을 만큼 정확도가 높다.
아래는 적용 가능한 예시이다.
ㅤ
ㅤ
0과 1로 예측하는 코딩을 한다.
ㅤ
ㅤ
예를 들어,
아래에 학생의 공부 시간에 따른 시험 합격 여부 그래프가 있다.
아래 있는 점은 6시간 이하로 만 공부한 친구들의 합격 여부이고, 위의 점은 7시간 이상 공부한 친구들의 합격 여부이다.
Linear regression을 사용하면 아래와 같이 0.5 이상은 합격
, 0.5 이하는 불합격
으로 구분된다.
하지만 한 친구가 50시간 이상 공부를 하면 어떨까?
기존 선이 오른쪽으로 낮아지면서 합격이였던 친구가 불합격으로 예측된다.
따라서 이 문제는 다른 방법을 사용해야하는데, 그 문제를 Logistic Hypothesis를 사용하여 해결할 수 있다.
ㅤ
ㅤ
ㅤ
ㅤ
기존 가설을 Sigmoid function을 사용해 새로 정의해줄 수 있다.
기존 가설에서 H(x)를 Z로 바꿔주어 계살할 수 있다.
위의 가설과 함수를 사용하면 직선이 아닌 S모양의 더 적합한 그래프가 나오게 된다.
ㅤ
ㅤ
Sigmoid function
을 사용하면 0.5 이상 혹은 0.5 이하가 무조건 0 또는 1이 되는 것이 아니라, 그 값 그대로 0과 1에 가까워질 뿐이게 된다.