Logistic Regression
Binary Classification
예제
그래프 확인
Linear Regression 구현
결론
독립변수에 따라 경계선이 달라지므로 분류 문제를 Linear Regression으로 해결 X
1. Logistic Regression 이론
1. sigmoid
2. loss function
3. Cross Entropy
2. Logistic Regression 구현
python 구현
exp() : 지수승
sklearn 구현
tensorflow 구현
* Admission 예제
1. 결측치
2. 이상치
zscore_threshold = 2.0
outlier = df['gre'][(np.abs(stats.zscore(df['gre'])) > zscore_threshold)]
df = df.loc[np.isin(df['gre'], outlier, invert=True)]
df = df.loc[~df['gre'].isin(outlier)
np.abs(stats.zscore(df['gre'])) > zscore_threshold : mask 형태로 나옴
mask를 가지고 df['gre']에 대해서 boolean indexing
np.isin() : outlier가 있으면 true
~ : oulier가 있으면 False로 나옴
invert=True : oulier가 있으면 False로 나옴
boolean indexing해서 True(outlier가 없는)인 행만 가져옴
3. 정규화
sklearn 구현
tensorflow 구현
sigmoid를 activation함수로 사용하는 cross entropy를
logit이라고 불리는 linear regression을 가지고 구함