0401 Logistic Regression

wldnjswldnjs·2022년 4월 12일
0

머신러닝

목록 보기
7/12

Logistic Regression

Binary Classification

예제

그래프 확인

Linear Regression 구현

결론

독립변수에 따라 경계선이 달라지므로 분류 문제를 Linear Regression으로 해결 X

1. Logistic Regression 이론

1. sigmoid

2. loss function

3. Cross Entropy

2. Logistic Regression 구현

python 구현

exp() : 지수승

sklearn 구현

tensorflow 구현

* Admission 예제

1. 결측치

2. 이상치

zscore_threshold = 2.0
outlier = df['gre'][(np.abs(stats.zscore(df['gre'])) > zscore_threshold)]

df = df.loc[np.isin(df['gre'], outlier, invert=True)]
df = df.loc[~df['gre'].isin(outlier) # 이렇게도 가능
            
# print(outlier)
# print(df.shape)
np.abs(stats.zscore(df['gre'])) > zscore_threshold : mask 형태로 나옴

mask를 가지고 df['gre']에 대해서 boolean indexing 

np.isin() : outlier가 있으면 true

~ : oulier가 있으면 False로 나옴

invert=True : oulier가 있으면 False로 나옴

boolean indexing해서 True(outlier가 없는)인 행만 가져옴

3. 정규화

sklearn 구현

tensorflow 구현

sigmoid를 activation함수로 사용하는 cross entropy를

logit이라고 불리는 linear regression을 가지고 구함

0개의 댓글