결정이론이란!
새로운 값 x가 주어졌을 때 확률모델 p(x, t)에 기반해 최적의 결정을 내리는 것
- 추론단계 : 결합확률 분포 p(x,Ck)를 구하는것 - p(Cx∣x)를 직접 구하는 경우도 있음-
- 결정단계 : 상황에 대한 확률이 주어졌을 때 어떻게 최적의 결정을 내릴 것인지를 결정하는 단계이다
기대손실 최소화(minimizing the expected loss)
모든 결정이 동일한 리스크를 갖고 있는것은 아니다
ex)
- 암이 아닌데 암인 것으로 진단
- 암이 맞는데 암이 아닌것으로 진단
E[L] 수식 정리
기대손실 최소화 의료진단 예시
- 암이 아닌데 암인 것으로 진단 1
- 암이 맞는데 암이 아닌것으로 진단 100
결정이론 회귀
-
손실함수 L(x,y(x))=(y(x)−t)2
-
x를 위한 최적의 예측값 y(x) 의 경우 Et[t∣x]이다.
Euler - Lagrange Equation
-
Euler -Lagrange Equation을 통해 손실함수의 기댓값을
최소 로 하는 y(x)를 구할수 있다.
-
이때 dG∗/dxdy′ 의 경우 0이 되기에 계산이 쉽게 된다
-
위 식과 같이 y(x) 의 경우 Et[t∣x]임을 알 수있었다.
EDA과제중 코드 꿀팁
'100%' 이런 string형태의 퍼센트를 float형태로 바꿔주자
def ptf(p):
return float(p.strip('%'))/100
info로 데이터 타입 확인하자
null값들 확인하려면
- dataframe.isnull().sum()
각 열마다 데이터 타입 바꿔 주기
- data[내가원하는열].astype("내가원하는 타입" ex) bool, float64, int64)
데이터에 null값이 있는데 이를 바꿔 주고 싶다면
- data['null값이있는열'] = data['null값이있는열].replace(np.nan,"내가 봐꿔 주고 싶은것)
코딩테스트 준비하며 알게된것
print('새로 알게된것', end= " ")
print("end를 쓰면 두줄이 한줄로 나와요")