3-3 딥러닝 학습방법 이해

마친자·2024년 2월 6일

[부스트코스]AI 엔지니어 기초 다지기

목록 보기

11/22

비선형 모델인 신경망(neural network)

[참고]소프트 맥스

소포트맥스 함수는 모델의 출력을 확률로 해석할 수 있게 변환해주는 연산입니다.
분류 문제를 풀떄 선형모델과 소프트맥스 함수를 결합하여 예측
학습을 하는 경우는 사용하나, 추론으로 할때는 최댓값을 가진 주소만을 1로 출력하는 연산을 사용하므로 소포트 맥스가 아닌 원핫벡터를 사용함 np.max() 하는 이유는 소프트맥스는 지수함수를 사용하는데 너무 큰 숫자가 들어올때 오버플로우 현상이 나타날 수 있기 때문에 사용

신경망은 선형모델과 활성함수(activation function)를 합성한 함수이다

선형모델에 나온 출력값을 소프트맥스를 취해 분류문제를 해결

활성함수는 보통은 비선형함수로서 선형모델에서 나온 출력물 각각의 원소에 적용

소프트맥스는 출력물 전체에 적용한다면, 다른 주소에 있는 출력값을 고려하지 않고 해당하는 주소의 값을 고려(벡터값이 아닌 실수값)

활성함수는 잠재벡터(z)의 각 노드에 개별적으로 적용하여 새로운 잠재벡터(H)를 만든다

신경망에서 활성함수가 필요한 이유는 비선형 근사를 하기 위해서이다.