분류 (Classification)

Vincent·2023년 5월 21일
0

이진 분류 (Binary Classification)

1. 로지스틱 회귀

이름은 Regression이지만 사실은 이진 분류 문제

로지스틱 회귀의 구조

  • Linear Regression과 비슷한 구조이나, Linear Layer의 결과물에 sigmoid 함수를 통과시킨다는 점에서 차이가 있음
  • 출력 벡터의 각 차원 별로 하나의 문제
  • Sigmoid의 출력값은 0에서 1이므로, 확률 값으로 생각해볼 수 있음
  • Regression의 경우에는 보통 손실함수 MSELoss를 활용하여 파라미터를 최적화 하지만, Classification의 경우에는 BCELoss를 활용하여 파라미터를 최적화하며, Accuracy를 통해 우리는 모델의 성능을 평가할 수 있다.

실습 (유방암 진단)

pairplot 통해 관계성 파악하여 분석에 사용할 독립변수 추출 (선형 관계에 있는)

2. Binary Classification with DNN

linear layer의 결과물에 sigmoid 함수를 통과시키는 로지스틱 회귀와 달리 Deep Neural Network의 결과물에 sigmoid 함수를 통과시킨다.

preprocessing 시 주의 할 점은, fit은 training set에만 적용하고 transform은 전체에 해줘야 한다는 것이다.
training set을 통해 unseen, unpreprocessed data를 예측하고자 하는 거니까…

validation은 학습을 하지 않으므로 파라미터 업데이트가 있으면 안된다. 따라서 Computation graph를 만들 필요가 없다. -> torch.no_grad()
셔플할 필요도 없다.

다중 분류 (Classification)

Regression에서의 loss : mse loss
Classification에서의 loss : cross-entropy

profile
Frontend & Artificial Intelligence

0개의 댓글