이름은 Regression이지만 사실은 이진 분류 문제
pairplot 통해 관계성 파악하여 분석에 사용할 독립변수 추출 (선형 관계에 있는)
linear layer의 결과물에 sigmoid 함수를 통과시키는 로지스틱 회귀와 달리 Deep Neural Network의 결과물에 sigmoid 함수를 통과시킨다.
preprocessing 시 주의 할 점은, fit은 training set에만 적용하고 transform은 전체에 해줘야 한다는 것이다.
training set을 통해 unseen, unpreprocessed data를 예측하고자 하는 거니까…
validation은 학습을 하지 않으므로 파라미터 업데이트가 있으면 안된다. 따라서 Computation graph를 만들 필요가 없다. -> torch.no_grad()
셔플할 필요도 없다.
Regression에서의 loss : mse loss
Classification에서의 loss : cross-entropy