Autograd ; Automatic gradient calculating API forward와 backward가 가능하게 해줌
패키지화된 코드에서 다른 프로그래머가 custom 코드를 중간에 실행시킬 수 있도록 만들어놓은 인터페이스
torch.nn.Module 딥러닝을 구성하는 layer의 base class 하나의 function, 여러 function으로 이루어진 layer, layer로 이루어진 model이 포함될 수 있다. (Module이 다른 Module을 포함할 수 있다.)
MLE ; Maximum Likelihood Estimation ; 최대 가능도 추정법
모든 학습 데이터를 사용하여 비용함수의 기울기를 계산한다. 일반적인 경사하강법은 이 배치 경사하강법을 의미한다. 전체 데이터를 사용하기 때문에 안정적이지만, 효율적이지 않다.
행렬(matrix) 행렬 A의 크기 : m x n (행 개수 x 열 개수) 이러한 행렬 A를 m by n 행렬 또는 m by n matrix 라고 한다.
해당 포스팅은 "이것이 취업을 위한 코딩 테스트다 with 파이썬" 책을 기반으로 포스팅 하였습니다.
기저란 백터공간 V에 대하여 임의의 벡터집합 S가 ① 서로 1차 독립이면서 ② 벡터공간 V를 생성하면 S는 V의 기저이다.
선형회귀(Linear regression) 학습과정 임의의 파라미터 값을 설정해서 선형모델을 가정한다. train data로 학습한다. loss, cost를 사용해서 MSE를 구한다. ...