[D+6] Pytorch

siwoo·2023년 11월 13일

네이버부스트캠프 AI Tech 6기

목록 보기

2/18

❓ Why Pytorch?

보편적으로 사용하는 딥러닝 프레임 워크에는 tensorflow, pytorch, keras가 있다.

프레임 워크	keras	tensorflow	pytorch
특징	low-level API	low-high level API	low-high level API
	tensorflow와 pytorch를 감싸는 wrapper	define and run	define by run
		상업용	연구용

keras는 초급자도 사용하기 쉬운 직관적인 문법을 갖고 있다는 장점이 있다. 하지만 그만큼 세세한 부분을 사용자 마음대로 바꿀 수 없기 때문에 제한적이다.

세밀한 세팅을 위해서는 tensorflow 혹은 pytorch를 사용한다.

tensorflow는 아래의 순서에 따라 그래프를 생성한다.
1. 그래프를 먼저 정의한다. (define)
2. 실행시점에 데이터를 넣어 출력한다. (run)
그래프를 먼저 정의하기 때문에 유동적인 그래프 생성이 불가능하다.

pytorch는 실행하여 그래프를 생성한다. (define by run)
따라서 보다 동적인 그래프 생성이 가능하다. (dynamic graphic computation)

이러한 특성에 의해 pytorch는 연구, tensorflow는 상업용 목적으로 많이 쓰인다.
부캠은 배움의 목적이기 때문에 pytorch를 가르치는 것 같다.

🌱 Basic Grammers

Pytorch = numpy + autograd + function
이라는 수식으로 정의할 수 있다.

✏ numpy

tensor 연산은 numpy 연산과 아주 유사하다.
다른 점이 있다면, GPU에 올려서 연산이 가능하며 view라는 효율적인 display 함수가 있다는 것이다.

view는 reshape 함수와 마찬가지로 텐서의 shape을 바꾸어 볼 수 있는 함수이다.

	view	reshape
차이	원본의 메모리 주소를 참고하여 새로운 모양의 텐서 반환	가능하다면 view를 반환, 불가능하다면(uncontiguous) contiguous 한 텐서로 copy해 view 반환

이렇게 본다면 view 함수가 훨씬 효율적인데 왜 reshape 함수가 따로 있나 싶다.

하지만 view 함수는 contiguous 하지 않을 경우 작동하지 않기 때문에 그러한 경우에 대비해 reshape 함수를 일반적으로 많이 사용하는 것 같다.

✏ autograd

backward() -> 역전파 계산을 통해 수식에 사용된 텐서 객체의 grad를 업데이트한다.

✏ function

torch.nn.functional 내에서 제공하는 다양한 함수가 있다.

🔥 Structure of Project

기능별로 다양한 모듈을 만들고 조립하는 식으로 프로젝트 파일을 만들 수 있다.