[짤막] Numpy가 빠른 이유

Jeong SeongYun·2022년 7월 19일

python 짤막 상식들

짤막

목록 보기

6/16

numpy는 데이터를 다룰 때 절대 빼먹을 수 없는 라이브러리 입니다.

데이터는 흔히 2차원의 행렬로 나타낼 수 있습니다.

Tabular 데이터인 경우도 row와 column 형태의 2차원 행렬로 나타낼 수 있고(물론 인코딩을 시킨 후의 형태입니다.)

비정형 데이터인 경우에도 결국 행렬로 표현이 가능하죠. 이미지 같은 경우는 각 픽셀의 값을 행렬로서 모델에 input으로 넣습니다.

이토록 행렬이 많이 사용되는 데이터분야에서 행렬의 계산들을 하나하나 구현하기에는 너무나도 귀찮습니다. 그래서 나온 것이 numpy 입니다.

List

솔직히 생겨먹은 건 list나 numpy의 array나 똑같이 생겼습니다.
둘 다 대괄호([])로 묶여있고 이 대괄호를 겹쳐서 표현하면 그걸 행렬이라고 하니까요.

근데 왜 파이썬에서 기본적으로 제공해주는 list를 쓰지 않고 numpy를 쓰느냐?가 바로 오늘 포스팅의 주제입니다.

그 차이를 알려면 list가 어떤 방식으로 작동하는지 알아야겠죠?

먼저 list는 메모리 효율적이지 못합니다.
Sequence가 들어올 때 동적 할당을 하기도 하고 메모리에 Sequcne를 할당할 때 그대로 메모리에 가져다가 두는 것이 아닌 "주소"를 할당합니다.

우리가 직관적으로 상상했던 것과는 달리, 차례대로 메모리에 넣는 것이 아니라 어느 공간에 할당을 하게 되고, 메모리에 어디 있는지 나타내주는 "주소"를 담게 됩니다.