Numpy도 연산이 가능합니다.
지수(exponent) : 부동 소수점으로 숫자를 표시할 때 거듭제곱을 사용하여 표현.
np.exp(arr) : 밑(base)이 자연상수 e 인 지수함수로 변환(y = e**x)
매우 어렵기 때문에 정확한 이해는 다음에 하기로 한다.
1) 요소 (같은 좌표에 있는 자료들끼리 비교)
값에 대한 비교 : ==, !=
크기에 대한 비교 : >, <, >=, <=
2) 배열 (배열 간의 비교)
비교연산에서는 출력값이 참/거짓으로 도출이 된다.
상관계수란 ?
상관관계를 갖는 상이한 분야의 수치들을 비교했을 때 상대비교가 가능하다.(표준편차와 비슷한 역할을 한다.)
(1) numpy 함수 : np.corrcoef(arr1, arr2)
numpy에서는 2개를 초과하는 요소들의 상관도를 구하는 것은 불가능하다. (판다스는 2개요소씩 짝지은 다수 요소들의 상관도 판단 가능)
앞에서 말했듯 상관관계는 표준편차와 아주 유사한 개념이기 때문에 표준편차 역시 구할 수 있다.
(1) 브로드캐스팅(BroadCasting)
서로 다른 구조(shape)를 가진 배열에 대해 연산을 수행할 때 구조를 맞추는 과정을 브로드캐스팅이라고 합니다.
배열과 스칼라값 간의 연산
배열과 배열 간의 연산
브로드캐스팅 규칙 : 축의 길이가 일치하거나 둘 중 하나의 길이가 1인 두 배열에 대해 호환성을 가짐(주의 : 1일때만 성립)
서로 행과 열이 안맞을 때 사용 가능한 브로드캐스팅
사용할 행렬 준비
(2) 배열과 값(single value, scala)
(3) 서로 다른 구조의 배열
결국 스칼라 함수에서 봤던 결론과 같이 x+y 의 결과값과 new_x + new_y의 결과값은 같다.
요소들에 대한 연산을 벡터 연산으로 처리하면 일반적인 for 반복문으로 연산 작업을 처리하는 것보다 월등히 뛰어난 처리 속도로 효율적인 작업 가능합니다.
Numpy는 연산 부분이 C언어로 구축되어 있어 연산속도가 파이썬보다 굉장히 빠르다.