Python L/B Numpy

HGY·2023년 6월 14일

Python

목록 보기

8/13

L/B

모듈(module)이라고도 불리며, 함수, 변수들을 모아놓은 공간

표준 L/B

파이썬에서 기본으로 제공하는 L/B

외부 L/B

개발자가 필요에 의해 개발한 패키지와 모듈의 집합

Numpy

Numpy의 특징

Numerical Python의 약자
데이터의 숫자계산을 간편하게 해주는 라이브러리
파이썬의 자료형인 list형태와 비슷하지만, 동일한 자료형을 담는다
반복문 없이 각 데이터의 연산이 가능하다
각 값들마다 index번호를 부여받는다
ndarray라고 불리는 Numpy배열을 생성할 수 있다.

Numpy배열 array와 list의 차이점

array배열은 배열끼리의 연산이 가능하다.
인덱스 번호가 같은 요소끼리 연산됨. 단, 배열의 크기가 같아야 한다.
list자료형은 값의 자료형에 상관없이 모두 담을 수 있지만,
Numpy배열 array는 동일한 자료형만 담을 수 있다

N차원 배열(array) 만들기

numpy 라이브러리 호출

import numpy as np

// 관념적으로 np로 별칭을 설정한다.

array() : 배열 생성하기
array는 list를 값으로 가져야 생성된다.

np.array(리스트값)

// 리스트를 다중 구조로 만들면 그만큼 N차원 배열이 생성된다.

array와 list의 차이점
1. array는 연산이 가능하다.
2. array는 값의 자료형이 동일해야 한다.

numpy 범용 함수

sum() : 합계를 구해주는 함수
mean() : 평균값을 구해주는 함수
max() : 최대값을 구해주는 함수
min() : 최소값을 구해주는 함수

array배열의 자료구조 확인 함수

shape() : 배열의 크기 확인하기

배열명.shape

size() : 배열의 요소 개수 확인하기

배열명.size

ndim() : 배열의 차원 확인하기

배열명.ndim

dtype() : 배열의 타입 확인하기

배열명.dtype

특정한 방식으로 array배열 생성하기

zeros() : 배열 안의 모든 데이터를 0(실수형)으로 초기화해서 생성하기

np.zeros(배열의 크기)
// 배열의 크기는 튜플 자료형으로 작성한다

ones() : 배열 안의 모든 데이터를 1(실수형)으로 초기화해서 생성하기

np.ones(배열의 크기)
// 배열의 크기는 튜플 자료형으로 작성한다

full() : 배열 안의 모든 데이터를 특정 값으로 초기화해서 생성하기
두개의 매개변수를 사용한다.

np.full((배열의 크기), 특정 값)
// 배열의 크기는 튜플 자료형으로 작성한다

arange() : 반복문 없이 반복하는 배열 생성하기

// np.arange(시작값, 끝값(포함x), 증감값)
// range() 함수와 동일하게 작성한다

np.arange(1, 101, 4)
// 1부터 100까지 4씩 증가하는 배열 생성

random : 랜덤 값으로 구성된 배열 생성하기

// np.random.randint(시작, 끝, size=(배열크기))

np.random.randint(1, 46, size=(2,3))

// 1부터 45 사이의 값 중 무작위로 뽑아서 2행 3열의 2차원 배열 생성하기

데이터 타입 변경

astype() : 배열에 담긴 데이터의 타입 변경하기

// 배열명.astype('데이터타입')

arr.astype('int')

// 배열의 데이터 타입 int로 변경

array배열의 연산

numpy는 기본적으로 array간의 사칙연산을 지원한다
같은 위치에 있는 요소들끼리 연산된다.

arr_a = np.array([1,2,3])
arr_b = np.array([4,5,6])

arr_a + arr_b

// 실행 시 [5,7,9] 로 출력된다.

배열의 차원 구조 재배치

원래있던 배열을 새로운 차원의 배열로 재배치할 때 사용한다
기존의 인덱스 값을 정확하게 맞춘 구조로 지정해야 사용할 수 있다.

reshape() : 배열 재배치에 사용한다. ()안에 쉼표를 찍어 행과 열을 구분한다.
행,열 값 중에 한 곳에 -1을 입력하면 자동으로 계산된다.

arr_20 = np.arange(1, 51, 1)
// arr_20은 1부터 50까지 증가하는 값을 가진 1차원 배열이다

arr_20.reshape(5,10)
// 5행 10열을 가진 2차원 배열로 재배치한다.

arr_20.reshape(10,-1)
// 10행 ?열을 가진 2차원 배열로 자동 재배치한다.

numpy배열의 인덱싱과 슬라이싱

인덱싱

list의 인덱싱과 마찬가지로 대괄호 []를 사용하며, 사용 방식도 동일하다
행과 열을 지정할 때는 대괄호[] 안에 쉼표 ,를 기준으로 행,열로 구분한다.

arr_2 = np.array([[1,2,3],
          		[4,5,6]])
                
// arr_2에서 정수 2 가져오기
arr_2[0,1]

2차원 배열의 인덱싱

arr_20[[2,3],[1,2]]

// 2차원 배열 arr_20에서 22와 33을 동시에 가져오기

연속되지 않는 값을 인덱싱 할 때는 list자료형을 활용해 가져올 값의 행과 열을 지시한다.
앞쪽에는 가져올 값들의 행값을 순서대로 지시하고, 뒤쪽에는 그 순서에 맞는 열값을 지시한다.

boolean 인덱싱

필터링의 기능을 담당
조건에 해당하는(True) 값들만 출력할 때 사용
조건에 해당하는 값이 존재하는지 모를 때 사용

arr_20[arr_20 > 5]

// arr_20의 인덱스 값 중에서 5보다 큰 값들만 인덱싱하기

슬라이싱

인덱싱과 같은 방식을 사용한다.

arr_10 = np.arange(0, 11, 1)
// arr_10은 0부터 10까지 증가하는 값을 가진 배열이다

// 2부터 5까지 슬라이싱하기
arr_10[2:6]

// 3부터 끝까지 슬라이싱하기
arr_10[3:]

HGY

바보 개발자 지망생

이전 포스트

Python 함수

다음 포스트