import numpy
a=numpy.array([1,2,3,4,5])
import numpy as np
a=np.array([1,2,3,4,5])
from numpy import array
a=array([1,2,3,4,5])
- Axis : 배열의 각 축 ex) axis0, axis1
a = np.array([1, 2, 3, 4, 5])
print(a) # [1 2 3 4 5]
print(type(a)) # <class 'numpy.ndarray'>
print(a.ndim) # 1 <-- 차원
print(a.shape) # (5, ) <-- 모양
print(a.dtype) # int32 <-- 데이터 형식
a = np.array([[1.5, 2.5, 3.2],
[4.2, 5.7, 6.4]])
print(a)
print(a.ndim) # 2
print(a.shape) # (2, 3)
print(a.dtype) # float64
a3 = [[[1, 3, 1],
[4, 7, 6],
[8, 3, 4]],
[[6, 2, 4],
[8, 1, 5],
[3, 5, 9]]]
print(a.ndim) # 3
print(a.shape) # (2,3,3)
print(a.dtype) # int64
# (2, 3) 형태의 2차원 배열 만들기
a = np.array([[1, 2, 3],
[4, 5, 6]])
# (3, 2) 형태의 2차원 배열로 Reshape
b = a.reshape(3, 2)
참조 : 배열을만드는여러함수들
- np.zeros( ) :0으로채워진배열
- np.ones( ) : 1로채워진배열
- np.full( ) : 특정값으로채워진배열
- np.eye( ) : 정방향행렬
- np.random.random( ) : 랜덤값으로채운배열
# 2차원 배열 만들기
score= np.array([[78, 91, 84, 89, 93, 65],
[82, 87, 96, 79, 91, 73]])
# 요소 중에서 90 이상인 것만 조회
print(score[score >= 90])
# 요소 중에서 90 이상인 것만 조회
condition = score >= 90
print(score[condition])
# array를 생성합니다.
a = np.array([[1,5,7],[2,3,8]])
# 전체 집계
print(np.sum(a))
# 열기준 집계
print(np.sum(a, axis = 0))
# 행기준 집계
print(np.sum(a, axis = 1))
print(a)
# 전체 중에서 가장 큰 값의 인덱스
print(np.argmax(a))
# 행 방향 최대값의 인덱스
print(np.argmax(a, axis = 0))
# 열 방향 최대값의 인덱스
print(np.argmax(a, axis = 1))
# 선언
a = np.array([1,3,2,7])
# 조건
np.where(a > 2, 1, 0)
# 라이브러리 불러오기
import pandas as pd
# 딕셔너리 만들기
dict1 = {'Name': ['Gildong', 'Sarang', 'Jiemae', 'Yeoin'],
'Level': ['Gold', 'Bronze', 'Silver', 'Gold'],
'Score': [56000, 23000, 44000, 52000]}
df = pd.DataFrame(dict1)
# 데이터 읽어오기
path = 'https://raw.githubusercontent.com/DA4BAM/dataset/master/titanic_simple.csv'
data = pd.read_csv(path)
# 상위 10행만 확인
data.head(10)
# 단일 열 정렬
tip.sort_values(by='total_bill', ascending=False
# 복합 열 정렬
tip.sort_values(by=['total_bill', 'tip'], ascending=[False, False])
# day 열 고유값 확인
tip['day'].unique()
Dataframe['column'] : 1차원(시리즈)로 조회
Dataframe[['column']] : 2차원(데이터프레임)으로 조회
열 이름 생략 가능
열 이름 1개 -> 결과 : 시리즈
열 이름 여러개를 리스트로 -> 결과 : 데이터 프레임
여러 조건으로 조회
.isin([값1,값2...]) :값1 또는 값2 또는...값n인 데이터만 조회
.between(값1, 값2): 값1 ~ 값2까지 범위안의 데이터만 조회
Fare_mean=data['Fare'].mean()