본 자료는 심민경 코치님의 자료를 사용하여 정리하였습니다.
import pandas as pd
변수 = pd.DataFrame({'열1':list1, ...})
변수 = pd.read_csv(파일경로)
.iloc으로 숫자를 이용해 값에 접근 가능.append로 데이터프레임 위아래로 결합할 수 있다..concat도 가능하다..isnull()로 결측치 확인이 가능하다.True/False로 매핑된다..dropna로 결측치 제거가 가능하다..sort_values로 정렬 가능하다.ascending으로 오름차순/내림차순 선택이 가능하다.df[열] = 값True/False로 나온다.df[(df[열] == 값) & (df[열] > 값)]df.replace({대체될 값:대체할 값, ...}, inplace = True)df.apply(함수)df.groupby(열).sum().max(), .min(), .mean() 가능df[열1, 열2].groupby(열).aggregate({열1: 'min', 열2: 'mean'})df[열1, 열2].groupby(열).get_group(값)df[열1, 열2].groupby(열).apply(lambda x: x.mean() - x.min())df[열1, 열2].groupby(열).filter(함수)df.pivot_table(index = '행', column = '열', values = '요약할 컬럼')aggfunc = ['min', 'mean', 'max']도 넣을 수 있다.변수 = np.array([원소1, ...])
변수 = np.array(리스트객체)
변수[number]
변수[start:end]
변수[:: step_num]
변수.dtype
변수 = np.arange(시작값, 마지막값 + 1, step)변수 = np.random.random(생성할 난수 갯수)변수 = np.random.random(생성할 난수 갯수, size = (행, 열))변수 = np.random.randint(생성할 정수시작, 끝, size = (행, 열))변수 = np.reshape((행, 열))
변수 = np.concatenate([배열1, 배열2])변수 = np.concatenate([배열1, 배열2], axis = 0) - 위/아래로 붙이기변수 = np.concatenate([배열1, 배열2], axis = 1) - 양옆으로 붙이기변수1, 변수2 = np.split(변수, [위에 둘 행 개수], axis = 0) - 위/아래 나누기
변수1, 변수2 = np.split(변수, [왼쪽에 둘 행 개수], axis = 1) - 양옆 나누기
+, -, *, / 가능변수 + 숫자+, -, *, / 가능변수 + 숫자, 변수 + 변수np.sum(변수)np.mean(변수)np.max(변수)np.min(변수)np.sum(변수) : 모든 원소np.mean(변수)np.max(변수, axis = 0) : 열기준np.min(변수, axis = 1) : 행기준변수 < 숫자 : True/False로 매핑된다.변수1[변수1 < 숫자] : 해당되는 값만 나온다.import matplotlib.pyplot as plt # 라이브러리 호출
fig, ax = plt.subplot()
plt.plot(x, y, options...) # 라인 그래프
plt.scatter(x, y, options...) # 산점도 그래프
color = '색상' : 색상, 0 ~ 1사이의 숫자, RGB 값 사용가능linestyle = 'solid' : solid, dashed, dashdot, dotted등 사용가능label = '라벨' : 선 이름 지정