네이버 부스트캠프 5기 2일차

김태민·2023년 3월 8일
1

boostcamp

목록 보기
3/36

Numpy

주요 함수들

넘파이 배열 생성

test_array = np.array([1,2,3,4],float)

넘파이 배열 reshape

test_array = np.array([1,2,3,4],[1,2,3,4]).reshape(2,4)

넘파이 배열 flatten

test_array = np.array([1,2,3,4],[1,2,3,4]).flatten()

넘파이 배열 transpose

test_array = np.array([[1,2,3,4],[1,2,3,4],[1,2,3,4]])
test_array.transpose() # 전치행렬
test_array.T
test_array = np.transpose(test_array,(2,1,0))

넘파이 배열 argmax & argmin

test_array = np.array([1,2,3,4,5,6,7])
np.argmax(test_array)
np.argmin(test_array)

Pandas

주요 함수들

csv파일 읽어오기

df = pd.read_csv('path')

데이터 확인

df.head()
df.tail()

데이터 인덱싱

df.loc[[row],[column]]
df.iloc[:2,:2]
구분 요약 iloc는 index loc로 해석 숫자로만 구분

데이터 삭제

df.drop([0,1,2,3,4]) 행의 인덱스 값을 기준으로 삭제
df.drop('column_name',axis=1) 컬럼 삭제

데이터 고유값 확인

df.column.unique

데이터 통계값 요약

df.describe()

데이터 결측치 확인

df.isnull()

데이터 상관계수 및 공분산 함수

df.column.corr(df.column2) 상관계수
df.column.cov(df.column2) 공분산
df.corrwith(df.column) column과 전체 데이터의 상관계수
df.corr() 전체 데이터의 상관계수 확인 matrix

회고

아직 뭔가 배우는게 너무 많은것같고 전부 정리하기에는 내용이 너무 방대하여 주로 사용한것들 위주로 간략하게 정리해보았다. 아직 딥러닝 들어가기 전이므로 딥러닝을 들어가고 나서 제대로 정리를 해야겠다.

profile
한성대학교 네이버 AI Tech 5기 NLP

1개의 댓글