Python Basics for AI - pandas

박정재·2023년 1월 22일
0

Python Basics for AI

목록 보기
3/3

pandas

  • 구조화된 데이터의 처리를 지원하는 python 라이브러리
  • python의 엑셀
  • 데이터 처리 및 통계 분석을 위해 사용

series

dataframe

  • series를 모아서 만든 Data Table

dataframe indexing

lambda, map, apply

replace

  • map 함수의 기능 중 데이터 변환 기능만 담당
  • 데이터 변환 시, 많이 사용되는 함수

apply

  • series 전체(column)에 해당 함수를 적용
  • 입력 값이 series 데이터로 입력 받아 handling 가능

  • 내장 연산 함수를 사용할 때도 똑같은 효과를 거둘 수 있다.
  • mean, std 등 사용가능

  • scalar 값 이외에 series 값의 반환도 가능

applymap

  • series 단위가 아닌 element 단위로 함수를 적용한다.
  • series 단위에 apply를 적용시킬 때와 같은 효과

pandas built-in functions

describe

  • Numeric type 데이터의 요약 정보를 보여준다.

unique

  • series data의 유일한 값을 list로 반환한다.

sum

  • column/row 값의 연산을 지원
  • sub, mean, min, max, count, median, mad, var, ...

isnull

  • column/row 값의 null 값의 index를 반환한다.

sort_values

  • column 값을 기준으로 데이터를 sorting

corr & cov

  • 상관계수와 공분산을 구하는 함수
  • corr, cov, corrwith

실습

Python Basics for AI - pandas

profile
Keep on dreaming and dreaming

0개의 댓글