Week2 Day3

김종영·2021년 1월 27일
0

📋 Pandas

📌 Pandas

  • 구조화된 데이터의 처리를 지원하는 python라이브러리

📌 Series

  • column vector를 표현하는 object
  • Series는 list와 다르게 index 이름을 넣어줄 수 있다.
  • dictionary를 이용해서 Series 생성 (key: index, value: value)
  • index 값을 기준으로 Series를 생성한다.
  • Series는 list와 여러가지 유사한 기능 수행

📌 Dataframe

  • 데이터 테이블 전체를 포함하는 object
  • Series인 column 벡터들로 구성된다.
  • Dataframe에서 필요한 부분을 select하고 drop 하는 여러가지 방법들
  • (inplace=True)를 통해서 기존의 Dataframe에 변화 반영
  • 데이터 drop을 통해서 필요없는 row/column 제거

📌 Dataframe operations

  • Series operation
  • Dataframe operation
  • Series + Dataframe
  • Series를 index 축으로 연산(row broadcasting)

📌 lambda, map, apply

  • Series type 데이터에 map함수 사용 가능
  • function 대신 dictionary, sequence형 자료 대체가능
  • apply 통해서 series 전체에 해당하는 함수를 적용한다.
  • applymap은 series 단위가 아니라 element단위로 함수 적용

0개의 댓글

Powered by GraphCDN, the GraphQL CDN