#8 판다스 개요와 기본 API

박수경·2021년 9월 12일
0

Machine Learning

목록 보기
8/18

판다스(Pandas)

  • 파이썬에서 데이터 처리를 위해 존재하는 가장 인기 있는 라이브러리
  • 인간이 가장 이해하기 쉬운 행과 열의 2차원 데이터를 효율적으로 가공/처리할 수 있는 다양하고 훌륭한 기능을 제공.
  • 주요 구성 요소: DataFrame, Series, Index

DataFrame

  • Colume X Rows 으로 이루어진 2차원 데이터 셋
  • 각 Row를 고유하게 구별할 수 있는 Key값 객체 Index.( = pk)

Series

  • 1개의 Column값으로만 구성된 1차원 데이터 셋
  • 각 Row를 고유하게 구별할 수 있는 Key값 객체 Index.

명령어들

  • read_csv()
    • csv 파일을 편리하게 DataFrame으로 로딩.
    • sep 인자를 다른 분리자로 변경하여 다른 유형의 파일도 로드가 가능.

      titanic_df = pd.read_csv('titanic_train.csv')
      titanic_df = pd.read_csv('titanic_train.tsv', sep='\t')

profile
유니콘을 위하여

0개의 댓글

관련 채용 정보