Pandas 기초(4월 26일)

송영석·2023년 4월 29일
0

데이터스쿨 14기

목록 보기
8/18

Pandas 기초

  • Python에서 R 만큼의 강력한 데이터 핸들링 성능을 제공하는 모듈
  • 단일 프로세스에서는 최대 효율
  • 코딩 가능하고 응용 가능한 엑셀로 받아들여도 됨
  • 스테로이드 맞은 엑셀

Series

  • index와 value로 이루어져 있음
  • 하나의 데이터 타입만 가질 수 있음

DataFrame

  • pd.Series()는 index, value로 이루어져 있음
  • pd.DataFrame()은 index, value, column으로 이루어져 있음

DataFrame 정보 탐색

  • head(), tail()의 경우 pandas 객체 안에 있는 매서드이기 때문에 ()붙여야 함

데이터 정렬

데이터 선택

  • offset index

  • loc : index 값으로 특정 행, 열 선택

  • iloc : 컴퓨터가 인식하는 index 값으로 선택

condition

  • column 추가 : 기존에 있으면 수정, 없으면 추가

  • isin() : 특정 요소가 있는지 확인

  • 특정컬럼 제거 : del, drop

apply()

  • DataFrame에 일괄적으로 특정 함수를 적용해주는 역할

  • 함수 및 lamdba

두 데이터 합치기¶

  • Pandas에서 데이터 프레임을 병합하는 방법
    - pd.merge()
    - pd.concat()
    - pd.join()

자료출처 : 제로베이스 데이터스쿨

profile
매일매일 작성!!

0개의 댓글