Pandas 기초
- Python에서 R 만큼의 강력한 데이터 핸들링 성능을 제공하는 모듈
- 단일 프로세스에서는 최대 효율
- 코딩 가능하고 응용 가능한 엑셀로 받아들여도 됨
- 스테로이드 맞은 엑셀
Series
- index와 value로 이루어져 있음
- 하나의 데이터 타입만 가질 수 있음
DataFrame
- pd.Series()는 index, value로 이루어져 있음
- pd.DataFrame()은 index, value, column으로 이루어져 있음
DataFrame 정보 탐색
- head(), tail()의 경우 pandas 객체 안에 있는 매서드이기 때문에 ()붙여야 함
데이터 정렬
데이터 선택
- loc : index 값으로 특정 행, 열 선택
- iloc : 컴퓨터가 인식하는 index 값으로 선택
condition
- column 추가 : 기존에 있으면 수정, 없으면 추가
apply()
- DataFrame에 일괄적으로 특정 함수를 적용해주는 역할
두 데이터 합치기¶
- Pandas에서 데이터 프레임을 병합하는 방법
- pd.merge()
- pd.concat()
- pd.join()
자료출처 : 제로베이스 데이터스쿨