hhjk00.log
로그인
hhjk00.log
로그인
221024 Python #22
김혜진
·
2022년 10월 24일
팔로우
0
pandas
python
0
Python
목록 보기
20/24
Pandas
설치
pip install pandas
Pandas란
파이썬 언어로 만들어진 빅데이터 분석을 쉽게해주는 프레임워크이다.
Pandas DataFrame은 표와 같은 스프레드시트 구조로 데이터를 다룰 수 있다.
Pandas를 사용하는 이유
Numpy는 저수준 API가 대부분이므로 여러가지 다양한 고급기술은 Pandas에서 제공
리스트, Numpy 등의 내부데이터와 csv같은 외부 데이터를 Pandas 객체로 만들 수 있다.
Pandas(pd)는 어떤 종류의 데이터를 처리하나
데이터를 matrix 단위로 처리한다.
테이블의 데이터에서 특정 컬럼이나 특정 레코드의 값을 가져와서 변수에 저장한다.
행이나 열 단위의 접근이 가능하다.
데이터의 처리 속도가 매우 빠르다.
https://pandas.pydata.org/
테이블 형식 데이터를 읽고 쓰는 방법
다양한 파일 형식 또는 데이터 소스(csv, excel, sql, json 등)와 통합을 지원한다.
Pandas(pd)
코드에 import pandas as pd를 선언한다.
함수를 사용할 때마다 pandas.어쩌구() 식으로 사용해야 한다.
as pd를 하는 이유는 pandas.의 반복이 불편하므로 pd라는 별명을 붙여준다.
pandas. 대신 pd를 사용하여 함수를 호출하면 된다.
두 가지 기본 구조
Vector 형태의 Series
Matrix 형태의 DataFrame
김혜진
알고 쓰자!
팔로우
이전 포스트
221018 Python #21
다음 포스트
221025 Python #23
0개의 댓글
댓글 작성