판다스 기초 Pandas

dpwl·2024년 6월 18일

Data Analysis with Python

목록 보기
1/48

1. 판다스(Pandas)

  • 판다스(Pandas)는 파이썬에서 사용되는 데이터 조작과 분석을 위한 라이브러리이다.
  • 이름인 판다스Panel Data에서 따온 것으로, 처음에는 시계열 데이터와 교차되는 다차원 데이터를 다루기 위해 설계되었다.
  • 그러나 현재는 댜앙한 형태의 데이터를 다루는데 사용된다.

2. 파이썬과 판다스의 관계

파이썬은 하이레벨 프로그래밍 언어, 즉 인터프리터 언어로 간결하고 기계보다는 사람에게 초점을 맞춘 쉬운 문법을 가지고 있다.

파이썬 자체 만으로도 데이터 처리 시 편리하게 쓸 수 있다.

하지만 기본적인 파이썬의 리스트, 딕셔너리 등의 자료구조만으로는 대용량 데이터를 효율적으로 처리하는데 한계가 있다.

따라서 파이썬과 판다스를 함께 사용하면 이러한 단점을 극복할 수 있다.

판다스는 파이썬 장점인 간결한 문법을 그대로 살리면서 데이터 처리에 특하된 자료구조와 기능을 제공하며 이렇게 파이썬을 데이터 분석에 적합한 도구로 만들어주는 역할을 한다.

3. 판다스가 인기있는 이유

  • 간편한 문법 (낮은 진입장벽)
  • 다양한 기능
  • 뛰어난 성능 (대용량 데이터 처리 가능)
  • 다양한 포맷/데이터베이스와 연동 지원
  • 지속적인 개선, 업데이트

4. Pandas 설치

1) Terminal 실행

2) conda 가상환경 활성화

conda activate 가상환경_이름

3) 코드 입력

# 패키지 리스트 확인
conda list

# Pandas 패키지 설치
conda install pandas

4) Proceed ([y]/n)?에 y 입력

5) Pandas 패키지 설치 확인 코드 입력

conda list
profile
거북선통통통통

0개의 댓글