시리즈(Series)와 데이터프레임(DataFrame)은 판다스에서 제공하는 자료구조이다.
시리즈(Series)는 인덱스(index)와 값(value)으로 이루어진 순서가 있는 형태이고, 1차원 데이터 배열을 표현하는데 자료구조이다.
인덱스는 각 값에 대한 고유한 식별자 역할을 하며, 기본적으로 인덱스는 0, 1, 2, ... 와 같은 정수 값으로 지정된다.
사용자가 원하는 경우에는 임의의 문자열이나 다른 데이터 타입으로 인덱스를 지정할 수 있다.
데이터프레임(DataFrame)은 시리즈의 모음이라고 할 수 있다.
데이터프레임은 행과 열로 이루어진 테이블 형태의 데이터 구조이며, 이러한 구조는 Excel Spreadsheet와 유사하다.
각 열은 하나의 시리즈를 나타내며, 각 시리즈의 인덱스는 데이터프레임의 행 인덱스와 동일하다.
데이터프레임은 다양한 형태의 데이터를 다루기에 적합하며, 데이터 검색, 필터링, 조작 등 데이터를 쉽게 탐색하고 분석할 수 있는 다양한 메서드와 기능을 제공한다.
판다스 안에는 시리즈 클래스와 데이터프레임 클래스가 존재한다.
클래스는 데이터나 행위를 추상화한 것이다. 즉, 객체(object)를 만들기 위한 설계도 혹은 틀이라고 할 수 있다.
각 클래스는 속성(Attributes)과 기능(Method)으로 이루어져 있다.
클래스를 인스턴스화 하면 해당 클래스의 속성과 기능을 탑재한 객체(Object) 생성
객체는 클래스의 인트턴스(instance)이다. 클래스를 통해 생성된 구체적인 데이터 요소를 나타낸다.
예를 들어, 판다스에서의 시리즈 클래스의 인스턴스는 특정 데이터를 담고 있는 시리즈의 객체를 의미한다.
클래스나 객체의 상태를 나타내는 변수들을 의미한다.
시리즈나 데이터프레임 클래스의 속성은 해당 데이터를 담고 있는 인덱스(index)와 값(value)이다.