판다스 기초 Series와 DataFrame

dpwl·2024년 6월 18일

Data Analysis with Python

목록 보기
2/48

1. Series와 DataFrame

시리즈(Series)데이터프레임(DataFrame)은 판다스에서 제공하는 자료구조이다.

1.1 Series(시리즈)

  • 시리즈(Series)는 인덱스(index)와 값(value)으로 이루어진 순서가 있는 형태이고, 1차원 데이터 배열을 표현하는데 자료구조이다.

    • 인덱스는 각 값에 대한 고유한 식별자 역할을 하며, 기본적으로 인덱스는 0, 1, 2, ... 와 같은 정수 값으로 지정된다.

    • 사용자가 원하는 경우에는 임의의 문자열이나 다른 데이터 타입으로 인덱스를 지정할 수 있다.

1.2 DataFrame(데이터프레임)

  • 데이터프레임(DataFrame)은 시리즈의 모음이라고 할 수 있다.

  • 데이터프레임은 행과 열로 이루어진 테이블 형태의 데이터 구조이며, 이러한 구조는 Excel Spreadsheet와 유사하다.

  • 각 열은 하나의 시리즈를 나타내며, 각 시리즈의 인덱스는 데이터프레임의 행 인덱스와 동일하다.

  • 데이터프레임은 다양한 형태의 데이터를 다루기에 적합하며, 데이터 검색, 필터링, 조작 등 데이터를 쉽게 탐색하고 분석할 수 있는 다양한 메서드와 기능을 제공한다.

2. 클래스, 객체, 속성과 기능

판다스 안에는 시리즈 클래스와 데이터프레임 클래스가 존재한다.

2.1 클래스(Class)

  • 클래스는 데이터나 행위를 추상화한 것이다. 즉, 객체(object)를 만들기 위한 설계도 혹은 틀이라고 할 수 있다.

  • 각 클래스는 속성(Attributes)기능(Method)으로 이루어져 있다.

클래스를 인스턴스화 하면 해당 클래스의 속성과 기능을 탑재한 객체(Object) 생성

2.2 객체(Object)

  • 객체는 클래스의 인트턴스(instance)이다. 클래스를 통해 생성된 구체적인 데이터 요소를 나타낸다.

  • 예를 들어, 판다스에서의 시리즈 클래스의 인스턴스는 특정 데이터를 담고 있는 시리즈의 객체를 의미한다.

2.3 속성(Attribute)

  • 클래스나 객체의 상태를 나타내는 변수들을 의미한다.

  • 시리즈나 데이터프레임 클래스의 속성은 해당 데이터를 담고 있는 인덱스(index)와 값(value)이다.

2.4 기능(Method)

  • 클래스나 객체가 수행할 수 있는 동작이나 행위를 나타낸다.
  • 메서드는 해당 클래스나 객체에 대해 어떤 행위를 수행하거나 작업을 수행하는 함수이다.
  • 예를 들어, 시리즈 클래스에는 값에 접근하거나 조작하는 메서드가 있다.
profile
거북선통통통통

0개의 댓글