[Pandas]시리즈(Series)1- Series 생성

ssun·2022년 6월 19일
0

Python Pandas

목록 보기
1/4

✅ Pandas

  • 데이터 분석과 관련된 다양한 기능을 제공하는 파이썬 패키지
  • 데이터 셋을 이용한 다양한 통계 처리 기능을 제공
  • 표 형태의 데이터를 다루는데 특화된 파이썬 모듈
  • 표 형태의 데이터를 다루기 위한 시리즈(Series)와 데이터프레임(DataFrame)클래스 제공
  • Series: 1차원 자료구조를 표현
  • DataFrame : 행렬의 표를 표현

✅ Series

  • 1차원 자료구조
  • DataFrame(표)의 한 행이나 한 열을 표현한다.
  • 각 원소는 index로 접근할 수 있다.
    - index는 순번과 지정한 이름 두 가지로 구성. 명시적으로 지정하지 않으면 0부터 1씩 증가하는 순번이 index가 된다.
  • 벡터화 연산(element-wise 연산)을 지원

✍🏻 Series 생성

Series(배열형태 자료구조)

  • 배열형태 자료구조: 리스트, 튜플, 넘파이 배열(ndarray)

✔ Series 생성-리스트

import pandas as pd

s1=pd.Series([1,2,3,4])       #<class 'pandas.core.series.Series'>
print(type(s1))              

#인덱스 값
# 0    1
# 1    2
# 2    3
# 3    4
# 4    5

✔ Series 생성-딕셔너리

d = {
    '가':1, 
    '나':2,
    '다':3
}
s2=pd.Series(d)
s2 
#인덱스  값
# 가    1
# 나    2
# 다    3

✔ Series 생성- index 명시

pd.Series([value1, value2, value3,...],index=['idx1','idx2','idx3'...])

s3=pd.Series([80,70,90,100], index=['국어','영어','과학','수학'])
s3

#인덱스    값
# 국어     80
# 영어     70
# 과학     90
# 수학    100

Series/DataFrame - index 명은 중복될 수 있다.

s5 = pd.Series(range(10), index=list('AAABBBCCCC'))
s5
# A    0
# A    1
# A    2
# B    3
# B    4
# B    5
# C    6
# C    7
# C    8
# C    9
profile
조구마한 개발 기록 블로그

0개의 댓글