데이터를 효과적으로 처리하고, 보여줄 수 있도록 도와주는 라이브러리입니다.
인덱스(Index)에 데이터를 나열하고, 시리즈(Series)를 기본적인 자료형으로 사용합니다.
인덱스(Index)와 값(value)로 구성됩니다.
# pandas 불러오기 및 pd로 사용하기
import pandas as pd
array = pd.Series(['사과', '바나나', '당근'], index =['a', 'b', 'c'])
# 시리즈 출력
print(array)
# 인덱스 a에 해당하는 값 출력
print(array['a'])
결과
data = {
'a': '사과',
'b': '바나나',
'c': '당근'
}
array = pd.Series(data)
print(array)
print(array['a'])
결과
다수의 시리즈(Series)를 모아서 처리하기 위해서 사용합니다.
표 형태로 데이터를 손쉽게 출력하고자 할 때 사용합니다.
word_dict = {
'Apple': '사과',
'Banana': '바나나',
'Carrot': '당근'
}
frequency_dict = {
'Apple': 3,
'Banana': 5,
'Carrot': 7
}
word = pd.Series(word_dict)
frequency = pd.Series(frequency_dict)
summary = pd.DataFrame({
'word': word,
'frequency':frequency
})
print(summary)
결과