행과 열을 이용해 데이터를 관리하는데 굉장히 유용한 모듈인 Pandas에대해 학습했다. 그 중에 전부는 아니고 내가 그동안 헷갈렸거나 몰랐던 부분들만 정리해보겠다.
s = pd.Series([1,4,9,16,25])
s
t = pd.Series({'one':1, 'two':2, 'three':3,, 'four':4, 'five':5
t
s = pd.Series([1,4,9,16,25])
np.array(s)
4. Series에 이름 붙이기
## N(0,1) 가우시안 표준정규분포에서 랜덤하게 5개를 뽑은 시리즈를 random_nums라고 이름붙임
s = pd.Series(np.random.randn(5), name ='random_nums')
s
d = {'height': [1,2,3,4], 'weight':[10,40,50,60]}
df = pd.DataFrame(d)
df
## WHO Region 열의 데이터 중복없이 확인
covid['WHO Region'].unique()
## WHO Region 별 확진자수
# 1. covid에서 확진자수 column만 추출한다.
# 2. 이를 covid의 WHO Region을 기준으로 groupby한다.
covid_by_region = covid['Confirmed'].groupby(by= covid['WHO Region'])
covid_by_region.sum()