CSV(Comma-Separated Values)는 몇 가지 필드를 쉼표(,)로 구분한 텍스트 데이터 및 텍스트 파일
import pandas as pd
price_df = pd.read_csv(
'C:/Code/prices.csv',
names=[
'ticker', 'date', 'open', 'high', 'low', 'close',
'volume', 'adj_close', 'adj_volume'
]
)
print(price_df)
print(price_df.groupby('ticker')) # intermediate object
<pandas.core.groupby.generic.DataFrameGroupBy object at 0x0000021B5DF65BC8>
print(price_df.groupby('ticker').median())
print(price_df.groupby('date')['volume'].sum())
print(price_df.groupby('ticker')['close'].max())
두 가지 기준으로 그룹화된 값들을 보고 싶을 땐 어떻게 해야 할까?
예를 들어, "일일 종목별 종가"를 확인하고 싶은 경우.
open_prices = price_df.pivot(
index='date', columns='ticker', values='open'
)
print(open_prices)
입력을 받는 데이터베이스 테이블 예시
피벗 테이블 예시 (index='date', columns='ticker')
- 모든 요소는 기준이 될 수 있다.
- 그러나 좋은 데이터 분석을 위해서는 좋은 기준을 찾는 것이 무엇보다 중요하다.