다음 내용은 한빛미디어 <퀀트 전략을 위한 인공지능 트레이딩>을 공부하며 요약한 내용입니다.
: 인덱스에 연결된 데이터를 일정 간격으로 이동시키는 함수.
매개변수 | 기본 값 | 내용 |
---|---|---|
period | 1 | 전달된 정수 만큼 데이터가 이동. 음수가 전달되면 위로, 양수가 전달되면 아래로. |
axis | 0 | 데이터의 이동 방향. 1 전달되면 오른쪽으로. |
Close_lag1라는 변수로 한 칸 씩 데이터가 아래로 내려온 것을 확인할 수 있다.
: 함수의 현재값과 이전 요소 값의 백분율 변화량을 연산하는 함수.
매개변수 | 기본 값 | 내용 |
---|---|---|
period | 1 | 정수형 데이터가 전달되면 숫자 간격만큼 데이터와 백분율을 계산함. 음수가 전달되면 위 방향으로 변화율이 계산되고, 양수가 전달되면 아래 방향으로 변화율이 계산됨 |
: 현재 값에서 이전 값을 차감하는 형식으로 변화량을 손쉽게 구하는 함수.
매개변수 | 기본 값 | 내용 |
---|---|---|
Period | 1 | 양수를 넣으면 한칸 아래로 미루고, 음수를 넣으면 한 칸 위로 올림. |
axis | 0 | 1(columns)을 전달하면 오른쪽 칼럼 방향으로 계산을 수행. |
: 윈도우 window의 평균값, 최솟값, 최댓값 등을 계산하는 함수. 윈도우 크기만큼의 데이터를 이용해 연산을 수행하기에 윈도우 함수라고도 불림.
윈도우 사이즈 5를 전달했으므로 5개의 데이터가 확보되지 않으면 NaN 값을 출력함.
( 이동 평균선을 계산할 때는 결측치가 생기는 것이 자연스럽기 때문에 NaN값을 그대로 둠 )
: 시간 간격을 재 조정하는 기능. 이미 확보한 데이터가 일별 데이터일 때 시간 간격을 재조정해 월별 데이터로 가공한다거나 일별 데이터를 시간별 데이터로 재조정할 때 사용.
매개변수 | 기본 값 | 내용 |
---|---|---|
rule | 월말 일자를 기준으로 데이터를 정렬 |
-> rule에 전달하는 단위는 날짜 주기 단위와 같은 단위
참고 : https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html
sum()으로 월별 합계를 계산
rule에 start를 의미하는 S를 붙여 'MS'를 전달하고, first()를 사용하면 월 초의 데이터가 나온다.
last()를 사용하면 월말 일자만 확인할 수 있다.