Wiese, Magnus, et al. "Quant GANs: deep generation of financial time series." Quantitative Finance 20.9 (2020): 1419-1440.
ABSTRACT
1. TCN의 활용을 수학적으로 정의함.
- volatility clustering 과 같은 장기 의존성 포착.
2. generator가 risk neutral distribution으로 mapping함.
3. Lambert W transformation이 fat-tail distribution modeling에 중요한 역할을 함.
- volatility cluster, leverage effects, and serial auto-correlation이 재현됨.
1. INTRODUCTION
- 금융에서는 NN의 도입이 초기상태임.
- 현실적인 자산가격을 시뮬레이션 할 수 있는 GAN 모형을 제시할 필요성 대두.
- quantGAN 모델을 제시하였으며 data-based 접근과 model-driven 접근에 중간에 위치.
- 이후 내용은 ABSTRACT와 동일.
2. GENERATIVE MODELING OF FINANCIAL TIME SERIES
- 금융시계열 생성에는 고려해야할 금융시계열의 특징이 크게 5가지가 있음.
- Heavy tails: asset return의 분포는 정규분포보다 꼬리 쪽이 두꺼움.
- Leptokurtosis: asset return의 분포는 정규분포보다 더 뾰족함.
- Volatility clustering: asset return은 price change에 따라 고변동과 저변동이 묶여서 발생하는 경향이 있음.
- Leverage effect: asset return의 변동성은 하락할 때 더 크게 나타남.
- Uncorrelated but not independent: asset return의 평균은 상관관계가 없으나 분산(변동성)은 자기상관이 존재.
3. NEURAL NETWORK TOPOLOGIES
- SVNN(stochastic volatility neural network)의 이해를 돕기 위해 multi-layer perceptron과 TCN을 설명함.
3.1 Multi-layer perceptrons
- 정의 3.1: 활성화 함수는 Lipschitz continuous를 만족하고 monotonic한 함수를 의미한다.
- 정의 3.3: MLP의 각 층의 함수는 선형변환에 비선형함수를 적용한 것을 의미한다.
- 보편근사정리: 다음과 같이 정의된 MLP는 Lipschitz continuous를 만족하고 이는 MLP가 임의의 연속함수를 근사할 수 있음을 보장함.
3.2 Temporal convolutional networks
- stochastic volatility를 모델링하기 위해 TCN을 도입함.
- dilation이 커질수록 더 멀리 있는 과거 시점을 참조함 → 시계열의 long-term dependency 학습 가능.

- TCN이 더 먼 장기의존성을 학습하려면 RFS(=receptive field size)(TCN이 볼수 있는 최대 시계열 길이)가 커지고 계산 비용이 증가함.
- 네트워크가 깊어질 경우 학습시킬 데이터가 충분한지에 대한 문제가 있으며, TCN으로 더 먼 과거를 보는 것은 future work로 남겨둠.
4. GENERATIVE ADVERSARIAL NETWORKS
- GAN 모형을 TCN과 함께 discrete-time stochastic processes로 확장함.
- GAN

- stochastic process
- TCN 기반의 시계열 생성 모델이 하나의 확률과정으로 이해될 수 있음을 설명.

5. THE MODEL
- quantGAN을 log-return neural process (log-return NP) 로 지칭.
- 5.2에선 log-return NP로 부터 생성된 꼬리가 얼마나 무거울 수 있는지
- 5.3에선 log-return NP 로 어떻게 heavy-tail을 모델링하고 어떤 가정이 있는지
- 5.4에선 log-return NP로 부터 risk-neutral distribution이 유도될 수 있는지
- 5.5에선 log-return NP가 기존의 시계열 모델의 확장으로 볼 수 있는지
5.1 Log-return neural processes
- Log-return NP 요약 및 스키마 Description

5.2 L_p - space characterization of R_theta
- Theorem 5.4: 신경망의 출력은 입력의 분포와 같은 L_p-space에서 정의 됨.
- Corollary 5.5: 신경망의 출력이 평균, 분산, 노이즈와 같은 모멘트를 가지고 있음이 보장됨.
- 그러나 모멘트의 보장은 금융시계열의 두꺼운 꼬리 특성과 반대되는 성질임.
→ 그럼에도 어떻게 모멘트를 보장하면서 두꺼운 꼬리를 생성할지에 대한 얘기를 5.3에서 함.
- Corollary 5.6: 역전파 기울기도 L_p-space에 속해 안정적인 gradient가 보장됨.
- 단, 노이즈를 가우시안 분포보다 꼬리가 두꺼운 분포에서 샘플링 하는 경우 성립 안할 수도 있음.
5.3 Generating heavier tails and modeling assumptions
- Theorem 5.4 에서 log-return NP의 모든 모멘트는 존재함이 보장됨.
- 이 경우 tail fall은 최소 e^{-x^2} 속도로 진행됨.
- 현실 금융시계열의 경우 tail이 무겁고 모멘트의 유한함이 보장되지 않음.
- 이와 같은 이유로 Lambert W probability transform을 적용함.
- 이 변환의 경우 미분이 보장되어 최적화가 가능함.
- inverse Lambert W transformed spot log-returns R이 log-return NP로 표현 가능하다는 전제조건 필요.
- 위 전제조건은 두가지 중요한 내용을 암시함.
- 첫째, log-return NP가 stationary로 가정됨으로 historical log-return process도 stationary가정이 필요함.
- 둘째, log-return NP는 TCN의 RFS 범위까지의 dynamics를 포착할 수 있어 해당 범위를 벗어나는 수익률은 독립으로 간주.
5.4 Risk-neutral representation of R_theta
- 위험중립리턴을 구하기 위한 보정항을 찾음.

- 위험중립 자산 경로는 관측이 불가능하여 판별자 학습이 불가능함.
- 옵션 가격을 기준으로 최소자승 보정을 하는 방법이 있고 몬테카를로 시뮬레이션을 수행하여 모델의 옵션 가격 측정 성능을 test해봐야 함.
- 위 방법은 향후 연구 과제로 남겨둠.
5.5 Constrained log-return neural processes
- innovation term을 가우시안 노이즈로 강제하면 기존 시계열 모델의 확장으로 볼 수 있음.
- BSM 모델에서는 고정된 변동성을 사용하고 quantGAN 모델은 stochastic volatility를 사용하는 것만 다르고 구조가 유사함. → 위와 같은 결론으로 log-return NP가 기존 시계열 모델의 확장임을 주장함.


위 두 식을 아래 식에 대입.

정리하면 다음과 같이 됨.

리턴을 가격 형태로 변형.

BS와 비교하면 고정변동성인지 stochastic 변동성인지만 다른 것을 확인할 수 있음.

6. PREPROCESSING
- 금융시계열을 그대로 전달하기 전에 preprocessing 과정이 필요함.

7. NUMERICAL RESULTS
- quantGAN으로 S&P500의 log return 시나리오를 생성함.
7.1 Setting and implementation
7.2 Models
- Pure TCN
- innovation이 가우시안 노이즈로 강제하지 않음.
- Constrained log-return NP
- innovation term을 가우시안 노이즈로 강제한 경우.
- GARCH(1, 1) with constant drift
- 고정 drift term을 쓰고 variance term만 GARCH(1, 1) 사용.
7.3 Evaluating a path simulator: metrics and scores
- Distributional metrics
- Wasserstein-1 distance
- real과 fake의 log-return 분포의 거리를 측정.

- DY metric
- real과 fake의 log 확률밀도의 차이를 측정.
- Dependence scores
- real의 autocorrelation과 fake의 autocorrelation 평균의 차이를 측정.

- Leverage effect score
- L 값이 크면 수익률이 작을수록 미래의 변동성이 큼을 의미.
- real의 L과 fake의 L 평균의 차이를 측정.

7.4 Generating the S&P 500 index

- 7.4.1 Pure TCN
- 7.4.2 Constrained SVNN
- pure TCN 보다 성능에서 부족하지만 5.3 처럼 기존 시계열 모델의 확장으로 볼 수 있어 해석에 용이함.
- 7.4.3 GARCH(1, 1) with constant drift
- GARCH 모델은 애초에 ACF를 잘 모델링하는 것이 목적이라 밴치마크임에도 좋은 ACF score를 가짐. 그러나 tail risk 모델링과 분포 유사도가 실제와 매우 다름.
8. CONCLUSION AND FUTURE WORK
- 이산시간에서 금융시계열을 생성하는 GAN 모형 제시.
- 사전지식이 동반된 tail index 활용으로 생성된 tail의 더 정확한 모델링과 외삽이 필요.
- 금융시계열 생성만을 평가할 수 있는 metric 개발이 필요.
INSIGHT
- 금융 시계열은 jump term(급격한 변동) 이 자주 발생하는 특성이 있어, 딥러닝 관점에서는 기울기(gradient)가 불연속적으로 튀는 부분이 많은 시계열이다.
- 이러한 구조적 특성 때문에, 딥러닝에서 역전파가 안정적으로 이뤄지기 어렵다. 딥러닝이 기울기 폭주(explosion)나 소실(vanishing) 없이 안정적으로 학습되려면 Lipschitz 연속성(기울기의 상·하한이 엄격히 제한됨)을 만족해야 하지만, 금융 시계열은 애초에 이를 충족하지 않는다.
- 이를 보완하기 위해 Lambert W 변환을 적용하면, jump term을 포함한 극단값(tail)까지 분포를 재조정할 수 있다.
- 결과적으로 Lambert W 변환은 금융 시계열을 Lipschitz 연속성을 만족하도록 변형하면서도 분포의 꼬리(jump term)까지 커버할 수 있게 한다.