Advances in Financial ML

Ch 5. Fractional Differentiated Features

LunaMooN 2023. 1. 27. 03:40

 

1. Stationarity vs Memory Dilemma

  시계열의 정상성 (stationarity)란 mean, variance, covariance가 시간이 지나도 변하지 않는 성질을 의미한다. 시계열 분석에서 정상성을 가진 자료를 주로 사용하는데, 대표적인 것이 로그 1차 차분인데, 주가 자체를 사용하지 않고 수익률을 사용하는 것이 그 예이다. 그러나 이 경우 데이터가 갖고 있던 메모리를 잃게 되는 단점이 있다. 수익률과 원 주가 데이터의 상관계수는 0에 가깝다. 정상성을 가진 시계열 자료로 만드는 대신에 정보를 없애게 되는 stationarity vs memory 딜레마가 생기게 된다. 이를 해결할 수 있는 방법 중 하나가 분수 차분이다.

 아래는 코스피 주가 데이터로 0부터 1까지 0.1씩 차분계수를 늘려가며 ADF test 검정값을 확인해 본 것이다. 0.4부터 5% 신뢰수준에서 안정적인 시계열임을 확인할 수 있다. 또한 이때 원래의 주가 데이터와 상관계수는 1이며 정보를 보존하고 있음을 알 수 있다.

frac_diff adfStat pVal lags nObs 95% conf
0 -1.63 0.47 1 10963 -2.86
0.1 -1.72 0.42 1 10956 -2.86
0.2 -1.92 0.32 1 10953 -2.86
0.3 -2.35  0.16 1 10952 -2.86
0.4 -2.98 0.04 1 10953 -2.86
0.5 -3.98 0 1 10954 -2.86
0.6 -5.57 0 1 10955 -2.86
0.7 -7.49 0 1 10957 -2.86
0.8 -11.69 0 1 10958 -2.86
0.9 -17.73 0 1 10960 -2.86
1 -73.29 0 1 10962 -2.86

 

2. Fixed-Width Window Fracdiff

$ \tilde{X_t} = \sum_{k=0}^{l^*} {w_k X_{t-k}}$,   $t = T-l^*+1, ..., T$ 

$\tilde{w_k}=
\begin{cases}
w_k, & \mbox{if }k \leq l^* \\
0, & \mbox{if }k > l^*
\end{cases}$

  이 때, $l^*$는 $|w_{l^*}| \geq \tau$ and $|w_{l^* +1}| \leq \tau$ 를 만족한다. ($\tau$ 는 주어진 임계값)

  분수 차분에서 weight가 0으로 수렴하거나 negative drift로 인한 trend가 생기는 것을 방지한다. 아래는 코스피 지수의 1차 로그 차분과 0.4 계수의 분수 차분 결과를 그래프로 나타낸 것이다.

코스피 지수의 로그 1차 차분 (수익률)
코스피 지수의 0.4 계수 분수 차분

 

3. Empirical Result

  1991년 4월 24일부터 2022년 9월 1일까지의 달러인덱스지수 (DXY), 상품선물가격(금, 브렌트유), 이동평균 주가(S&P500)를 분석했다.

<DXY>

  adfStat pVal lags nObs 95% conf corr
0 -1.74 0.41 1.00 8244.00 -2.86 1.00
0.1 -2.21 0.20 1.00 8237.00 -2.86 1.00
0.2 -3.16 0.02 1.00 8234.00 -2.86 1.00
0.3 -4.55 0.00 1.00 8233.00 -2.86 1.00
0.4 -6.32 0.00 1.00 8234.00 -2.86 0.99
0.5 -8.88 0.00 1.00 8235.00 -2.86 0.97
0.6 -12.69 0.00 1.00 8236.00 -2.86 0.95
0.7 -17.00 0.00 1.00 8238.00 -2.86 0.91
0.8 -25.55 0.00 1.00 8239.00 -2.86 0.80
0.9 -35.99 0.00 1.00 8241.00 -2.86 0.66
1 -64.05 0.00 1.00 8243.00 -2.86 0.03

 

<금 선물 가격>

  adfStat pVal lags nObs 95% conf corr
0 -0.18 0.94 1.00 8134.00 -2.86 1.00
0.1 -0.37 0.92 1.00 8127.00 -2.86 1.00
0.2 -0.76 0.83 1.00 8124.00 -2.86 1.00
0.3 -1.29 0.64 1.00 8123.00 -2.86 1.00
0.4 -1.91 0.33 1.00 8124.00 -2.86 1.00
0.5 -2.79 0.06 1.00 8125.00 -2.86 1.00
0.6 -4.11 0.00 1.00 8126.00 -2.86 0.99
0.7 -5.63 0.00 1.00 8128.00 -2.86 0.99
0.8 -8.97 0.00 1.00 8129.00 -2.86 0.97
0.9 -13.80 0.00 1.00 8131.00 -2.86 0.94
1 -64.41 0.00 1.00 8133.00 -2.86 0.01

 

<브렌트유 선물 가격>

  adfStat pVal lags nObs 95% conf corr
0 -1.45 0.56 1.00 8171.00 -2.86 1.00
0.1 -1.81 0.38 1.00 8164.00 -2.86 1.00
0.2 -2.47 0.12 1.00 8161.00 -2.86 1.00
0.3 -3.43 0.01 1.00 8160.00 -2.86 1.00
0.4 -4.71 0.00 1.00 8161.00 -2.86 0.99
0.5 -6.58 0.00 1.00 8162.00 -2.86 0.99
0.6 -9.43 0.00 1.00 8163.00 -2.86 0.97
0.7 -12.69 0.00 1.00 8165.00 -2.86 0.95
0.8 -19.56 0.00 1.00 8166.00 -2.86 0.88
0.9 -28.72 0.00 1.00 8168.00 -2.86 0.77
1 -64.96 0.00 1.00 8170.00 -2.86 0.02

 

<이동평균 5일>

  adfStat pVal lags nObs 95% conf corr
0 -1.13 0.70 1.00 8242.00 -2.86 1.00
0.1 -1.22 0.67 1.00 8235.00 -2.86 1.00
0.2 -1.35 0.61 1.00 8232.00 -2.86 1.00
0.3 -1.54 0.52 1.00 8231.00 -2.86 1.00
0.4 -1.76 0.40 1.00 8232.00 -2.86 1.00
0.5 -2.08 0.25 1.00 8233.00 -2.86 1.00
0.6 -2.55 0.10 1.00 8234.00 -2.86 1.00
0.7 -3.08 0.03 1.00 8236.00 -2.86 1.00
0.8 -4.31 0.00 1.00 8237.00 -2.86 0.99
0.9 -5.91 0.00 1.00 8239.00 -2.86 0.98
1 -33.61 0.00 1.00 8241.00 -2.86 0.00

 

  달러인덱스는 0.2에서 정상성이 확보되었고 상품선물 가격의 경우 0.3~0.5에서 시계열이 정상적이었다. 본 글에 명시하지 않았지만 다른 상품선물 가격의 경우도 비슷했다. 5일 이동평균의 경우는 분수 차분 계수 0.7에서 정상 시계열을 만들 수 있음을 알 수 있다.