
IMDB ๋ฐ์ดํฐ์
์ ์ฌ์ฉ์๊ฐ ์์ฑํ ์ํ ๋ฆฌ๋ทฐ์ ํ์ ์ ๊ธฐ๋ฐ์ผ๋ก ๊ตฌ์ฑ๋ ํ
์คํธ ๋ฐ์ดํฐ์
์ด๋ค.๊ฐ์ ๋ ์ด๋ธ(sentiment label) ์ด ์ง์ ๋์ด ์์ผ๋ฉฐ, ๊ธ์ (positive) ๋๋ ๋ถ์ (negative) ์ผ๋ก ๋๋๋ค.์์ฐ์ด ์ฒ๋ฆฌ(NLP) ๋ถ์ผ์ ์ ํ์ ์ธ ํ
์คํธ ๋ถ๋ฅ ๋ฌธ์ ๋ก, ํ
์คํธ ๋ฐ์ดํฐ๋ฅผ ์ซ์ ๊ธฐ๋ฐ์ feature๋ก ๋ณํํ๋ ์์
์ด ํต์ฌ์ด๋ค.๋ถ์ ๋ฆฌ๋ทฐ ์์:
"The plot was predictable and the acting was wooden."
๊ธ์ ๋ฆฌ๋ทฐ ์์:
"Absolutely loved it. The performances were powerful and moving."
๋จ์ด์ ์กด์ฌ ์ฌ๋ถ๋ง์ ๊ณ ๋ คํ๋ค.1 ์๋๋ฉด 0BoW๋ ๋ฌธ์๋ฅผ ๋จ์ด๋ค์ ์งํฉ์ผ๋ก๋ง ์์ฝํ๊ธฐ ๋๋ฌธ์ ๋ฌธ๋งฅ ์ ๋ณด๋ ๋ฐ์๋์ง ์๋๋ค.
โ ๋จ์ด์ ์์๋ฅผ ๊ณ ๋ คํ์ง ์๊ธฐ ๋๋ฌธ์, "not good"๊ณผ "good"์ ๋์ผํ ๊ธ์ ์ ์ธ ์๋ฏธ๋ก ํด์๋ ์ ์๋ค.
Uni-gram: ๋จ์ด ํ๋ ๋จ์ (๊ธฐ๋ณธ BoW ๋ชจ๋ธ)Bi-gram: ์ฐ์๋ ๋จ์ด ์ ๊ณ ๋ ค (์: "not good")m-gram: m๊ฐ์ ์ฐ์๋ ๋จ์ด ์กฐํฉLasso Logistic Regression (glmnet ์ฌ์ฉ)
two-hidden layers Neural Network (๊ฐ ์ธต์๋ ReLU ์ ๋ 16๊ฐ์ฉ ์กด์ฌ)
ํ์ต ์ ํ๋(training accuracy)๋ ๋ ๋ชจ๋ธ ๋ชจ๋ ํ์ต์ด ์งํ๋จ์ ๋ฐ๋ผ ๋จ์กฐ ์ฆ๊ฐ(monotonic increase)ํ๋ค.๊ฒ์ฆ ์ค๋ฅ(validation error)๋ฅผ ๊ธฐ์ค์ผ๋ก ์ ์ ํ ๋ชจ๋ธ์ ์ ํํ๋ ๊ฒ์ด ์ค์ํ๋ค.๊ณผ์ ํฉ(overfitting)์ ๋ฐฉ์งํ๊ธฐ ์ํด validation set์ ์ฑ๋ฅ์ด ๋ ์ค์ํจ.ํฌ์ ํ๋ ฌ(sparse matrix)์ ํ์ฉํ ์ ์๊ธฐ ๋๋ฌธ์, glmnet ํจํค์ง๋ฅผ ์ฌ์ฉํด ๋งค์ฐ ํจ์จ์ ์ผ๋ก ํ์ต ๊ฐ๋ฅํ๋ค.ํ๋ผ๋ฏธํฐ ์๋ฅผ ์ค์ด๊ณ (feature selection), ํด์ ๊ฐ๋ฅ์ฑ๋ ๋๋ค.๋น์ ํ ๋ก์ง์คํฑ ํ๊ท ๋ชจ๋ธ๋ก ๋ณผ ์ ์์ผ๋ฉฐ, Softmax ํ์ฑํ ํจ์๋ฅผ ํตํด ํด๋์ค ํ๋ฅ ์ ์ถ๋ ฅํ๋ค.โผ๏ธ ๋ณต์กํ ์ ๊ฒฝ๋ง ๋ชจ๋ธ์ด ํญ์ ๋ ๋์ ๊ฑด ์๋๋ค. ์ด ๊ฒฝ์ฐ์ฒ๋ผ ๋ฐ์ดํฐ ๊ตฌ์กฐ๊ฐ ๋จ์ํ๊ณ ํฌ์ํ ๋๋,
Lasso ๊ฐ์ ์ ํ ๋ชจ๋ธ๋ ์ถฉ๋ถํ ์ข์ ์ฑ๋ฅ์ ๋ผ ์ ์๋ค.
ํ์ค ์ธ๊ณ์ ๋ง์ ๋ฐ์ดํฐ๋ ์ํ์ค(sequence) ํํ๋ก ์กด์ฌํ๋ค. ์ด ์ํ์ค ๊ตฌ์กฐ๋ ๋จ์ํ ๋ฐ์ดํฐ๋ฅผ ๋์ดํ ๊ฒ์ด ์๋๋ผ, ์์ ์์ฒด๊ฐ ์๋ฏธ๋ฅผ ๊ฐ๋๋ค.
๋ฌธ์: ๋จ์ด๋ค์ด ์์ฐจ์ ์ผ๋ก ๊ตฌ์ฑ๋๋ฉฐ, ์์์ ๋ฐ๋ผ ์๋ฏธ๊ฐ ๋ฌ๋ผ์ง์๊ณ์ด ๋ฐ์ดํฐ: ๋ ์จ, ์ฃผ์ ์ง์, ์ผ์ ๋ฐ์ดํฐ ๋ฑ ์๊ฐ ํ๋ฆ์ ๋ฐ๋ผ ๊ธฐ๋ก์์ฑ/์์
: ์๊ฐ์ ๋ฐ๋ผ ๋ณํํ๋ ์ฐ์ ์ ํธํ๊ธฐ์ฒด: ์๊ธ์จ๋ ๊ธ์ ์์์ ์ ์ ํ๋ฆ์ด ์ค์ (์: ์์ฌ ์ฒ๋ฐฉ์ )์ด๋ฌํ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๊ธฐ ์ํด ๊ณ ์๋ ๋ชจ๋ธ์ด ๋ฐ๋ก RNN (Recurrent Neural Network) ์ด๋ค.
์ํ์ค์ ์ด์ ์ ๋ณด๋ฅผ ๊ธฐ์ตํ๋ฉด์ ๋ค์ ์ถ๋ ฅ์ ์์ธก
์
๋ ฅ ๋ ๋ฒกํฐ๋ค์ ์์๋ก ๊ตฌ์ฑ๋จ
(์: IMDB ๋ฆฌ๋ทฐ์์๋ ์ด ํ ๋จ์ด, ์ ์ฒด ๋ ํ๋์ ๋ฆฌ๋ทฐ ๋ฌธ์๋ฅผ ์๋ฏธ)
์ถ๋ ฅ ๋ ๋ณดํต ๋จ์ผ ๊ฐ (์: ๊ฐ์ ๋ ์ด๋ธ) ํน์ ๋ค์ค ํด๋์ค(one-hot ๋ฒกํฐ)
ํ์ง๋ง ๋ ๋ณต์กํ ๊ฒฝ์ฐ์๋ ์ถ๋ ฅ๋ ์ํ์ค๊ฐ ๋ ์ ์๋ค:
์: ๊ธฐ๊ณ ๋ฒ์ญ (์
๋ ฅ: ์์ด ๋ฌธ์ฅ, ์ถ๋ ฅ: ๊ฐ์ ๋ฌธ์ฅ์ ํ๊ตญ์ด ๋ฒ์ญ)
์ด ๊ฒฝ์ฐ, RNN์ ์ ๋ ฅ ์ํ์ค๋ฅผ ์ฒ๋ฆฌํด ๋ฌธ๋งฅ์ ์์ฝํ๊ณ , ๊ทธ ์์ฝ์ ๋ฐํ์ผ๋ก ์ถ๋ ฅ ์ํ์ค๋ฅผ ์์ฑ
RNN์ ์์๋ฅผ ์ธ์ํ๋ ์ ๊ฒฝ๋ง์ด๋ค.
๊ณผ๊ฑฐ ์ ๋ณด๋ฅผ ์ถ์ ํด ํ์ฌ์ ๊ฒฐ์ ์ ๋๊ณ , ํ์์ ๋ฐ๋ผ ์ถ๋ ฅ๋ ์ํ์ค๋ก ์์ฑํ ์ ์๋ค.
RNN(Recurrent Neural Network)์ ํต์ฌ์ ์
๋ ฅ ์ํ์ค๋ฅผ ์๊ฐ์ ๋ฐ๋ผ ํ๋์ฉ ์ฒ๋ฆฌํ๋ฉฐ, ๊ณผ๊ฑฐ ์ ๋ณด๋ฅผ ๋์ ํ๋ ๊ตฌ์กฐ์ด๋ค.
์ ๋ ฅ ์ํ์ค:
์ฌ๊ธฐ์ ์ ๋จ์ด์ ๊ฐ์์ฒ๋ผ ์ํ์ค ๊ธธ์ด๋ฅผ ์๋ฏธํ๋ค.
์ถ๋ ฅ:
๋ณดํต ํ๋์ ๋จ์ํ ์ถ๋ ฅ (์: ๊ฐ์ ๋ถ๋ฅ, ๋ค์ ๋จ์ด ์์ธก ๋ฑ)์ ์์ฑ
๊ฐ ์์ ์์์ ์๋์ํ ์ ๋ค์์ ์ ๋ ฅ์ผ๋ก ๋ฐ๋๋ค:
ํ์ฌ ์
๋ ฅ ์ง์ ์๋ ์ํ ์ฆ, ์๋ ์ํ๋ ๋ค์๊ณผ ๊ฐ์ด ๊ณ์ฐ๋๋ค.
์
๋ ฅ ๊ฐ์ค์น, ์ด์ ์ํ ๊ฐ์ค์น, ํธํฅReLU ๊ฐ์ ๋น์ ํ ํ์ฑํ ํจ์๊ฐ ์๋ ์ํ ๋ ๋ ํ๋์ ์ถ๋ ฅ ์ ์์ฑํ ์ ์๋ค (ํ์์ ๋ฐ๋ผ)
RNN์ ํ๋์ ์ ๋ ฅ๋ง ๋ณด๋ ๊ฒ์ด ์๋๋ผ, ์ด์ ์ ๋ชจ๋ ์ ๋ ฅ๋ค์ ๊ธฐ์ตํ ์ํ์์ ๋ค์ ์ถ๋ ฅ์ ๊ฒฐ์ ํ๋ค.
์ด๊ฒ ๋ฐ๋ก ๋จ์ํ Feedforward ์ ๊ฒฝ๋ง๊ณผ์ ๊ฐ์ฅ ํฐ ์ฐจ์ด์ ์ด๋ค.
ํ๋์ ์์ ์์ ์ ๋ ฅ ๋ฒกํฐ๋ ๋ค์๊ณผ ๊ฐ์ด ๊ตฌ์ฑ๋๋ค:
์๋ ์ํ ๋ฒกํฐ๋ ๋ค์๊ณผ ๊ฐ๋ค:
์๋์ธต์ ๊ฐ ์ ๋ ์ ๋ํ ๊ณ์ฐ์์ ๋ค์๊ณผ ๊ฐ๋ค:
ํ์ฌ ์ ๋ ฅ ๊ณผ ๋ฐ๋ก ์ง์ ์๋ ์ํ ๋ฅผ ํฉ์ณ์ ์๋ก์ด ์๋ ์ํ ์ ๋ง๋ ๋ค.
ํ๊ท ์ ๊ณฑ ์ค์ฐจ (Squared Error Loss) ๋ฅผ ์ฌ์ฉํ๋ฉด ๋ค์๊ณผ ๊ฐ๋ค:์ฆ, ๋ง์ง๋ง ์๋ ์ํ ๊น์ง ์์ฐจ์ ์ผ๋ก ์ ๋ณด๋ฅผ ํตํฉํ ํ, ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ถ๋ ฅ ์ ๋ง๋ค๊ณ ,
๊ทธ ๊ฒฐ๊ณผ๊ฐ ์ค์ ์ ๋ต ์ ์ผ๋ง๋ ์ฐจ์ด๊ฐ ์๋์ง๋ฅผ ๊ธฐ์ค์ผ๋ก ๋ชจ๋ธ์ ํ์ตํ๊ฒ ๋๋ค.
๋ฌธ์๋ ๋ฌธ์ฅ์ ๋จ์ด๋ค์ ์ํ์ค๋ก ๊ตฌ์ฑ๋๋ค.
RNN์ ์ด๋ฐ ๋ฐ์ดํฐ๋ฅผ ๋ฃ๊ธฐ ์ํด์๋ ๋จผ์ ์ซ์ ๋ฒกํฐ ํํ๋ก ๋ณํํด์ฃผ๋ ์ ์ฒ๋ฆฌ ๊ณผ์ ์ด ํ์ํ๋ค.
์๋ฅด๊ณ (truncate)0์ผ๋ก ์ฑ์ด๋ค(pad)ํด๋น ๋จ์ด ์์น๋ง 1์ด๊ณ , ๋๋จธ์ง๋ ๋ชจ๋ 0ํฌ์ํ(sparse) ๋ฒกํฐ๊ฐ ๋๋ค.๋๋ถ๋ถ์ด 0์ด๋ผ์ ๊ณ์ฐ ๋นํจ์จ์ ์ด๊ณ , ์๋ฏธ ์ ๋ณด๋ ์์์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, ์ฐ๋ฆฌ๋ ๋ฏธ๋ฆฌ ํ์ต๋ ๋จ์ด ์๋ฒ ๋ฉ(embedding) ์ ์ฌ์ฉํ๋ค.
์ด๋ฌํ ์๋ฒ ๋ฉ ํ๋ ฌ์ ๋๋๋ก PCA(Principal Component Analysis, ์ฃผ์ฑ๋ถ ๋ถ์) ๋ฅผ ์์ฉํ ๋ฐฉ์์ผ๋ก ์์ฑ๋๊ธฐ๋ ํ๋ค.
๊ณ ์ฐจ์ ๋ฐ์ดํฐ๋ฅผ ์ ์ฐจ์ ๊ณต๊ฐ์ ์๋ฏธ ์๊ฒ ์์ถํ๋ ๊ธฐ๋ฒ์ด๋ค.์ค์(real number) ๋ฒกํฐ๋ก ์๋ฐฑ ์ฐจ์(m โช 10,000) ์ ๋๋ก ์ค์ด๋ ๋ค (๋ณดํต )์๋ ์๋ฒ ๋ฉ์ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ํจ์จ์ ์ด๊ณ ์๋ฏธ ์๊ฒ ํํํ ์ ์๊ฒ ํด ์ฃผ๋ฉฐ, PCA์ ๊ฐ์ ์ฐจ์ ์ถ์ ๊ธฐ๋ฒ์ ์์ด๋์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ง๋ค์ด์ก๋ค๋ ์ ์์ ๋จ์ํ ์ธ์ฝ๋ฉ ๊ทธ ์ด์์ ์ ๊ณตํ๋ค.
๊ธฐ์กด์ ๊ธฐ๋ณธ RNN ๊ตฌ์กฐ๋ก IMDB ์ํ ๋ฆฌ๋ทฐ ๊ฐ์ ๋ถ๋ฅ๋ฅผ ํ์ตํ ๊ฒฐ๊ณผ๋โฆ
์ ํ๋: 76%
๋ง์ ๊ณต์ ๋ค์์ง๋ง ๊ธฐ๋์ ๋ชป ๋ฏธ์น๋ ์ฑ๋ฅ์ด์๋ค. ๊ทธ ์ด์ ๋?
์ฅ๊ธฐ ์์กด์ฑ ๋ฌธ์ (long-term dependency) ๋ฅผ ์ ์ฒ๋ฆฌํ์ง ๋ชปํจ๊ธฐ์ธ๊ธฐ ์์ค(gradient vanishing)๋ก ์ธํด ์ฌ๋ผ์ง๋ ๋ฌธ์ ๊ฐ ์์๋ณด๋ค ๋ฐ์ ๋ RNN ๊ตฌ์กฐ์ธ LSTM (Long Short-Term Memory) ๋คํธ์ํฌ๋ฅผ ์ ์ฉํ๋ค.
LSTM์ ์ ๋ณด๊ฐ ์ธ์ ์ ์ฅ๋๊ณ , ๋ฒ๋ ค์ง๊ณ , ์ถ๋ ฅ๋ ์ง๋ฅผ ์ ์ดํ๋ ๊ฒ์ดํธ(gate) ๊ตฌ์กฐ๋ฅผ ์ฌ์ฉํจLSTM์ ์ค์ํ ์ ๋ณด๋ ์ค๋ ๊ธฐ์ตํ๊ณ , ๋ถํ์ํ ์ ๋ณด๋ ๋นจ๋ฆฌ ์ง์์,
๋ ๋๋ํ๊ฒ๋ฌธ๋งฅ์ ์ ์งํ๋ค!
์ ํ๋: 87%
IMDB ๋ฐ์ดํฐ๋ ์ค๋ซ๋์ ์ ๊ฒฝ๋ง ๊ตฌ์กฐ ์ฑ๋ฅ์ ๋น๊ตํ๋ ๋ฒค์น๋งํฌ๋ก ์ฌ์ฉ๋์ด ์๋ค.
2020๋
๊ธฐ์ค์ผ๋ก๋ ๊ฐ์ฅ ์ข์ ๋ชจ๋ธ์ด ๋ค์๊ณผ ๊ฐ์ ์ฑ๋ฅ์ ๋ณด์๋ค:
SOTA ์ ํ๋: ์ฝ 95%
๋ฐ์ดํฐ์
์๊ฐ: NYSE (New York Stock Exchange)
๋ชฉํ: ๋ค์ ๋ ์ Log ๊ฑฐ๋๋์ ์์ธกํ๋ ๊ฒ
์ ๋ ฅ:
์ถ๋ ฅ:
์์ฐ์ด ์ฒ๋ฆฌ์์ ๋ฌธ์ฅ์ด ์ ๋ ฅ์ด์๋ค๋ฉด,
์๊ณ์ด ๋ฌธ์ ์์๋ ์ซ์ ํ๋ฆ ์์ฒด๊ฐ ๋ชจ๋ธ์ ์ ๋ ฅ์ด ๋๋ค!
[๊ณผ๊ฑฐ๋ก ๊ฐ์๋ก Correlation์ด ๋จ์ด์ง๋ ๊ตฌ์กฐ]
์์ฐจ ์์์ ์๊ธฐ์ฌ์ค๊ฐ์ ์ผ ๊ฐ๊ฒฉ์ ๋ ๊ฐ ์ ์ฌ์ด์ ์๊ด๊ด๊ณ๋ฅผ ์๋ฏธํ๋ค.
์ด๋ฌํ ์ ์๋ฏธํ ์๊ธฐ์๊ด์ ๊ณผ๊ฑฐ ๊ฐ๋ค์ด ๋ฏธ๋ ์์ธก์ ๋์์ด ๋ ์ ์๋ค๋ ์ ๋ขฐ๋ฅผ ์ค๋ค.
์ด ์์ธก ๋ฌธ์ ์ ํฅ๋ฏธ๋ก์ด ์ ์, ์์ธกํ๋ ค๋ ๊ฐ ์์ฒด๊ฐ ๊ณผ๊ฑฐ ์์ ์์๋ ์ ๋ ฅ ํน์ฑ์ผ๋ก๋ ์ฌ์ฉ๋๋ค๋ ๊ฒ์ด๋ค.
IMDB์ฒ๋ผ ์๋ง ๊ฐ์ ๋ฆฌ๋ทฐ๊ฐ ์๋ ๊ฒ ์๋๋ผ, ํ๋์ ๊ธด ์๊ณ์ด๋ง ์์ ๋ RNN์ ์ด๋ป๊ฒ ํ์ต์ํฌ ์ ์์๊น?
์ฐ๋ฆฌ๋ lag step๋ง๋ค ์๋ ์ ๋ 12๊ฐ๋ฅผ ๊ฐ๋ RNN์ ๊ตฌ์ฑํด ํ์ต์ ์งํํ๋ค.
ํ๋์ ์๊ณ์ด์ด๋ผ๋ ์๊ฒ ์ชผ๊ฐ๋ฉด,
์์ฒ ๊ฐ์ ํ๋ จ ์ํ์ ๋ง๋ค์ด RNN์ ํ์ต์ํฌ ์ ์๋ค!
ํ ์คํธ ๊ธฐ๊ฐ ๋์์ ์์ธก ๊ฒฐ๊ณผ์ ์ค์ ๊ฐ์ ๋น๊ตํด๋ณธ ๊ฒฐ๊ณผ, RNN์ด ๊ฝค ๊ด์ฐฎ์ ์ฑ๋ฅ์ ๋ณด์ฌ์คฌ๋ค.
๋จ์ํ ํ๋ฃจ ์ ๊ฐ์๋ง ์์กดํ๋ ์์ธก๋ณด๋ค๋,
RNN์ด ๊ณผ๊ฑฐ ํจํด์ ํ์ตํด์ ๋ ์ ํํ ์์ธก์ ์ ๊ณตํ ์ ์๋ค
RNN forecaster๋ ์ ํต์ ์ธ AR (AutoRegrestion) ๋ชจ๋ธ๊ณผ ๊ตฌ์กฐ์ ์ผ๋ก ๋น์ทํ๋ค.
์ด ํ๋ ฌ ์ ๋ํด OLS (์ต์์ ๊ณฑ) ํ๊ท๋ฅผ ์ํํ๋ฉด ๋ค์๊ณผ ๊ฐ์ ์์ธก์์ ์ป๋๋ค:
โ ์ด ๋ชจ๋ธ์ ์ฐจ์ ์ ์๊ธฐํ๊ท ๋ชจ๋ธ, ์ฆ AR() ๋ก ๋ถ๋ฆฐ๋ค.
NYSE ๋ฐ์ดํฐ์์๋ ๋ค์ฐ์กด์ค ์์ต๋ฅ ๊ณผ ๋ก๊ทธ ๋ณ๋์ฑ๋ ์์ธก์ ์ฌ์ฉ ๊ฐ๋ฅ
๊ฐ๊ฐ์ ์งํ์ ๋ํด ๊ฐ์ ์์ฐจ๊ฐ์ ์ฌ์ฉํ๋ฉด, ์ด ๊ฐ์ ์
๋ ฅ ํน์ฑ (3๊ฐ ๋ณ์ ร L ์์ฐจ + ์์ํญ)
์ ํต์ ์ธ AR ๋ชจ๋ธ์ ์ ํ ํ๊ท ๊ธฐ๋ฐ์ด์ง๋ง,
RNN์ ๊ฐ์ ์ ๋ ฅ ๊ตฌ์กฐ๋ฅผ ์ฌ์ฉํ๋ฉด์๋ ๋น์ ํ ๊ด๊ณ๋ฅผ ํ์ตํ ์ ์๋ ์ ์ฐํจ์ด ์ฅ์ ์ด๋ค.
๐ ๋ชจ๋ธ๋ณ ๋น๊ต
| ๋ชจ๋ธ | ( R^2 ) | ํ๋ผ๋ฏธํฐ ์ | ๋น๊ณ |
|---|---|---|---|
| AR(5) (์ ํ ํ๊ท) | 0.41 | 16๊ฐ | ๊ธฐ์ค ๋ชจ๋ธ |
| RNN (L=5, K=12) | 0.42 | 205๊ฐ | ๋น์ ํ ๊ตฌ์กฐ, ๋ ๋ง์ ํ๋ผ๋ฏธํฐ |
| AR(5) + Neural Net | 0.42 | - | ์ ํ ํ๊ท ๋์ ๋น์ ํ ๋ชจ๋ธ๋ก ๋์ฒด |
| + ์์ผ ์ ๋ณด(day_of_week) ํฌํจ | 0.46 | ์ฆ๊ฐ๋จ | ์์์ผยท๊ธ์์ผ ๊ฑฐ๋๋ ํน์ฑ ๋ฐ์ |
3D Tensor: (#Samples, #Time Steps, #Features)