https://www.kaggle.com/code/mikenguyen1712/nasa-turbofan-predict-rul-using-lstm-and-ar-model
In [1] ~ [8]
데이터 읽어들이고 dataframe 생성
In [9]
minmaxscaler, powertransformer로 정규화
In [10]
X_train은 label 없이 위의 dataframe 그대로 사용, Y_train은 label값만 추출
In [11]
max_cycles는 데이터 셋에서 준 rul들 중 unit별로 최댓값들을 모아놓음
cycle의 수를 계산
In [12]
AR : autoregressive(자기 회귀) 변수의 과거 값의 선형 조합을 이용하여 관심 있는 변수를 예측
RUL_df가 과거 10개의 append로 AR을 구현하는 것 같음
y_train(결과값)이 11부터 시작하는 것에 주의
In [13]~[14]
create model
LSTM : Long Short-Term Memory
RNN은 recurrent하게 이전 단계에서 얻은 정보가 지속되도록 한다. 단 필요한 정보를 얻기 위한 시간 격차가 크지 않은 경우에서 유용하다. 즉 긴 의존 기간의 문제를 해결하기 어려워한다. LSTM은 긴 의존 기간을 필요로 하는 학습을 수행할 수 있다. RNN처럼 체인과 같은 구조를 가지지만 각 반복 모듈은 다른 구조를 갖는다. 4개의 layer가 서로 정보를 주고 받는다.
https://dgkim5360.tistory.com/entry/understanding-long-short-term-memory-lstm-kr
In [15]~[16]
fit, predict
In [17]~[20]
test 데이터 dataframe으로 변형
In [21]~[22]
minmaxscaler, powertransformer로 정규화
In [23]
AR 구현
In [24]
predict
In [27]
시각화