# Timeseries
Class weights 설정 방법
만약에 label 0이 221, 1이 268, 2가 209, 3이 100, 4가268, 5가 268, 5가 268가 있을 때 class_weight는 어떻게 부여해야 할까요? 다음과 같은 방법으로 설정할 수 있다.
결과값이 안 좋아지는 경우와 smape, mape
특성을 추가했을 때, 결과값이 더 안좋아지는 경우가 있다.다중공선성: 추가된 특성들이 서로 상관관계가 높은 경우, 모델은 이들 간의 차이를 명확히 구별하지 못할 수 있다. 이는 모델이 데이터의 노이즈를 캡처하게 되어 오버피팅을 초래할 수 있다.차원의 저주: 특성의 수가
GAM(Generalized Additive Model)과 ElasticNet
기본적인 선형회귀 모델은 입력 변수와 출력 변수 간의 관계가 선형이라는 강한 가정을 필요로 한다. 반면 GAM은 이러한 선형성 가정을 완화하고 각각의 독립 변수와 종속 변수 사이의 관계를 부드러운 곡선으로 모델링하며, 이를 통해 더욱 복잡한 데이터 패턴을 포착하는 데
Polynomial Features와 OOF 뜻
'PolynomialFeatures'는 사이킷런 라이브러리의 클래스로, 기능들 사이의 가능한 모든 다항식 항을 생성하는데 사용된다. 이는 원래 특성의 비선형 관계를 캡처하고 모델의 복잡성을 높이는데 도움이 될 수 있다.각 특성의 거듭제곱을 추가한다.각 특성 쌍의 곱을

Are Transformers Effective for Time Series Forecasting?
여태까지 했던 주제(Informer TFT)와 매우 상반되는 주제이다. 사실 이전까지 했던 Transformer 기반의 TimeSeriesForecasting은 Attention에 기반을 두면서, LSTF에 강점이 있었다.이번 포스팅에서는 이러한 기존의 Transfor

Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting
22년 11월에 읽었던 논문을 거의 1년이 지나가서야 블로그에 업로드 하게 됐다. 이미 word로 정리는 해뒀지만 때를 놓쳤다가 복습할겸해서 업로드를 한다. 이 논문 말고도 쌓여있는 논문이 너무 많다. Abstract Long Sequence Time-Series Fo

ARIMA/SARIMA/SARIMAX
수학적인 베이스는 한양대학교에서 오픈강의로 열린 곳을 참고 했습니다 링크텍스트 혹시나 질문이 있으시다면 dsd0919@naver.com 으로 메일 보내주시면 최대한 답변 드리겠습니다 Random Walk란? 시계열 데이터 $X_t$가 아래와 같은 모형을 따른다고 해보
Causal Impact | ABTest
Google Research Casual Impact Bayesian structural model에 기반되어있고, 과거 데이터를 기반으로 미래 데이터를 예측하는 Model Intervention 이전의 모든 데이터를 포함하며, 실제 데이터와 Intervention
Multivariate Time-series Anomaly Detection via Graph Attention Network (a.k.a MTAD-GAT)
Multivariate Time-series Anomaly Detection via Graph Attention Network 2020 IEEE International Conference on Data Mining (ICDM) Introduction 이전의 방

[Review] Are Transformers Effective for Time Series Forecasting? (2023, AAAI)
I. Introduction (2 minutes)Briefly introduce the topic and the purpose of the presentationProvide some background information on time series forecasti

Optimizer
최근에 연구 실험을 진행을 하는데 이전까지는 Optimizer를 그저 gradient를 최적화 해주는 도구로써 여겼었다. 하지만 torch에 optimizer.load_state_dict()가 있어서 Optimizer에도 업데이트 되는 부분이 있는건가 싶어서 연구미팅에

Transformer Paper Review
오늘은 Transformer Paper Review와 덧붙여 관련 얘기를 해볼 것이다. 우선 Transformer는 자연어 처리에 더욱 적합하게 탄생한 모델인 것 같다는 내 생각을 밝히면서 시작하겠다 논문에 Introduction에서 언어모델과 관련된 얘기를 하는 것으

Custom dataset for stock pytorch
how to feed data to pytorch modeldf 에 시간 및 종목으로 모든 것이 포함 되어 있을때기존 train_test_split 으로 나누기 불가능input_width (관찰기간 ex. 120일 짜리) 부족시 제외하기shuffle 은 어떻게train

시계열 데이터 처리 - 1. 데이터 확인 및 이상치 탐지
앞으로 LSTM을 공부하는 기록을 남길 것이며, 오늘은 모든 AI 모델 개발에서 첫 단계인 데이터 준비를 해볼 것이다

[시계열/시각화] Time Series Data Visualization And Analysis Techniques
코세라 프로젝트 Time Series Data Visualization And Analysis Techniques 의 요약입니다1\. 데이터셋 전처리2\. 전체 기간 내 온도 추이 확인하기3\. 각 지역별 평균 온도 비교하기4\. 특정 지역의 월별 평균 온도 확인하기데

Classical TimeSeries Forecasting With Basic
안녕하세요, 현재 인천대학교에서 AIDML연구실에서 Undergraduate Researcher로 있는 이성준 이라고 합니다. TimeSeries에 대한 ForeCasting 및 Analysis가 관심사이고 추후에는 Anormaly Detection 또한 연구해볼 생각
[Review] The MIDAS Touch: Mixed Data Sampling Regression Models - 2
일반 회귀모델에서 highest frequency 데이터를 aggregating을 하여 동일한 low-frequency로 맞춰주는 것은 high frequency 속에 있는 information을 충분히 이용하지 못한다는 문제가 있음.MIDAS는 많은 데이터(high
[Review] The MIDAS Touch: Mixed Data Sampling Regression Models
01 Introduction MIDAS variable of interest는 the lower frequency variable 이지만 relevant information은 the high frequency data인 경우에 활용. ex) stock market

InfluxDB 육하원칙
InfluxDB WEB UI 메인 화면InfluxDB 무엇인지? (1 what)공식 문서 참고InfluxDB WEB UI Explore 탭InfluxDB 언제 사용 가능하신지? (2 when)(BEST)IoT 센서, 웹 크롤링 등에서 주기(초/분)마다 데이터가 수집되는

[Error] Fbprophet
https://2hyes.tistory.com/118https://daewonyoon.tistory.com/266https://stackoverflow.com/questions/53178281/installing-fbprophet-python