AR(p) - 자기 회귀 모형 ,AR(1)에 적용하기 위해선 −1<ϕ1<1조건이 필요하다MA(q) - 이동평균 모형ARMA(p,q)ARIMA(p,d,q) - 자기회귀누적이동평균 모형 : 차수의 개수(d)는 거의 2를 넘지 않는다.SARIMA(Seasonal
자기상관은 다른 시점의 관측값 간 상호연관성을 나타내므로 이는 시차를 적용한 시계열 데이터 간의 상관관계를 의미자기상관 AC 는 원래의 시계열 데이터(y_t)와 k시차가 고려된 즉 k기간 뒤로 이동한 시계열 데이터(y_t-k)간의 상관관계로 정의시차에 따른 일련의 자기
▪ 이동평균법(moving average method)• 시계열을 평활화하는 가장 단순한 방법은 이동평균(moving average)을 사용하는방법이다.• 시계열 자료의 특정시점(a time point) 관측치와 이 관측치의 이전과 이후 관측치의평균으로 대체하는 방법을
연도별, 분기별, 월별, 일별 ,시간별 등 시간의 흐름에 따라 순서대로 관측예) 국내총생산, 물가지수,판매량, 종합주가지수,강우량,태양 흑점수, 실험 및 관측자료 등시간 단위 외에도 사회적 변화나 환경정 변동요인을 기준으로 시계열 자료를 구분하는 경우가 있다.일반적으로
sklearn.metrics.silhouettescore(\_X, labels, \*, metric='euclidean', sample_size=None, random_state=None, \*\*kwds)\[source](https://github
Mean Shift Clustering 개요K-Means랑 유사한데 차이점은K-means는 중심에 소속된 데이터의 평균 거리 중심으로 이동하는 데 반해,Mean Shift는 중심을 데이터가 모여있는 밀도가 가장 높은 곳으로 이동 시킴특징KDE (Kernel Densit
KMeans 클러스터링 알고리즘은 n개의 중심점을 찍은 후에, 이 중심점에서 각 점간의 거리의 합이 가장 최소화가 되는 중심점 n의 위치를 찾고, 이 중심점에서 가까운 점들을 중심점을 기준으로 묶는 클러스터링 알고리즘이다.아래 그림을 보면 3개의 군집이 존재하는 것을
머신러닝에서 자주 사용되는 Gaussian Mixture Model(GMM)을 알아보겠습니다. GMM은 머신러닝에서 Unsupervised Learning(클러스터링)에 많이 활용이 됩니다. 하지만 다른 K-means와 같은 클러스터링 알고리즘과는 다르게 통계적인 용어
이번에는 클러스터링 알고리즘중 밀도 방식의 클러스터링을 사용하는 DBSCAN(Density-based spatial clustering of applications with noise) 에 대해서 알아보도록 한다.밀도 기반의 클러스터링은 점이 세밀하게 몰려 있어서 밀도
roc_curve 는 임계값을 변화함에 따라 fpr과 tpr의 변화를 나타낸 plot으로 y=x를 기준으로 위에그려지는 포물선을 보고 평가할 수있다이때 roc_curve밑에 값을 auc라고 하는데 이 auc값은 0.5보다 크고 1보다 작은 값으로 1에 가까울수록 좋다고
분류분석의 평가지표로 실제값과 예측값을 통하여 얼마나 잘 예측했는가를 평가할 수 있는 지표이다.실습을 통하여 확인해 보겠습니다.\[405 0]정확도: 0.9666666666666667정밀도: 1.0재현율: 0.6666666666666666분류알고리즘은 바로 labe
sklearn.model_selection.GridSearchCVclass sklearn.model_selection.GridSearchCV(estimator, param_grid, , scoring=None, n_jobs=None, refit=True, cv=None
iris data 를 통하여 간단한 실습해보겠습니다.kfold 114 115 116 117 118 119]평균 검증 정확도: 0.9416599999999999각 교차검증에서 사용된 index번호와 그때 accuray값을 통하여 평가최종 평균accuracy를 통하여 모
컴퓨터에서 인코딩이란 컴퓨터에서 연산이 가능하도록 범주형자료,명목형자료와 같은 변수를 0또는 1 로 인코딩하여 머신러닝 알고리즘에서 사용가능하도록 데이터를 변환하는 것사이킷런 머신러닝 알고리즘은 문자열 값을 입력 값으로 허용하지 않습니다. 그러므로 문자열 값들을 숫자
주성분분석의 필요성주성분분석(Principal Component Analysis, PCA)는 차원축소의 대표적 기법고차원 자료 분석을 위한 요구가 증가. 예: • IT: 이미지 자료• BT: 마이크로어레이 자료대부분의 전통적 통계분석 방법들은 변수 개수(p)가표본의 개
누적수익률 \*\* (1 / (투자기간/365)) - 1 시계열데이터 활용 기간을 구할때는 (마이너스) 사용하면 기간 출력 가능CAGR : 7.941722848934263MDDMDD : 27.7797268495886272.187658780024402310.5
11월 1일에 구매 -> 6개월동안 유지 4월 말일에 판매11월 첫날 시가로 구매4월 마지막날 종가로 판매수익율 = (3번과정 - 2번과정) / 2번과정 투자 기간이 21년 누적 수익율 계산CAGR(연복리수익율) 계산MDD(Max DrawDown) 백테스팅월별 수익률의
KRX 라이브러리연복리수익률(최조자산 / 최초자산)^(1/투자기간)-1 -> 연복리수익률이므로 투자기간 12diff = kospi.index-1-kospi.index0diff \`\`\`Timedelta('607 days 00:00:00')26.111719470
배깅과 부스팅보다 더 많은 무작위성을 주어 약한 학습기들을 생성한 후 이를 선형결합하여 최종 학습기를 만드는 방법정확도 : 0.8947368421052632\[102 5]정확도 89.47%정밀도 91.07%재현율 79.69%