profile
Just Enjoy Yourself
post-thumbnail

시계열 모형 종류

AR(p) - 자기 회귀 모형 ,AR(1)에 적용하기 위해선 −1<ϕ1<1조건이 필요하다MA(q) - 이동평균 모형ARMA(p,q)ARIMA(p,d,q) - 자기회귀누적이동평균 모형 : 차수의 개수(d)는 거의 2를 넘지 않는다.SARIMA(Seasonal

2023년 2월 28일
·
0개의 댓글
·
post-thumbnail

자기상관, 부분자기상관

자기상관은 다른 시점의 관측값 간 상호연관성을 나타내므로 이는 시차를 적용한 시계열 데이터 간의 상관관계를 의미자기상관 AC 는 원래의 시계열 데이터(y_t)와 k시차가 고려된 즉 k기간 뒤로 이동한 시계열 데이터(y_t-k)간의 상관관계로 정의시차에 따른 일련의 자기

2023년 2월 28일
·
0개의 댓글
·
post-thumbnail

평활화 기법

▪ 이동평균법(moving average method)• 시계열을 평활화하는 가장 단순한 방법은 이동평균(moving average)을 사용하는방법이다.• 시계열 자료의 특정시점(a time point) 관측치와 이 관측치의 이전과 이후 관측치의평균으로 대체하는 방법을

2023년 2월 28일
·
0개의 댓글
·

시계열 분석 개요

연도별, 분기별, 월별, 일별 ,시간별 등 시간의 흐름에 따라 순서대로 관측예) 국내총생산, 물가지수,판매량, 종합주가지수,강우량,태양 흑점수, 실험 및 관측자료 등시간 단위 외에도 사회적 변화나 환경정 변동요인을 기준으로 시계열 자료를 구분하는 경우가 있다.일반적으로

2023년 2월 28일
·
0개의 댓글
·
post-thumbnail

silhouette_score

sklearn.metrics.silhouettescore(\_X, labels, \*, metric='euclidean', sample_size=None, random_state=None, \*\*kwds)\[source](https://github

2023년 2월 24일
·
0개의 댓글
·
post-thumbnail

Mean Shift cluster

Mean Shift Clustering 개요K-Means랑 유사한데 차이점은K-means는 중심에 소속된 데이터의 평균 거리 중심으로 이동하는 데 반해,Mean Shift는 중심을 데이터가 모여있는 밀도가 가장 높은 곳으로 이동 시킴특징KDE (Kernel Densit

2023년 2월 24일
·
0개의 댓글
·
post-thumbnail

K-means clustering

KMeans 클러스터링 알고리즘은 n개의 중심점을 찍은 후에, 이 중심점에서 각 점간의 거리의 합이 가장 최소화가 되는 중심점 n의 위치를 찾고, 이 중심점에서 가까운 점들을 중심점을 기준으로 묶는 클러스터링 알고리즘이다.아래 그림을 보면 3개의 군집이 존재하는 것을

2023년 2월 24일
·
0개의 댓글
·

GMM(GaussianMixture)

머신러닝에서 자주 사용되는 Gaussian Mixture Model(GMM)을 알아보겠습니다. GMM은 머신러닝에서 Unsupervised Learning(클러스터링)에 많이 활용이 됩니다. 하지만 다른 K-means와 같은 클러스터링 알고리즘과는 다르게 통계적인 용어

2023년 2월 24일
·
0개의 댓글
·
post-thumbnail

DBSCAN

이번에는 클러스터링 알고리즘중 밀도 방식의 클러스터링을 사용하는 DBSCAN(Density-based spatial clustering of applications with noise) 에 대해서 알아보도록 한다.밀도 기반의 클러스터링은 점이 세밀하게 몰려 있어서 밀도

2023년 2월 24일
·
0개의 댓글
·
post-thumbnail

ROC_curve,AUC

roc_curve 는 임계값을 변화함에 따라 fpr과 tpr의 변화를 나타낸 plot으로 y=x를 기준으로 위에그려지는 포물선을 보고 평가할 수있다이때 roc_curve밑에 값을 auc라고 하는데 이 auc값은 0.5보다 크고 1보다 작은 값으로 1에 가까울수록 좋다고

2023년 2월 14일
·
0개의 댓글
·
post-thumbnail

Confusion_Matrics, precision, recall, precision_recall_curve

분류분석의 평가지표로 실제값과 예측값을 통하여 얼마나 잘 예측했는가를 평가할 수 있는 지표이다.실습을 통하여 확인해 보겠습니다.\[405 0]정확도: 0.9666666666666667정밀도: 1.0재현율: 0.6666666666666666분류알고리즘은 바로 labe

2023년 2월 14일
·
0개의 댓글
·

GridSearchCV

sklearn.model_selection.GridSearchCVclass sklearn.model_selection.GridSearchCV(estimator, param_grid, , scoring=None, n_jobs=None, refit=True, cv=None

2023년 2월 14일
·
0개의 댓글
·

kfold,stratifiedKFold

iris data 를 통하여 간단한 실습해보겠습니다.kfold 114 115 116 117 118 119]평균 검증 정확도: 0.9416599999999999각 교차검증에서 사용된 index번호와 그때 accuray값을 통하여 평가최종 평균accuracy를 통하여 모

2023년 2월 14일
·
0개의 댓글
·

데이터 인코딩

컴퓨터에서 인코딩이란 컴퓨터에서 연산이 가능하도록 범주형자료,명목형자료와 같은 변수를 0또는 1 로 인코딩하여 머신러닝 알고리즘에서 사용가능하도록 데이터를 변환하는 것사이킷런 머신러닝 알고리즘은 문자열 값을 입력 값으로 허용하지 않습니다. 그러므로 문자열 값들을 숫자

2023년 2월 14일
·
0개의 댓글
·
post-thumbnail

PCA 주성분분석

주성분분석의 필요성주성분분석(Principal Component Analysis, PCA)는 차원축소의 대표적 기법고차원 자료 분석을 위한 요구가 증가. 예: • IT: 이미지 자료• BT: 마이크로어레이 자료대부분의 전통적 통계분석 방법들은 변수 개수(p)가표본의 개

2023년 2월 14일
·
0개의 댓글
·
post-thumbnail

저PER전략

BPS : 주가수익배수PER : 주가수익비율PBR : 주가순자산비율EPS : 주당순이익DPS : 주당배당금

2023년 2월 7일
·
0개의 댓글
·
post-thumbnail

변동성돌파전략

누적수익률 \*\* (1 / (투자기간/365)) - 1 시계열데이터 활용 기간을 구할때는 (마이너스) 사용하면 기간 출력 가능CAGR : 7.941722848934263MDDMDD : 27.7797268495886272.187658780024402310.5

2023년 2월 7일
·
0개의 댓글
·

할로윈 투자 전략

11월 1일에 구매 -> 6개월동안 유지 4월 말일에 판매11월 첫날 시가로 구매4월 마지막날 종가로 판매수익율 = (3번과정 - 2번과정) / 2번과정 투자 기간이 21년 누적 수익율 계산CAGR(연복리수익율) 계산MDD(Max DrawDown) 백테스팅월별 수익률의

2023년 2월 7일
·
0개의 댓글
·

주가 데이터

KRX 라이브러리연복리수익률(최조자산 / 최초자산)^(1/투자기간)-1 -> 연복리수익률이므로 투자기간 12diff = kospi.index-1-kospi.index0diff \`\`\`Timedelta('607 days 00:00:00')26.111719470

2023년 2월 7일
·
0개의 댓글
·

랜덤포레스트

배깅과 부스팅보다 더 많은 무작위성을 주어 약한 학습기들을 생성한 후 이를 선형결합하여 최종 학습기를 만드는 방법정확도 : 0.8947368421052632\[102 5]정확도 89.47%정밀도 91.07%재현율 79.69%

2023년 2월 7일
·
0개의 댓글
·