[Adsp] 3-7. 시계열 분석

Mini·2022년 8월 20일
1

ADsP

목록 보기
13/17

(1) 시계열 분석

  • 일정 시간 간격으로 기록된 자료들에 대하여 특성을 파악하고 미래를 예측하는 분석 방법
  • 가까운 미래에 있을 날씨 예측, 주식 예측, 판매 예측 등의 목적으로 사용
  • 주가, 환율, 월별 재고량, 일일 확진자 수
  • 대부분 시계열 자료들은 자기상관성을 가지기 때문에 공분산은 '0'이 아님
  • 자기상관성 : 어떤 확률변수가 주어졌을 때, 서로 다른 두 시점에서의 관측치 사이에 나타나는 상관성

(2) 시계열 분석 자료

  • (1) 정상성 (평균이 일정, 분산이 시점에 의존하지 않을 것) 시계열 자료
  • (2) 비정상성 시계열 자료 (대부분 시계열 자료) -> 정상성 자료로 변환해야 함
    • 정상성 조건
      • 일정한 평균 <- 차분 (현 시점의 자료 값에서 전 시점의 자료 값을 빼는 것)을 통해 정상화
        • 계절적인 주기가 있는 경우 -> 여러 시점 전의 자료 값을 빼는 계절차분 사용
      • 일정한 분산 (모든 시점에 대해 분산이 일정해야함) <- 변환을 통해 정상화
        • 자료 값에 지수 혹은 로그를 취해 변환하여 분산의 크기 안정
      • 시차에만 의존하는 공분산
        • 시점 - 특정한 시간의 관점, 시차 - 시점과 시점 간의 차이
        • 공분산이 특정 시점에 의존하지 않는다 - t 시점과 t+s 시점의 공분산과 t 시점과 t-s 시점의 공분산은 서로 같다.
        • 시차 (시점과 시점) 간의 차이에 따라 공분산 값은 다를 수 있음.

(3) 자기상관계수 (ACF)

  • 시간의 흐름에 따른 자기상관관계
  • 자기상관함수
    • 특정 시점 t에서의 값과 t로부터 l만큼의 시차를 갖는 t+l시점에서의 값의 상관계수를 나타내는 함수
    • 시차 l을 x축으로, 상관계수 y축으로 하는 그래프로 표현가능
    • 시차가 0일 때 자기 자신과의 상관계수를 의미 자기상관함수 값 1

(4) 부분자기상관관계 (PACF)

  • 두 시계열 확률변수 간에 다른 시점의 확률변수 영향력은 통제하고 상관관계만 보여줌

(5) 시계열 분석 기법

  • 이동평균법 - 시계열 데이터에서 일정 기간별로 자료를 묶어 평균을 구하는 방법
    • 시간이 지남에 따라 평균 계산에 포함되는 자료가 바귀기 때문
    • 시계열 데이터의 평균을 구함으로써 여러 요인을로 인한 변동을 없앨 수 있다.
  • 지수평활법 - 최근 데이터일수록 큰 가중치 부여, 오래된 데이터는 작은 비중 부여하여 평균 계산
       

(6)시계열 모형

  • 자기회귀 모형 (AR)
    • 시계열 자료를 설명하기 위한 모형 중 하나
    • t라는 시점에서 값 y1는 이전 시점들 n개에 의해 설명될 수 있음을 의미
    • 현재의 시계열 자료는 n개의 이전 시점의 자료들로 설명이 가능하다는 전제
    • 적절한 n값을 찾기위해 PACF 그래프 사용
  • 백색 잡음
    • 현재 심점이 이전 시점과의 상관관계가 존재하지 않는 서로 독립적인 시계열 자료
    • 가우시안 백색잡음 -> 평균 M, 분산 시그마^2으로 정규분포를 따를 경우
      * 대표적인 정상성 가정을 만족하는 시게열 자료
  • 이동평균 (MA) 모형
    • 이전 시점의 백색잡음들의 선형 결합
    • 항상 정상성 만족
  • 자기 회귀 누적 이동 평균 (ARIMA) 모형
    • 비정상 시계열 자료를 다룰 수 있는 모형 -> 현실에 존재하는 대부분 시계열 자료 설명
    • 차분이나 변환통해 정상화
  • 분해 시계열
    • 분산 목적에 따라 특정 요인만 분리해 분석하거나 제거하는 작업을 함
    • 시계열의 구성요소 (추세, 순환, 계절, 불규칙)
      • 추세요인 -> 인구의 증가, 기술의 변화 등과 같은 요인에 의해 장기간 일정한 방향으로 상승 또는 하락하는 경향을 보이는 요인 (급격한 충격이 없는 한 지속)
      • 순환요인 -> 정확히 알려진 이유가 없고 주기가 일정하지 않은 변동
        • 보통 추세선을 딸 상하로 반복 운동
      • 계절요인 -> 일정한 주기를 가지는 상하 반복의 규칙적인 변동
        • 요일마다 반복되는 주기, 월별, 분기별, 계절별 등 고정적인 주기에 따라 자료의 변동이 반복되는 모든 경우가 계절 요인에 포함
        • 매년 같은 시기에 유사한 패턴 -> 예측 상대적으로 쉬움
        • 순환 요인보다 주기가 짧음.
      • 불규칙요인 -> 위의 세 가지 요인으로 설명 못함.
        • 규칙성 없이 우연히 발생하는 예측 불가능한 변동
        • 많으면 신뢰성 있는 예측 어려움
        • 천재지변, 질병 등과 같은 요인에 의해 발생하는 모든 변동

0개의 댓글