ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • ADsP 데이터분석준전문가 - 시계열 예측, 시계열 모형
    S T U D Y/DataBase 2023. 2. 4. 19:06
    728x90
    반응형
    시계열자료

    시간의 흐름에 따라 관측된 데이터
    시계열데이터(자료)는 정상성을 못하면 분석할 수 없다는 틀린 지문. 정상성을 갖지 않는 자료는 정상성 갖도록 변환한 후 시계열자료를 만들 수 있음

    정상성

    시계열의 평균과 분산에 체계적인 변화 및 주기적 변동이 없다는 것
    미래는 확률적으로 과거와 동일
    시점에 상관없이 시계열의 특성이 일정한 것

    정상시계열의 조건

    평균은 모든 시점(시간t)에 대해 일정하다 = 평균이 일정하다
    분산은 모든 시점(시간t)에 대해 일정하다 = 분산이 시점에 의존하지 않는다
    공분산은 시점(시간t)에 의존하지 않고, 시차에만 의존한다. = 시점에는 의존하지 않고, 시차에만 의존한다.
    의존하지않는다 = 관계없다, 관계없이 일정하다.

    정상시계열로 전환하는 방법

    평균이 일정하지 않은 경우 : 원계열에 차분 사용
    계절성을 갖는 비정상시계열 : 계절 차분 사용
    분산이 일정하지 않은 경우 : 원계열에 자연로그(변환) 사용

    차분
    현 시점의 자료 값에서 전 시점의 자료 값을 빼 주는 것

    시계열 모형

    AR모형(자기회귀모형)
    AR(p) : 자기 자신의 과거 값을 사용해서 설명
    백색 잡음의 현재 값과 자기 자신의 과거 값의 선형 가중 값으로 이루어진 정상확률모형
    현 시점의 자료가 p 시점 전의 유한 개의 과거자료로 설명될 수 있음
    ACF는 지수적으로 감소, PACF는 p+1차 항부터 절단된 형태 취함

    MA모형(이동평균모형)
    MA(q) : 과거 q시점 이전 오차들에서 현재항의 상태를 추론함
    최근 데이터의 평균을 예측치로 사용함. 각 과거치는 동일 가중치가 주어짐
    백색잡음의 선형결합으로 표현되어 항상 정상성을 만족함
    자기상관함수 q+1시차 이후 절단된 형태를 취함

    ARIMA모형(자기회귀 누적 이동평균 모형)
    현재와 추세간의 관계를 정의함.
    비정상시계열모형
    ARIMA(p, d, q) => p: AR모형 차수, d : 차분, q : MA모형 차수
    ARIMA(1, 2, 3) => 2번 차분해서 ARMA모형이 될 수 있음
    ARIMA(0, 1, 3) => IMA(1, 3) 모형이고, 이것을 1번 차분하면 MA(3) 모형이 됨
    ARIMA(2, 3, 0) => ARI(2, 3) 모형이고, 이것을 3번 차분하면 AR(2) 모형이 됨

    자기상관함수(ACF)

    시계열 데이터의 자기상관성을 파악하기 위한 함수
    시계열 관측치 Yt와 Yt-k간 상관계수를 k의 함수 형태로 표시한 것(k:시간단위)
    k가 커질 수록 ACF는 0으로 수렴

    부분자기상관함수(PACF)

    Y와 Yt-k 중간에 있는 값들의 영향 제외시키고 두 값의 직접적 상관관계를 파악하기 위함

    백색잡음

    시계열 자료 중 자기상관이 전혀 없는 특별한 경우
    시계열 평균이 0, 분산 일정, 자기공분산 0인 경우
    미래예측에 전혀 도움이 되지 않는 값
    회귀분석의 오차항과 비슷한 개념

    분해시계열

    시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석함

    분해시계열 분해 요인 #반드시 암기

    추세요인 : 자료의 그림을 그렸을 때 형태가 오르거나 내리 등 특정한 형태를 취할 때
    계절요인 : 계절에 따라, 고정된 주기 따라 자료가 변화하는 경우
    순환요인 : 물가상승률, 급격한 인구증가 등의 이유로 알려지지 않은 주기를 가지고 자료가 변화
    불규칙요인 : 위 세가지 요인으로 설명할 수 없는 회귀분석에서 오차가 해당하는 요인에 의해 발생

    728x90
    반응형

    댓글

Designed by Tistory.