-
ADsP 데이터분석준전문가 - 시계열 예측, 시계열 모형S T U D Y/DataBase 2023. 2. 4. 19:06728x90반응형
시계열자료
시간의 흐름에 따라 관측된 데이터
시계열데이터(자료)는 정상성을 못하면 분석할 수 없다는 틀린 지문. 정상성을 갖지 않는 자료는 정상성 갖도록 변환한 후 시계열자료를 만들 수 있음정상성
시계열의 평균과 분산에 체계적인 변화 및 주기적 변동이 없다는 것
미래는 확률적으로 과거와 동일
시점에 상관없이 시계열의 특성이 일정한 것정상시계열의 조건
평균은 모든 시점(시간t)에 대해 일정하다 = 평균이 일정하다
분산은 모든 시점(시간t)에 대해 일정하다 = 분산이 시점에 의존하지 않는다
공분산은 시점(시간t)에 의존하지 않고, 시차에만 의존한다. = 시점에는 의존하지 않고, 시차에만 의존한다.
의존하지않는다 = 관계없다, 관계없이 일정하다.정상시계열로 전환하는 방법
평균이 일정하지 않은 경우 : 원계열에 차분 사용
계절성을 갖는 비정상시계열 : 계절 차분 사용
분산이 일정하지 않은 경우 : 원계열에 자연로그(변환) 사용
차분
현 시점의 자료 값에서 전 시점의 자료 값을 빼 주는 것시계열 모형
AR모형(자기회귀모형)
AR(p) : 자기 자신의 과거 값을 사용해서 설명
백색 잡음의 현재 값과 자기 자신의 과거 값의 선형 가중 값으로 이루어진 정상확률모형
현 시점의 자료가 p 시점 전의 유한 개의 과거자료로 설명될 수 있음
ACF는 지수적으로 감소, PACF는 p+1차 항부터 절단된 형태 취함
MA모형(이동평균모형)
MA(q) : 과거 q시점 이전 오차들에서 현재항의 상태를 추론함
최근 데이터의 평균을 예측치로 사용함. 각 과거치는 동일 가중치가 주어짐
백색잡음의 선형결합으로 표현되어 항상 정상성을 만족함
자기상관함수 q+1시차 이후 절단된 형태를 취함
ARIMA모형(자기회귀 누적 이동평균 모형)
현재와 추세간의 관계를 정의함.
비정상시계열모형
ARIMA(p, d, q) => p: AR모형 차수, d : 차분, q : MA모형 차수
ARIMA(1, 2, 3) => 2번 차분해서 ARMA모형이 될 수 있음
ARIMA(0, 1, 3) => IMA(1, 3) 모형이고, 이것을 1번 차분하면 MA(3) 모형이 됨
ARIMA(2, 3, 0) => ARI(2, 3) 모형이고, 이것을 3번 차분하면 AR(2) 모형이 됨자기상관함수(ACF)
시계열 데이터의 자기상관성을 파악하기 위한 함수
시계열 관측치 Yt와 Yt-k간 상관계수를 k의 함수 형태로 표시한 것(k:시간단위)
k가 커질 수록 ACF는 0으로 수렴부분자기상관함수(PACF)
Y와 Yt-k 중간에 있는 값들의 영향 제외시키고 두 값의 직접적 상관관계를 파악하기 위함
백색잡음
시계열 자료 중 자기상관이 전혀 없는 특별한 경우
시계열 평균이 0, 분산 일정, 자기공분산 0인 경우
미래예측에 전혀 도움이 되지 않는 값
회귀분석의 오차항과 비슷한 개념분해시계열
시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석함
분해시계열 분해 요인 #반드시 암기
추세요인 : 자료의 그림을 그렸을 때 형태가 오르거나 내리는 등 특정한 형태를 취할 때
계절요인 : 계절에 따라, 고정된 주기에 따라 자료가 변화하는 경우
순환요인 : 물가상승률, 급격한 인구증가 등의 이유로 알려지지 않은 주기를 가지고 자료가 변화
불규칙요인 : 위 세가지 요인으로 설명할 수 없는 회귀분석에서 오차가 해당하는 요인에 의해 발생728x90반응형'S T U D Y > DataBase' 카테고리의 다른 글
ADsP 데이터분석준전문가 - 의사결정나무 (0) 2023.02.05 ADsP 데이터분석준전문가 - 데이터 마이닝, 데이터 분석 순서, 분류분석 종류 (0) 2023.02.05 ADsP 데이터분석준전문가 - 차원 축소 기법 (0) 2023.02.04 ADsP 데이터분석준전문가 - 상관분석, 피어슨 스피어만 상관계수 (0) 2023.02.04 ADsP 데이터분석준전문가 - 과대적합, Regularization, Scaling (0) 2023.02.04