TL;DR

시계열 분해는 관측값을 추세(trend), 계절성(seasonality), 잔차(residual)로 나누어 본다.

예측 모델의 feature와 오류 분석을 구조적으로 해석하는 데 유용하다.

시계열 분해

시계열 분해는 관측값을 몇 가지 해석 가능한 성분으로 나누어 이해하는 방법이다. 일반적으로 관측값은 추세(trend), 계절성(seasonality), 잔차(residual 또는 remainder)로 나눈다.

분해 모형은 성분이 관측값에 작용하는 방식에 따라 additive와 multiplicative로 나뉜다.

Additive decomposition은 계절성과 잔차가 관측값에 절대량으로 더해진다고 가정한다.

y_{t} = T_{t} + S_{t} + R_{t}

여기서 $T_{t}$ 는 추세, $S_{t}$ 는 계절성, $R_{t}$ 는 잔차 또는 설명되지 않은 변동을 나타낸다. 계절 변동 폭이 시계열의 수준과 거의 독립적일 때 additive 구조가 적합하다. 예를 들어 매출 수준이 커져도 월별 계절 효과가 대략 +20처럼 일정한 크기로 나타나는 경우다. additive 구조에서 계절 성분은 보통 평균 0 주변의 효과로 해석된다.

Multiplicative decomposition은 계절성과 잔차가 현재 수준에 비례하는 배율로 작용한다고 가정한다.

y_{t} = T_{t} \times S_{t} \times R_{t}

이때 $S_{t}$ 와 $R_{t}$ 는 더해지는 값이 아니라 배율이다. 매출 수준이 커질수록 계절 변동 폭도 +10%처럼 함께 커지면 multiplicative 구조가 더 자연스럽다. multiplicative 구조에서 계절 성분은 보통 1 주변의 배율로 해석된다.

관측값과 성분이 모두 양수이면 로그 변환을 통해 multiplicative 구조를 additive 형태로 표현할 수 있다.

lo g y_{t} = lo g T_{t} + lo g S_{t} + lo g R_{t}

다만 0이나 음수가 포함된 시계열에는 직접 로그 변환을 적용할 수 없으므로 별도 처리가 필요하다.

수요예측에서는 장기 매출 수준 변화가 trend, 요일·월별 반복 패턴이 seasonality에 해당한다. 이벤트, 날씨, 프로모션 같은 외생 요인이 모델에 명시적으로 반영되지 않으면 residual에 남는다.

모델링에서의 의미

lag와 moving average feature는 최근 수준, 관성, 자기상관을 포착해 trend 정보를 간접적으로 반영한다.
요일, 월, 휴일, 시즌 feature는 seasonality를 설명한다.
residual이 특정 이벤트 주변에서 반복적으로 같은 방향으로 커지면, trend와 seasonality만으로 설명되지 않는 외생 요인이 있다는 신호다. 해당 이벤트를 feature로 추가하거나, 학습 데이터가 부족하면 별도의 후보정 규칙으로 반영한다.

Connections

정상성 — trend와 seasonality는 정상성을 깨뜨리는 주요 구조다.
외생변수와 내생변수 — residual처럼 보이는 변동이 외생변수로 설명될 수 있다.
Forecast Bias — 분해되지 않은 구조 변화는 누적 bias로 나타날 수 있다.

[[MOCs - Time Series Forecasting]]

탐색기

시계열 분해

시계열 분해

모델링에서의 의미

Connections

Comments

그래프 뷰

목차

백링크

탐색기

시계열 분해

시계열 분해

모델링에서의 의미

Connections

Related MOCs

Comments

그래프 뷰

목차

백링크