Časové řady - přehled
Klíčová slova: Testování hypotéz, ANOVA, Regrese, Korelace, Časové řady, Vícečlenná (multivariační) analýza
Klíčové pojmy: Časová řada $y_t$ je posloupnost hodnot uspořádaná v čase., Intervalové řady používají aritmetický průměr, okamžikové chronologický průměr., První diference $\Delta y_t = y_t - y_{t-1}$ měří absolutní přírůstek., Koeficient růstu $g_t = \dfrac{y_t}{y_{t-1}}$ a relativní přírůstek $r_t = g_t - 1$., Bazický index se získá násobením řetězových indexů: $I_{0,t} = \prod_{k=1}^{t} g_k$., Aditivní model: $y_t = T_t + S_t + C_t + e_t$, multiplikativní model: $y_t = T_t \cdot S_t \cdot C_t \cdot e_t$., Sezónnost odhadneme klouzavými průměry: vyrovnaná řada = trend a sezónní odchylka = rozdíl nebo podíl., Exponenciální vyrovnávání používá vyrovnávací konstantu $\alpha$ a verze: jednoduché, Holt, Holt–Winters.
## Úvod
Časové řady jsou sekvence hodnot uspořádané podle času, které popisují vývoj sledovaného jevu v čase. Tento materiál shrnuje základní pojmy, typy časových řad, měry dynamiky, dekompozici, metody odhadu trendu a sezónnosti, vyrovnávání a kritéria hodnocení modelů.
> Definice: Časová řada $y_t$ je posloupnost hodnot sledovaného ukazatele, která je jednoznačně uspořádaná z hlediska času.
## Základní rozdělení časových řad
### Podle vztahu k časové ose
- **Intervalové**: hodnoty za určitý interval (např. měsíční tržby).\
- **Okamžikové**: hodnoty v konkrétním okamžiku (např. počet obyvatel k 1.1.).
> Poznámka: Cokoliv, co má známé přiřazení k časové ose, lze označit jako časovou řadu.
### Podle povahy veličin
- **Tokové veličiny**: měří množství v intervalu (např. zisk, náklady).\
- **Stavové veličiny**: měří stav ke konkrétnímu okamžiku (např. počet obyvatel, míra nezaměstnanosti).
### Podle periodicity
- **Krátkodobé**: periodicita mezi záznamy je kratší než 1 rok (např. měsíční, čtvrtletní).\
- **Dlouhodobé**: periodicita je $\\geq 1$ rok (např. roční data).
| Kritérium | Krátkodobé | Dlouhodobé |
|---|---:|---:|
| Perioda | < 1 rok | $\geq 1$ rok |
| Typické složky | sezónnost, trend, cyklus, náhodnost | trend, cyklus, náhodnost |
## Měření střední hodnoty časové řady
- Intervalové řady: použijeme aritmetický průměr.\
- Okamžikové řady: použijeme chronologický průměr (vážený podle délky intervalů, pokud se liší, např. různé počty dnů v měsících).
> Definice: Chronologický průměr bere v úvahu různé časové délky mezi záznamy a váží hodnoty podle délky intervalu.
## Základní míry dynamiky
- **První diference (absolutní přírůstek)**: $\Delta y_t = y_t - y_{t-1}$.\
- **Průměrná první diference**: aritmetický průměr $\Delta y_t$.\
- **Koeficient růstu**: $g_t = \dfrac{y_t}{y_{t-1}}$.\
- **Průměrný koeficient růstu**: geometrický průměr koeficientů růstu.\
- **Relativní přírůstek (v \% )**: $r_t = g_t - 1 = \dfrac{y_t - y_{t-1}}{y_{t-1}}$.\
- **Průměrný relativní přírůstek**: průměr relativních přírůstků (buď aritmetický nebo geometrický podle kontextu).
- **Bazický index**: porovnání vůči fixní bázi (pořád stejné období srovnání).\
- **Řetězový index**: porovnání po sobě jdoucích období (proměnlivý jmenovatel).
Fun fact: Koeficient růstu je vždy řetězový index, ale řetězový index nemusí být koeficient růstu, pokud se jmenovatel liší od přímého předchozího období.
### Vztahy mezi indexy
- Bazický index k období $t$ lze získat postupným násobením řetězových indexů od počátku: $$I_{0,t} = \prod_{k=1}^{t} g_k.$$\
- Řetězové indexy lze získat dělením po sobě jdoucích bazických indexů: $$g_t = \dfrac{I_{0,t}}{I_{0,t-1}}.$$
## Dekompozice časové řady
Časovou řadu často modelujeme jako součet či součin komponent:
- **Aditivní model**: $y_t = T_t + S_t + C_t + e_t$, kde $T_t$ = trend, $S_t$ = sezónnost, $C_t$ = cyklická složka, $e_t$ = náhodná složka.\
- **Multiplikativní model**: $y_t = T_t \cdot S_t \cdot C_t \cdot e_t$ (sezónnost a cyklus relativní k trendu).
> Definice: Dekompozice je rozklad časové řady na jednotlivé složky tak, aby každá složka měla samostatný charakter a bylo možné ji lépe modelovat.
Složky:
- Trendová složka: dlouhodobý směr v datech.\
- Sezónní složka: pravidelné fluktuace kratší než 1 rok (pouze v krátkodobých řadách).\
- Cyklická složka: nepravidelné, obvykle delší perioda než 1 rok.\
- Nesystematická složka: náhodné odchylky bez systematického charakteru.
| Model | Jednotky složek | Kdy použít |
|---|---:|---|
| Aditivní | stejná jednotka jako $y_t$ | když amplituda sezónnosti je nezávislá na úrovni trendu |
| Multiplikativní | relativní složky | když amplituda sezónnosti roste s úrovní trendu |
## Odhad trendu
Trend modelujeme jako funkci času. Základní tvary trendu:
- Lineární: $$T_t = a + bt$$
- Kvadratický: $$T_t = a + bt + ct^2$$
- Exponenciální: $$T_t = a \cdot b^t$$
- Logaritmický: $$T_t = a + b \log t$$
- Hyperbolický: $$T_t = \dfrac{a}{t + b}$$
Metody odhadu parametrů trendu