Verifikace modelů
Klíčová slova: Ekonometrije, Ekonometrické modelování, Verifikace modelů, Mikroekonomie
Klíčové pojmy: Verifikace modelů kontroluje předpoklady reziduí a vysvětlujících proměnných, Multikolinearita = vysoká korelace mezi vysvětlujícími proměnnými, Detekce multikolinearity: korelační matice, VIF, Autokorelace: testy Durbin–Watson a Breusch–Godfrey, Heteroskedasticita: testy Breusch–Pagan a White, Normalita reziduí: Jarque–Bera, Shapiro–Wilk, Řešení: oprava specifikace, transformace nebo robustní metody, V OLS jsou odhady nestranné i při hetero/autokorelaci, ale nejsou efektivní
## Úvod
Verifikace modelů se zabývá kontrolou, zda regresní model splňuje předpoklady potřebné pro spolehlivé odhady a testování hypotéz. Cílem je odhalit problémy v reziduích a mezi vysvětlujícími proměnnými, které by mohly zkreslit závěry z analýzy.
> Definice: Verifikace modelů je soubor testů a postupů, které hodnotí, zda model splňuje předpoklady jako homoskedasticita, normalita, absence autokorelace a multikolinearita.
## Hlavní oblasti verifikace
Rozdělíme si problém na čtyři hlavní oblasti:
### Multikolinearita
> Definice: Multikolinearita je vysoká korelace mezi vysvětlujícími proměnnými v regresním modelu.
- Proč je problém? Vysoká multikolinearita vede k velkému rozptylu odhadů parametrů, snížené statistické významnosti a citlivosti odhadů na malé změny v datech. Při dokonalé multikolinearitě nelze parametry odhadnout.
Praktický příklad: Máme dvě proměnné $x_1$ a $x_2$, které rostou se stejným trendem v čase. Při odhadu modelu $y = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + u$ budou odhady $\beta_1$ a $\beta_2$ silně nejisté.
Detekce:
- Párová korelační matice (rychlý screening)
- V dalším studiu: faktoriální analýza, VIF (variance inflation factor)
Řešení:
1. Vyřazení problematické proměnné
2. Ignorování, pokud jsou parametry statisticky významné a účel modelu to dovolí
3. Transformace / náhrada proměnné: postupné diference, relativní odchylky, normalizované odchylky nebo použití dummy proměnných
Příčiny:
- Společný trend v časových řadách
- Nevhodné zavedení zpožděných proměnných
- Špatné použití dummy proměnných
Věděli jste, že multikolinearita nezpůsobuje bias (systematickou chybu) odhadů, ale výrazně zvyšuje jejich rozptyl a tím zhoršuje spolehlivost testů?
### Autokorelace reziduí
> Definice: Autokorelace reziduí je závislost reziduální složky $u_t$ na jejích zpožděných (nebo budoucích) hodnotách $u_{t-1},u_{t-2},\dots$.
- Proč je problém? Autokorelace znamená, že odhady metodou OLS jsou stále nestranné a konzistentní, ale nejsou efektivní (nemají minimální rozptyl). Testy jsou pak nespolehlivé.
Detekce:
- Durbin–Watsonův test: $$DW = \frac{\sum_{t=2}^{T} (u_t - u_{t-1})^2}{\sum_{t=1}^{T} u_t^2}$$
- Hodnoty: přibližně 2 = žádná autokorelace, menší než 2 = pozitivní autokorelace, větší než 2 = negativní autokorelace.
- Breusch–Godfrey test: regresí reziduí na původní vysvětlující proměnné a na zpožděné rezidua: $$u_t = \alpha_1 + \alpha_2 x_{2t} + \alpha_3 x_{3t} + \alpha_4 u_{t-1} + \alpha_5 u_{t-2} + \dots + \epsilon_t$$
- $H_0$: všechny koeficienty u zpožděných reziduí jsou nula
Příčiny autokorelace:
- Setrvačnost ekonomických veličin
- Chybná specifikace modelu (chybějící důležité proměnné, nesprávná funkční forma)
- Chyby měření
- Nevhodné nastavení zpoždění vysvětlujících proměnných
Řešení:
1. Oprava specifikace modelu (přidat chybějící proměnné, odstranit nepotřebné, správná funkční forma)
2. Správné zavedení zpoždění vysvětlujících proměnných
3. Transformace dat (např. diferenciace)
4. Použití odhadových metod pro autokorelaci, např. Cochrane–Orcuttova metoda
Did you know that Durbin–Watsonův statistický test má meze, mezi nimiž není rozhodnutí jednoznačné, a proto se někdy používá doplňkový test Breusch–Godfrey?
### Heteroskedasticita (homo/heteroskedasticita)
> Definice: Homoskedasticita znamená konstantní rozptyl reziduí v čase nebo průřezu. Heteroskedasticita znamená, že rozptyl reziduí závisí na hodnotách vysvětlujících proměnných nebo na čase.
- Proč je problém? Při heteroskedasticitě jsou OLS odhady nestranné, ale opět neefektivní; navíc standardní chyby a testy významnosti mohou být chybně vypočtené.
Detekce:
- Breusch–Paganův test: odhad regrese čtverců reziduí na vysvětlující proměnné: $$u_t^2 = \alpha_1 + \alpha_2 x_{2t} + \alpha_3 x_{3t} + \varepsilon_t$$, $H_0$: všechny $\alpha_i = 0$ (homoskedasticita)
- Whiteův test: zahrnuje i křížové a kvadratické členy, například $$u_t^2 = \alpha_1 + \alpha_2 x_{2t} + \alpha_3 x_{3t} + \alpha_4 x_{2t}^2 + \alpha_5 x_{3t}^2 + \alpha_