Modelo autorregresivo de media móbil

Na Galipedia, a wikipedia en galego.

En estatística, modelos autorregresivos de media móbil (AutoRegressive Moving Average models, ARMA en inglés), as veces chamados modelos Box-Jenkins por George Box e F. M. Jenkins, son tipicamente aplicados a series temporais de datos.

Dada unha serie temporal de datos Xt, entón, o modelo ARMA é unha ferramenta para entender e, ó millor, predicir futuros valores da serie. O modelo está formado por duas partes, unha parte autoregresiva (AR) e outra de media móbil (MA). O modelo é normalmente referenciado como un modelo ARMA(p,q), onde p é a orde da parte autoregresiva, e q é a orde da parte de media móvil.

Índice

[editar] Modelo autorregresivo

A notación AR(p) refírese a un modelo autorregresivo de orde p. Un modelo AR(p) pode escribirse como

X_t = c + \sum_{i=1}^p \phi_i X_{t-i}+ \epsilon_t .\,

onde \phi_1, \ldots \phi_p son os parámetros do modelo, c é unha constante e εt é un termo de error. O termo constante é omitido por moitos autores por motivos de simplificación.

Un modelo autorregresivo é esencialmente un filtro IIR (infinite impulse response filter), cunha certa interpretación adicional.

Débese ter en conta que é necesario impor certas restriccións aos valores dos parámetros deste modelo para que funcione correctamente estacionario. Por exemplo, nun modelo AR(1), se |φ1| > 1 o modelo non terá un bo comportamento.

[editar] Exemplo: Un proceso AR(1)

An AR(1)-Process is given by

X_t = c + \phi X_{t-1}+\epsilon_t,\,

onde εt é un proceso de ruido blanco con media cero e varianza σ2. (Nota: O subíndice en φ1 foi omitido.) O proceso é de covariaza estacionaria se | φ | < 1. Se φ = 1 entón Xt ten unha raiz unitaria. O cálculo da esperanza de Xt é directo. Asumindo a covarianza estacionaria temos

\mbox{E}(X_t)=\mbox{E}(c)+\phi\mbox{E}(X_{t-1})+\mbox{E}(\epsilon_t)\Rightarrow \mu=c+\phi\mu+0.

entón:

\mu=\frac{c}{1-\phi},

onde μ é a media. A varianza é:

\textrm{var}(X_t)=E(X_t^2)-\mu^2=\frac{\sigma^2}{1-\phi^2}

A función de autocorrelación ven dada por:

B_n=E(X_{t+n}X_t)-\mu^2=\frac{\sigma^2}{1-\phi^2}\,\,\phi^{|n|}

Pódese ver que a función de autocorrelación decrece cun intervalo de decrecemento de τ = − 1 / ln(φ). A función de densidade espectral é a transformada de Fourier da función de autocorrelación. En termos discretos esta sería a transformada de Fourier de tempo discreto:

\Phi(\omega)= \frac{1}{\sqrt{2\pi}}\,\sum_{n=-\infty}^\infty B_n e^{-i\omega n} =\frac{1}{\sqrt{2\pi}}\,\left(\frac{\sigma^2}{1+\phi^2-2\phi\cos(\omega)}\right)

Esta expresión contén aliasing debido á naturaleza discreta de Xj. Se asumimos que o intervalo de muestreo é moito menor que o intervalo de decrecemento (\tau\ll 1), entón podemos utilizar unha aproximación continua a Bn:

B(t)\approx \frac{\sigma^2}{1-\phi^2}\,\,\phi^{|t|}

que da un perfil Lorentzian para a densidade espectral:

\Phi(\omega)= =\frac{1}{\sqrt{2\pi}}\,\frac{\sigma^2}{1-\phi^2}\,\frac{\gamma}{\pi(\gamma^2+\omega^2)}

onde γ = 1 / τ é a frecuencia angular asociada co intervalo de decrecemento τ.

Unha expresión alternativa para Xt pódese obter substituindo primeiro c + φXt − 2 + εt − 1 por Xt − 1 na ecuación de definición. Continuando este proceso N veces obtemos:

X_t=c\sum_{k=0}^{N-1}\phi^k+\phi^NX_{t-N}+\sum_{k=0}^{N-1}\phi^k\epsilon_{t-k}

Cando N tende a infinito, φN tende a cero e:

X_t=\frac{c}{1-\phi}+\sum_{k=0}^\infty\phi^k\epsilon_{t-k}

Vese que Xt é ruido branco convolucionado con φk máis a constante da media. Polo teorema do límite central, Xt será distribuido normalmente como calquera mostra de Xt que é máis grande que o intervalo de decrecemento da función de autocorrelación.

[editar] Modelo de medias móbiles

A notación MA(q) refírese a un modelo de media móbil de orde q.

X_t = \varepsilon_t + \sum_{i=1}^q \theta_i \varepsilon_{t-i}\,

onde θ1, ..., θq son os parametros do modelo e εt, εt-1,... son, de novo, os termos de error. Un modelo de medias móbiles é ensencialmente un filtro FIR (finite impulse response filter), con certa interpretación adicional.

[editar] Modelo autorregresivo de media móbil

A notación ARMA(p, q) refírese a un modelo con p termos autorregresivos e q termos de media móbil. Este modelo combina os modelos AR e MA,

X_t = \varepsilon_t +  \sum_{i=1}^p \phi_i X_{t-i} + \sum_{i=1}^q \theta_i \varepsilon_{t-i}.\,

[editar] Nota sobre os termos de error

Os termos de error εt asúmese normalmente que son variables iid (variables aleatorias independentes idénticamente-distribuidas) mostreadas dunha distribución normal con media cero: εt ~ N(0,σ2) onde σ2 é a varianza. Estas suposicións poden ser fráxiles e se non se cumplen ponden cambiar as propiedades do modelo. De feito, un cambio na suposición da independencia e distribución idéntica podería dar lugar a unha substancial diferencia.

[editar] Especificación en termos do operador retardo (lag operator)

Nalgúns textos os modelos son especificados en termos do operador retardo L. Nestes termos, o modelo AR(p) ven dado por

\varepsilon_t = \left(1 - \sum_{i=1}^p \phi_i L^i\right) X_t =  \phi X_t\,

onde φ representa o polinomio

\phi = 1 - \sum_{i=1}^p \phi_i L^i.\,

Un modelo MA(q) ven dado por

X_t = \left(1 + \sum_{i=1}^q \theta_i L^i\right) \varepsilon_t = \theta \varepsilon_t\,

onde θ representa o polinomio

\theta= 1 + \sum_{i=1}^q \theta_i L^i.\,

Por último, o modelo combinatorio ARMA ven dado por

\left(1 - \sum_{i=1}^p \phi_i L^i\right) X_t = \left(1 + \sum_{i=1}^q \theta_i L^i\right) \varepsilon_t\,

ou de xeito máis conciso,

\phi X_t = \theta \varepsilon_t.\,

[editar] Modelos de axuste (Fitting models)

Os modelos ARMA en xeral poden, tras escoller p e q, ser axustados mediante regresión de mínimos cadrados parar encontrar os valores dos parámetros que minimizan o termo de error. Considérase xeralmente unha boa práctica encontrar os valores menores de p e q que proporcionan un ajuste aceptable aos datos. Para un modelo puro AR débense utilizar as ecuacións Yule-Walker para proporcionar un axuste.

[editar] Xeralizacións

A dependencia de Xt en valores pasados e nos termos de error εt asúmese que é lineal salvo que se especifique o contrario. Se a dependencia non é lineal, o modelo é especificamente chamado modelo de media móbil non lineal (NMA), autorregresivo non lineal (NAR), ou autoregresivo de media móbil non lineal (NARMA).

Os modelos autorregresivos de media móbil poden xeralizarse doutros xeitos. Véxase tamén os modelos ARCH (modelos de heterocedasticidade condicional autorregresivos) e os modelos ARIMA (modelos autorregresivos integrados de medias móbiles). Se temos que axustar múltiples series temporales, entón pódese axustar un modelo vectorial ARIMA (VARIMA). Se as series temporales en cuestión mostran unha longa memoria, entón é apropiado un modelo ARIMA fraccional (FARIMA, ou ás veces chamado ARFIMA). De pensar que os datos teñen certa estacionalidade, entón débese usar un modelo SARIMA.

[editar] Referencias

  • George E.P. Box and F.M. Jenkins. Time Series Analysis: Forecasting and Control, second edition. Oakland, CA: Holden-Day, 1976.