Tuesday, November 22, 2016

Proc Medio Arima Móvil


Proc Arima El análisis de los datos de series de tiempo en el dominio del tiempo se realiza con este procedimiento. Box-Jenkins (la adaptación de los modelos ARIMA a datos de series temporales) y también modelos de función de transferencia (tipo de entrada). El análisis del dominio de frecuencia de series de tiempo se puede hacer usando Proc Spectra. El marco para el análisis es que la serie de tiempo observada X (t) es estacionaria y satisface una ecuación ARMA de la forma donde Z (t) es un proceso de ruido blanco. Las constantes phi (1). Phi (p) se llaman coeficientes autorregresivos y el número p se denomina el orden del componente autorregresivo. Las constantes theta (1). Theta (q) se llaman coeficientes de media móvil y el número q se denomina orden del componente de media móvil. Es posible que p o q sean cero. El uso de proc arima para adaptarse a los modelos ARMA consta de 3 pasos. El primer paso es la identificación del modelo, en el que la serie observada se transforma para ser estacionaria. La única transformación disponible dentro de proc arima es la diferenciación. El segundo paso es la estimación del modelo, en la que se seleccionan los pedidos p y q y se calculan los parámetros correspondientes. El tercer paso es el pronóstico, en el que el modelo estimado se utiliza para pronosticar valores futuros de las series temporales observables. Como ejemplo, se analizará el fichero de datos milk. dat que contiene datos sobre la producción de leche de Cryer. Aquí están los comandos que se podrían utilizar para cada uno de los 3 pasos. OPCIONES PARA LA DECLARACIÓN DE IDENTIFICACIÓN: La instrucción var es obligatoria y especifica las variables en el conjunto de datos a analizar. Los números opcionales entre paréntesis especifican el GAL en el que se van a calcular las diferencias. Una declaración varmilk analizaría la serie de leche sin ninguna diferencia varmilk (1) analizaría la primera diferencia de varmilk de leche (1,1) la segunda diferencia de leche. La instrucción var produce 3 tramas para la variable especificada: la función de autocorrelación de la muestra, la función de autocorrelación inversa de la muestra y la función de autocorrelación parcial de la muestra. Estos gráficos y tablas de sus valores se imprimen en la ventana de salida. Se pueden producir parcelas de mayor calidad mediante el uso de otras opciones (detalladas a continuación) y proc gplot. La opción nlag hace que los 3 gráficos impriman valores hasta el retraso 30. Si no se especifica, el valor predeterminado es nlag24 o 25 del número de observaciones, lo que sea menor. La opción central resta el promedio de la serie especificada por la instrucción var. El promedio se agrega automáticamente en la etapa de pronóstico. La opción outcov coloca los valores de las funciones de correlación de muestras en un conjunto de datos SAS. Estos valores se pueden utilizar para producir parcelas de alta calidad de estas funciones utilizando proc gplot. Las variables de salida son: LAG. VAR (nombre de la variable especificada en la opción var), CROSSVAR (nombre de la variable especificada en la opción crosscorr), N (número de observaciones utilizadas para calcular el valor actual de la covarianza o crosscovariance), COV (valor de la cruz Covariancias), CORR (valor de la función de autocorrelación de la muestra), STDERR (error estándar de las autocorrelaciones), INVCORR (valores de la función de autocorrelación inversa de la muestra) y PARTCORR (valores de la función de autocorrelación parcial de la muestra). La opción noprint suprime la salida de los gráficos de baja calidad normalmente creados por la instrucción var. Esta opción se utiliza principalmente con la opción outcov. OPCIONES PARA LA DECLARACIÓN ESTIMADA: Las opciones p1 q3 especifican que las órdenes de auto-regresión y de orden móvil se ajusten. Otras formas de estas especificaciones son: q (3) para especificar que SOLAMENTE se permite que el parámetro theta (3) sea no cero p (12) (3) para un modelo estacional (1-phi (12) B12) - phi (3) B3) donde B es el operador de retroceso p (3,12) para un modelo en el que sólo se permite que phi (3) y phi (12) no sean cero. La opción nodf utiliza el tamaño de la muestra en lugar de los grados de libertad como divisor al estimar la varianza del ruido blanco. La opción método selecciona el método de estimación para los parámetros. Las opciones son ml para la máxima estimación de probabilidad (Gaussiana), ul para mínimos cuadrados incondicionales y cl para los mínimos cuadrados condicionales. La opción de trazado produce los mismos 3 trazos que en la declaración de identificación para los RESIDUOS después de estimar los parámetros del modelo. Esta es otra comprobación útil sobre la blancura de los residuos. OPCIONES PARA LA DECLARACIÓN PREVISTA: La opción principal especifica el número de intervalos de tiempo en el futuro para los que se van a realizar las previsiones. Mediante el uso de las opciones out e printall en la sentencia de pronóstico, se creará un conjunto de datos SAS que contendrá los valores de la serie original y los valores previstos de la serie utilizando el modelo en todo momento. Esto puede ser útil para un análisis del rendimiento pasado del modelo. En la práctica, varias sentencias de estimación diferentes se intentan secuencialmente para ver qué modelo se adapta mejor a los datos. Proc arima es interactivo, en el sentido de que estos intentos secuenciales pueden realizarse sin reiniciar el procedimiento. Simplemente envíe las declaraciones de estimación sucesivas, la declaración de identificación original será retenida. Los modelos de función de transferencia pueden ajustarse utilizando la opción crosscorr de la sentencia de identificación y la opción de entrada de la instrucción de estimación. La mecánica de este procedimiento se ilustra para un conjunto de datos falso que contiene dos series de tiempo que están relacionados por un modelo de función de transferencia. En este caso, Y depende de X. En primer lugar, el proceso X se modela utilizando las sentencias de identificación y estimación. Entonces se identifica Y y se estima la correlación cruzada entre los procesos pre-blanqueados X e Y. El programa podría ser así. A partir de la información de correlación cruzada, se pueden identificar tentativamente los retardos a los que el proceso de entrada X influye en Y. Obsérvese que sólo los modelos causales se les permite correlaciones cruzadas no-cero en desfases negativos no puede ser modelado en proc arima. Por ejemplo, digamos que los retornos no nulos son 2 y 4. El proceso Y puede estimarse como sigue. La entrada es de la forma cB2 dB4 B2 (c dB2). Es esta última forma la que da la forma de la declaración de entrada. Tenga en cuenta que la instrucción de estimación siempre se refiere a la declaración de identificación más reciente para decidir qué variables se van a incluir en el modelo. De este modo, la diferenciación y el centrado se manejan automáticamente (si se utilizan), EXCEPTO que la diferenciación debe especificarse explícitamente en la instrucción crosscorr. Para obtener más información, consulte la ayuda en línea de SAS SYSTEM HELP - MODELING amp ANALYSIS TOOLS - ECONOMETRICS amp TIME SERIES - ARIMA o la Guía SAS / ETS. Copia Copyright 1997 por Jerry Alan Veeh. Todos los derechos reservados. Modelos ARIMA de mínimos cuadrados lineales versus no lineales que incluyen sólo términos AR son casos especiales de modelos de regresión lineal, por lo que pueden ser ajustados por mínimos cuadrados ordinarios. Los pronósticos AR son una función lineal de los coeficientes, así como una función lineal de datos pasados. En principio, las estimaciones por mínimos cuadrados de los coeficientes de AR pueden calcularse exactamente a partir de autocorrelaciones en una sola quotiteración. En la práctica, se puede ajustar un modelo AR en el procedimiento de regresión múltiple - sólo regresar DIFF (Y) (o lo que sea) en los rezagos de sí mismo. Los modelos ARIMA que incluyen términos MA son similares a los modelos de regresión, pero no pueden ser ajustados por mínimos cuadrados ordinarios: Los pronósticos son una función lineal de datos pasados, pero son Funciones no lineales de los coeficientes - por ejemplo, Un modelo ARIMA (0,1,1) sin constante es una media móvil exponencialmente ponderada: en la que los pronósticos son una función no lineal del parámetro MA (1) (quotthetaquot). Otra forma de ver el problema: no se puede ajustar a los modelos de MA usando la regresión múltiple ordinaria porque no hay manera de especificar ERRORES como una variable independiente - los errores no se conocen hasta que el modelo se instala Deben calcularse secuencialmente. Periodo por período, dados los estimados de parámetros actuales. Por lo tanto, los modelos de MA requieren un algoritmo de estimación no lineal, similar al algoritmo quotSolverquot en Excel. El algoritmo utiliza un proceso de búsqueda que normalmente requiere de 5 a 10 iteraciones y ocasionalmente puede no converger. Puede ajustar las tolerancias para determinar los tamaños de paso y los criterios de detención para la búsqueda (aunque los valores por defecto normalmente son correctos). QuotMeanquot versus quotconstantquot El quotmeanquot y el quotconstantquot en los resultados de ajuste de modelo ARIMA son números diferentes siempre que el modelo incluye términos AR. Supongamos que se ajusta un modelo ARIMA a Y en el que p es el número de términos autorregresivos. (Supongamos por conveniencia que no hay términos MA). Sea y la versión diferenciada (estacionalizada) de Y, p. Y t Y t - Y t-1 si se utilizó una diferencia no estacional. Entonces la ecuación de predicción AR (p) para y es: Este es sólo un modelo de regresión múltiple ordinario en el que 956 es el término constante, 981 1 es el coeficiente del primer retraso de y. y así. Ahora, internamente, el software convierte esta forma de intersección de pendiente de la ecuación de regresión a una forma equivalente en términos de desviaciones de la media. Sea m la media de la serie estacionalizada y. Entonces la ecuación autorregresiva de orden p se puede escribir en términos de desviaciones de la media como: Recopilando todos los términos constantes en esta ecuación, vemos que es equivalente a la forma original de la ecuación si: CONSTANTE MEDIANO x (1 - suma De los coeficientes AR) El software calcula realmente m (junto con los otros parámetros del modelo) e informa de esto como el MEAN en los resultados del ajuste del modelo, junto con su error estándar y el estadístico t, etc. Se calcula entonces el CONSTANTE (956) De acuerdo con la fórmula anterior. Si el modelo no contiene ningún término AR, el MEAN y el CONSTANT son idénticos. En un modelo con un orden de diferenciación no estacional (sólo), el MEAN es el factor de tendencia (período medio a cambio de período). En un modelo con un orden de diferenciación estacional (sólo), el MEAN es el factor de tendencia anual (cambio medio año a año). El problema básico: un modelo ARIMA (u otro modelo de series temporales) predice los valores futuros de las series temporales a partir de valores pasados, pero cómo debería inicializarse la ecuación de pronóstico para hacer una predicción para la primera observación? Inicializado por la caída de las primeras observaciones - aunque esto es ineficiente y los datos de residuos -, pero los modelos de MA requieren una estimación de un error anterior antes de que puedan hacer el primer pronóstico.) Extraño, pero cierto. Por lo tanto, una serie temporal estacionaria se ve igual en adelante o hacia atrás en el tiempo. El mismo modelo que predice el futuro de una serie también puede usarse para predecir su pasado. La solución: para extraer la mayor cantidad de información de los datos disponibles, la mejor manera de inicializar un modelo ARIMA (o cualquier modelo de predicción de series temporales) es utilizar la previsión hacia atrás (quotbackforecastingquot) para obtener estimaciones de los valores de datos antes del período 1. Cuando Usted utiliza la opción backforecasting en la estimación de ARIMA, el algoritmo de búsqueda en realidad hace dos pases a través de los datos en cada iteración: primero se hace un pase hacia atrás para estimar los valores de datos anteriores usando las estimaciones de parámetros actuales, La ecuación de pronóstico para un paso hacia adelante a través de los datos. Si NO UTILIZA la opción backforecasting, la ecuación de predicción se inicializará asumiendo que los valores anteriores de la serie estacionalizada fueron iguales a la media. Si utiliza la opción backforecasting, los pronósticos que se utilizan para inicializar el modelo son parámetros implícitos del modelo, que deben estimarse junto con los coeficientes AR y MA. El número de parámetros implícitos adicionales es aproximadamente igual al retardo más alto del modelo, usualmente 2 o 3 para un modelo no estacional y s1 o 2s1 para un modelo estacional con estacionalidad. (Si el modelo incluye tanto una diferencia estacional como un término estacional AR o MA, necesita dos temporadas de valores previos para poner en marcha). Obsérvese que con la opción backforecasting, un modelo AR se estima de una manera diferente a la que se estimaría En el procedimiento de Regresión Múltiple (los valores perdidos no son meramente ignorados - son reemplazados con una estimación de la media o con pronósticos), por lo tanto, un modelo AR ajustado en el procedimiento ARIMA nunca producirá exactamente los mismos parámetros estimados que un modelo AR Ajustado en el procedimiento de regresión múltiple. Sabiduría convencional: DESACTIVAR la retroprovisionamiento cuando no está seguro de si el modelo actual es válido, enciéndalo para obtener estimaciones de parámetros finales una vez que esté razonablemente seguro de que el modelo es válido. Si el modelo se especifica incorrectamente, el backforecasting puede conducir a fallos de las estimaciones de parámetros para converger y / oa problemas de raíz unitaria. Procedimiento ARIMA El procedimiento ARIMA proporciona la identificación, la estimación de parámetros y la predicción de la media móvil integrada autorregresiva - Jenkins), modelos estacionales ARIMA, modelos de función de transferencia y modelos de intervención. El procedimiento ARIMA ofrece un modelado completo de ARIMA (Box-Jenkins) sin límites en el orden de los procesos de media móvil o autorregresiva. La estimación se puede hacer por la máxima verosimilitud exacta, por mínimos cuadrados condicionales o por mínimos cuadrados incondicionales. Además puede modelar modelos de intervención, modelos de regresión con errores ARMA, modelos de función de transferencia con funciones de transferencia racional totalmente generales y modelos ARIMA estacionales. Los diagnósticos de identificación del modelo de ARIMA39 incluyen tramas de autocorrelación, autocorrelación parcial, autocorrelación inversa y funciones de correlación cruzada. PROC ARIMA también permite la identificación del orden de media móvil autorregresiva tentativa (ARMA) basada en la correlación canónica más pequeña, la función de autocorrelación de muestra extendida o el análisis de criterio de información. Se permite la interpolación basada en el modelo ARIMA de valores faltantes. La predicción está ligada a métodos de estimación de parámetros. Las predicciones de la memoria finita se utilizan para modelos estimados por máxima verosimilitud o mínimos cuadrados no lineales exactos, mientras que se utilizan predicciones de memoria infinita para modelos estimados por mínimos cuadrados condicionales. El procedimiento ARIMA ofrece una variedad de modelos de estadística de diagnóstico, incluyendo el criterio de Akaike39s (SIC o BIC) de Schwarz39s Criterio Bayesiano (SBC o BIC) Estadísticas de prueba de chi cuadrado de Ljung-Box para pruebas de estacionariedad de ruido blanco, incluyendo Dickey-Fuller aumentado Phillips-Perron y pruebas aleatorias con prueba de deriva La macro DFTEST realiza pruebas Dickey-Fuller para raíces unitarias simples o raíces unitarias estacionales en una serie de tiempo. La macro DFTEST es útil para probar la estacionariedad y determinar el orden de diferenciación necesario para el modelo ARIMA de una serie temporal. Documentación Para más detalles, consulte la Guía del usuario de SAS / ETS reg. PDF HTML Ejemplos

No comments:

Post a Comment