Monday, 11 December 2017

Mover média covariância estacionária


4.2 Modelos estacionários lineares para séries temporais onde a variável aleatória é chamada de inovação porque representa a parte da variável observada que é imprevisível, dado os valores passados. O modelo geral (4.4) assume que é a saída de um filtro linear que transforma as inovações passadas, ou seja, é um processo linear. Este pressuposto de linearidade é baseado no teorema de decomposição de Wolds (Wold 1938) que diz que qualquer processo discreto de covariância estacionária pode ser expresso como a soma de dois processos não correlacionados, onde é puramente determinista e é um processo puramente indeterminista que pode ser escrito como linear Soma do processo de inovação: onde é uma seqüência de variáveis ​​aleatórias não correlacionadas em série com média zero e variância comum. A condição é necessária para a estacionararia. A formulação (4.4) é uma reparametrização finita da representação infinita (4.5) - (4.6) com constante. Geralmente, é escrito em termos do operador de lag definido por, que dá uma expressão mais curta: onde os polinômios do operador de atraso e são chamados de polinômio e polinômio, respectivamente. Para evitar a redundância de parâmetros, assumimos que não existem fatores comuns entre os componentes e os componentes. Em seguida, estudaremos o enredo de algumas séries temporais geradas por modelos estacionários com o objetivo de determinar os principais padrões de sua evolução temporal. A Figura 4.2 inclui duas séries geradas a partir dos seguintes processos estacionários computados por meio do gencher quantlet: Figura 4.2: séries temporais geradas por modelos Como esperado, ambas as séries temporais se movem em torno de um nível constante sem alterações de variação devido à propriedade estacionária. Além disso, esse nível é próximo ao meio teórico do processo, e a distância de cada ponto para esse valor é muito raramente fora dos limites. Além disso, a evolução da série mostra as saídas locais da média do processo, que é conhecido como o comportamento de reversão médio que caracteriza as séries temporais estacionárias. Vamos estudar com algum detalhe as propriedades dos diferentes processos, em particular, a função de autocovariância que captura as propriedades dinâmicas de um processo estocástico estacionário. Esta função depende das unidades de medida, de modo que a medida usual do grau de linearidade entre as variáveis ​​é o coeficiente de correlação. No caso de processos estacionários, o coeficiente de autocorrelação no lag, denotado por, é definido como a correlação entre e: Assim, a função de autocorrelação (ACF) é a função de autocovariância padronizada pela variância. As propriedades do ACF são: Dada a propriedade de simetria (4.10), o ACF geralmente é representado por meio de um gráfico de barras nos atrasos não negativos que se chama correlograma simples. Outra ferramenta útil para descrever a dinâmica de um processo estacionário é a função de autocorrelação parcial (PACF). O coeficiente de autocorrelação parcial em lag mede a associação linear entre e ajustado para os efeitos dos valores intermediários. Portanto, é apenas o coeficiente no modelo de regressão linear: as propriedades do PACF são equivalentes às da ACF (4.8) - (4.10) e é fácil provar isso (Box e Jenkins, 1976). Como o ACF, a função de autocorrelação parcial não depende das unidades de medida e é representada por meio de um gráfico de barras nos atrasos não negativos que se chama correlograma parcial. As propriedades dinâmicas de cada modelo estacionário determinam uma forma particular dos correlogramas. Além disso, pode-se mostrar que, para qualquer processo estacionário, ambas as funções, ACF e PACF, aproximam-se de zero à medida que o atraso tende para o infinito. Os modelos nem sempre são processos estacionários, pelo que é necessário primeiro determinar as condições de estacionaridade. Existem subclasses de modelos que possuem propriedades especiais para estudá-las separadamente. Assim, quando e, é um processo de ruído branco. Quando, é um processo de ordem média móvel puro. , E quando é um processo autoregressivo puro de ordem. . 4.2.1 Processo de ruído branco O modelo mais simples é um processo de ruído branco, onde é uma seqüência de variáveis ​​médias zero não correlacionadas com variação constante. É denotado por. Esse processo é estacionário se sua variância for finita, já que: verifica condições (4.1) - (4.3). Além disso, não está correlacionado ao longo do tempo, então a função de autocovariância é: a Figura 4.7 mostra duas séries temporais simuladas geradas a partir de processos com média e parâmetros zero e -0,7, respectivamente. O parâmetro autorregressivo mede a persistência de eventos passados ​​nos valores atuais. Por exemplo, se um choque positivo (ou negativo) afeta positivamente (ou negativamente) por um período de tempo maior, maior o valor de. Quando, a série se move mais grosseiramente em torno da média devido à alternância na direção do efeito de, isto é, um choque que afeta positivamente no momento, tem efeitos negativos sobre, positivos. O processo é sempre inversível e está parado quando o parâmetro do modelo é constrangido para ficar na região. Para provar a condição estacionária, primeiro escrevemos a forma média móvel por substituição recursiva de (4.14): Figura 4.8: correlogramas de população para processos, ou seja, é uma soma ponderada de inovações passadas. Os pesos dependem do valor do parâmetro: quando, (ou), a influência de uma determinada inovação aumenta (ou diminui) ao longo do tempo. Levando expectativas para (4.15) para calcular a média do processo, obtemos: Dado que, o resultado é uma soma de termos infinitos que converge para todo o valor somente se, nesse caso. Um problema semelhante aparece quando calculamos o segundo momento. A prova pode ser simplificada assumindo que, isto é,. Então, a variância é: novamente, a variância vai para o infinito, exceto para, nesse caso. É fácil verificar que tanto a média quanto a variância explodem quando essa condição não se mantém. A função de autocovariância de um processo estacionário é, portanto, a função de autocorrelação para o modelo estacionário é: ou seja, o correlograma mostra uma decomposição exponencial com valores positivos sempre se for positivo e com oscilações positivas negativas se for negativo (ver figura 4.8). Além disso, a taxa de decadência diminui à medida que aumenta, portanto, quanto maior o valor, maior será a correlação dinâmica no processo. Finalmente, há um corte na função de autocorrelação parcial no primeiro intervalo. Figura 4.9: correlogramas da população para os processos Pode-se mostrar que o processo geral (Box e Jenkins 1976): é estacionário somente se as raízes da equação característica do polinômio estiverem fora do círculo da unidade. A média de um modelo estacionário é. É sempre inversível para qualquer valor dos parâmetros. Sua ACF vai para zero de forma exponencial quando as raízes são reais ou com flutuações de onda de seno-cosseno quando elas são complexas. Seu PACF tem um corte no atraso, ou seja. Alguns exemplos de Os correlogramas para modelos mais complexos, como o, podem ser vistos na figura 4.9. Eles são muito semelhantes aos padrões quando os processos têm raízes reais, mas tomam uma forma muito diferente quando as raízes são complexas (veja o primeiro par de gráficos da figura 4.9). 4.2.4 Modelo de média móvel autoregressiva O modelo médio médio de ordens de ordem geral (ordem finita) de ordens, é: (1) Série de tempo estacionário: matriz de covariância de Toeplitz. 11 (1-1.2B.32B 2) raízes: 1.8, 1.4 Y t - 1.2 (Y t-1 -) -.20 (Y t-2 -) et (1-1.2B.2B2) (Y t -) Et (1-0.2B) (1-B) (1-0.2B) (Y t - Y t-1) et Unidade raiz, não estacionária, sem reversão média. Os testes de raiz unitária Studentized (não padronizados) se estendem a uma ordem superior. 15 proc arima dataAMERICAN i varvolume crosscor (WTC CRASH) noprint e entrada ((1) (1,2) WTC (1) (1,2) CRASH) gráfico p2 q1 f lead0 outout1 iddate onde 01jan01d t Lag Variable MU t Lag Variable MU 1895175.1 241956.3 7.83 16 Interpretação: X t Indicador WTC Similarmente para X t segundo indicador de colisão O termo de erro é ARMA (2,1) Verificações Residuais Verificação de Autocorrelação de Residuais para Ch-Pr Lag Square DF ChiSq Autocorrelações Lag Square DF ChiSq ---- ----- Autocorrelações -------------- 6 11.07 3 0.0114 -0.002 -0.008 0.016 0.060 0.059 -0.121 12 13.69 9 0.1336 0.032 -0.019 -0.042 -0.030 -0.034 -0.002 18 20.49 15 0,1541 -0,082 -0,017 0,005 0,013 -0,074 0,023 24 37,27 21 0,0157 0,116 0,088 -0,087 -0,036 0,045 0,011 30 43,28 27 0,0245 -0,046 -0,016 0,059 -0,041 0,061 0,008 36 51,68 33 0,0203 0,069 0,013 -0,042 0,085 0,032 0,029 42 55,44 39 0,0425 -0,045 0,020 0,066 -0,002 -0,011 -0,002 48 56,92 45 0,1096 0,020 -0,011 -0,009 0,002 -0,005 0,046 21 O Procedimento ARIMA condicional Least Squares Estimatio N Padrão Aprox. Parámetro Estimativa Erro t Valor Pr t Lag Variable MU Lag Quadrado DF ChiSq Autocorrelações t Lag Variable MU 126.01962 0,59155 2 t Lag Variable MU 126.01962 0.59155 213.03 Lag Square DF ChiSq ------------- Autocorrelações ------------- 6 4,81 5 0,4399 -0,040 0,043 -0,064 0,054 -0,197 -0,034 12 14,37 11 0,2134 0,056 -0,089 -0,090 0,215 -0,023 -0,1667 18 18,06 17 0,3850 -0,044 0,079 0,033 - 0,060 0,129-0,063 24 21,22 23 0,5679 -0,054 0,031 0,016 -0,123 -0,036 -0,075 t Lag Variable MU 126.01962 0,59155 2 títuloO procedimento ARIMA Estudo condicional de mínimos quadrados Padrão Aprox. Parâmetro Estimativa Erro t Valor Pr t Lag Variable MU 126.01962 0.59155 2 22 Usando NLIN Para estimar o ponto de início da rampa proc nlin dataall parms C1960 a126 b-.2 X (ano-C) (anoc) modelo quebra uma corrida bX NOTA: O critério de convergência se encontrou. Soma da Fonte Média Aproxida DF Quadrados Quadrado F Valor Pr F Modelo Erro Corrigido Aproximado Aproximado Aproximado 95 Confirmação Parâmetro Estimativa Std Limites de erro C a b c) ruptura do modelo uma corrida bX NOTA: c) quebra do modelo uma corrida bX NOTA: O critério de convergência se encontrou. Soma da Fonte Média Aproxida DF Quadrados Quadrado F Valor Pr F Modelo 2 403,5 201,7 6,35 0,0027 Erro 85 2702,1 31,7894 Corrigido Total 87 3105,6 Aprox Aproximado 95 Confiança Parâmetro Estimativa Std Limites de erro C 1967,6 10,7354 1946,2 1988,9 a 126,0 0,7895 124,4 127,6 b -0,1873 0,0868 - 0.3599 -0.0147 c) modelo break a bX run NOTA: title Usando NLIN para estimar o ponto de início da rampa proc nlin dataall parms C1960 a126 b-.2 X (ano-C) (yearc) modelo quebra uma corrida bX NOTA: R.13 Tempo Análise de sementes Uso apropriado de um modelo de tendência log-linear Uma tendência log-linear é usada para modelar uma série de tempo que exibe crescimento exponencial Se os erros parecem ser persistentes em uma regressão linear (ou seja, os resíduos permanecem acima ou abaixo da linha de tendência para Um longo período de tempo), o que pode sugerir que eles estão positivamente correlacionados em série. Nota: a suposição de regressão linear é que os erros residuais não devem ser correlacionados. Diferença entre os modelos de tendências lineares e logarítmicas. Interpretação do coeficiente de inclinação b. Um modelo de tendência linear prediz que y crescerá por um MONTANTE CONSTANTE (b) em cada período. por exemplo. Se b 0,1, y crescerá em 0,1 em cada período. Um modelo de tendência log-linear prediz que in y crescerá por uma quantidade constante (b) em cada período. Isso significa que o mesmo testemunhará uma TAXA DE CRESCIMENTO CONSTANTE de e-1 em cada período. por exemplo. Se b 0.1 então a taxa de crescimento prevista de y em cada período e-1 0.001005 ou 0.10005 modelos de séries temporais autoregressivas: Detecção de erros correlacionados em série em um modelo autoregressivo O teste baseado em AUTOCRRELAÇÕES DO TERMO DE ERRO pode ser usado para determinar se as séries temporais AR O modelo está correlacionado em série Se qualquer uma das autocorrelações de erro for significativamente diferente de 0, os erros estão correlacionados em série e o modelo não está especificado corretamente Se qualquer uma das autocorrelações de erro não for significativamente diferente de 0, os erros não estão correlacionados em série e o modelo É especificado corectly. Nota: um teste de Durbin-Watson não pode ser usado porque as variáveis ​​independentes incluem valores passados ​​da variável dependente Modelos de séries temporais autoregressivas: interpretando resultados de um teste de reversão médio 1 - se uma série de tempo estiver atualmente no seu nível de reversão média, o modelo Prevê que seu valor permanecerá INESPERADO no próximo período 2 - se uma série de tempo estiver atualmente ACIMA do seu nível de reversão média, o modelo prediz que seu valor será DIMINUIR no próximo período 3 - se uma série de tempo estiver atualmente ABAIXO sua média - Nível de reversão, o modelo prediz que seu valor AUMENTARá no próximo período. Modelos de séries temporais autoregressivos: quais séries temporais têm níveis finais de inversão média. Todas as séries temporais estacionárias de covariância possuem um nível de reversão de média finita. Nota: Uma série de tempo de autorregressão terá um nível de reversão de média finita se o valor absoluto do coeficiente de atraso, b, for inferior a 1. Modelos de séries de tempo autoregressivos: Regra de cadeia de previsão, defina Um processo de previsão no qual o próximo valor de período Como previsto bt, a equação de previsão é substituída no lado direito da equação para dar um valor previsto dois períodos à frente Nota: a regra da cadeia de previsão baseia-se em um modelo de séries temporais autorregressivas Modelos de séries temporais autoregressivos: erros de previsão na amostra , Definir erros de previsão na amostra são diferenças entre os valores reais da variável dependente e os valores previstos da variável dependente (com base na equação de regressão estimada) PARA DADOS DO PERÍODO DA AMOSTRA As previsões na amostra são os resíduos de um tempo ajustado Modelo de modelo autônomo Modelos de série de tempo autoregressivo: o desempenho de previsão fora de amostra de modelos autoregressivos é avaliado com base em. O desempenho de previsão fora de amostra dos modelos autorregressivos é avaliado com base em seu ROOT MEAN SQUARE ERROR (RMSE) para cada modelo em consideração é calculado com base em dados fora da amostra. O modelo com o mais baixo RMSE tem o menor padrão de erro E tem o modelo de série de tempo Autoregressivo do modelo mais poderoso PREDICTIVO: instabilidade dos coeficientes de regressão, períodos de amostra 1 - as estimativas de regressão de modelos de séries temporais baseadas em PERÍODOS DE AMOSTRA DIFERENTES podem ser bastante diferentes. As estimativas de 2-regressão obtidas a partir de modelos baseados em PERÍODOS DE AMOSTRA MAIS longos podem ser bastante Diferente das estimativas de modelos com base em períodos de amostra mais curtos Modelos de séries temporais autoregressivos: comprimento dos períodos de amostragem Não há regras claras que definam um comprimento ideal para o período da amostra. Os analistas procuram definir períodos de amostra como tempos durante os quais as condições econômicas subjacentes importantes permaneceram inalteradas. Os modelos só são válidos se a série temporal for COVARIANCE STATIONARY, p. Ex. Os dados de um período em que as taxas de câmbio foram corrigidas não devem ser combinados com os dados de um período em que flutuavam, pois a variação da taxa de câmbio seria a diferença nos dois regimes. Modelos de séries temporais autorregráveis: caminhada aleatória, defina uma caminhada aleatória, simples Caminhada aleatória ou caminhada aleatória sem uma deriva, é uma série temporal em que o valor da série em um período é igual ao seu valor no período anterior mais um erro aleatório imprevisível, onde o erro tem uma variância constante e não está correlacionado com seu valor em Períodos anteriores Primeiros modelos de diferenciação a alteração no valor da variável dependente em vez do valor da própria variável (xx - x-) Nota: porque o valor esperado do termo de erro, é 0, a melhor previsão de y é 0 . Isto implica que não haverá alteração no valor da série temporal atual x - Variável primeiro diferenciada, três características 1-covariância estacionária 2-com um nível finito de reversão média 3-com variância finita. Portanto, podemos usar a regressão linear para modelar a série de primeira série. Duas maneiras de determinar se uma série de tempo é covariante estacionária 1 - Examine as correlações automáticas da série temporal em vários atrasos gtgtPara uma série de tempo estacionária, as autocorrelações de séries temporais Os atrasos não diferem significativamente de 0, ou as autocorrelações caem abruptamente para 0, uma vez que o número de atrasos torna-se grande gtgtPara séries temporais não estacionárias, as autocorrelações de séries temporais não exibem nenhuma dessas características 2-Conduza o teste Dicky-Fuller para a unidade raiz ( Abordagem preferida) Uma série temporal tem uma raiz de unidade quando. A série temporária 1-A tem uma raiz de unidade quando o valor estimado do coeficiente de atraso é igual a 1. 2-é uma caminhada aleatória, que não é covariante estacionária AUTORRELAÇÕES DE SÉRIE DE TEMPO são usados ​​para. As autocorrelações de séries temporais podem ser usadas para determinar se um modelo de padrão automático ou móvel é mais apropriado para ajustar os dados de dados para os modelos AR, as autocorrelações de séries temporais começam grandes e, em seguida, recusam gradualmente gtgtgtPara modelos de MA, as primeiras autocorrelações da série de tempo q são significativamente Diferente de 0 e, de repente, cair para 0 além dessa Nota: a maioria das séries temporais são melhores modelos com modelos AR Teste para ARCH Se a0, a variância do termo de erro em cada período é simplesmente a. A variância é constante ao longo do tempo e não depende do erro no período anterior. Quando este é o caso, os coeficientes de regressão dos modelos da série temporal são corretos e o modelo pode ser usado para tomada de decisão. Se a é estatisticamente diferente de 0, o erro em um determinado período depende do tamanho do erro no anterior. período. Se a é maior (menos) do que 0, a variância aumenta (diminui) ao longo do tempo. Essa série de tempo é ARCH (1) e o modelo da série temporal não pode ser usado para a tomada de decisões. O erro no período t1 pode então ser previsto usando a seguinte fórmula: a a Se os erros ARCH forem encontrados para existir. Os QUADROS MENOS GERALIZADOS podem ser usados ​​para corrigir a heterocedasticidade. Como testar se a regressão linear pode ser usada para modelar duas séries temporais Se podemos usar regressão linear para modelar duas séries, depende de se a série possui uma unidade de raiz. O teste Dicky-Fuller é usado para fazer essa determinação Teste de cointegração, cinco etapas 1-Estimar a regressão (yb bx) 2-Teste se o termo de erro possui uma unidade de raiz usando o teste Dicky-Fuller, mas com os valores críticos de Engle-Granger 3-H: O termo de erro tem uma unidade de raiz vs H: O termo de erro não tem uma raiz da unidade 4 - Se não rejeitarmos o nulo, concluímos que o termo de erro na regressão possui uma unidade de raiz, não é covariante estacionária , As séries temporais não são cointegradas e a relação de regressão é espúria 5 - Se rejeitarmos o nulo, concluímos que o termo de erro não tem uma raiz unitária, é covariante estacionário, as séries temporais são cointegradas e os resultados da regressão linear CAN podem ser Usado para testar hipóteses sobre a relação entre as variáveis ​​Mais do que duas séries temporais: regressão linear pode ser usada gtgt Se uma série de tempo (variável dependente ou uma das variáveis ​​independentes) possui uma unidade de raiz e pelo menos uma série de tempo não, o erro Termo não pode ser cov Ariance estacionária, portanto, regressão linear não pode ser usada sempre que todas elas tenham raízes unitárias, as séries temporais devem ser teste para cointegração. Se não rejeitarmos o nulo (se o termo de erro tem uma raiz de unidade), concluímos que eles não estão cointegrados e a regressão linear não pode ser usada. Se rejeitar o nulo, concluímos que a série é cointegrada e a regressão linear pode ser usada. NOTA: a modelagem de três ou mais séries de tempo que são cointegradas é muito complexa. Etapas na previsão de séries temporais: PASSO 3 se você não encontrar uma sazonalidade significativa ou mudança na média ou variação. Uma tendência linear ou uma tendência exponencial pode ser suficiente. A - Determine se uma tendência linear ou exponencial parece mais sensível geralmente ao traçar a série. B-Estimar a tendência c-Calcular os resíduos d-Usar o teste Durbin-Watson para determinar se os resíduos têm correlação serial significativa. Se eles não o fizerem, o modelo de tendência seria suficiente para capturar a dinâmica da série temporal e você pode usar o modelo para a previsão de etapas na previsão de séries temporais: PASSO 4 se você encontrar correlação serial significativa nos resíduos Use um modelo mais agressivo, como Como modelo autoregressivo. Verifique primeiro que a série temporal é covariante estacionária Para corrigir as violações da estacionança: gtgtif as séries temporais têm uma tendência linear, a primeira diferença a série temporal série gtgtif tem uma tendência exponencial, pegue o log natural da série e primeiro a diferença Gtgtif a série de tempo muda significativamente durante o período da amostra, estimar diferentes modelos de séries temporais antes e depois do drift gtgtif, a série tem sazonalidade significativa, incluem um atraso sazonal Etapas na previsão de séries temporais: PASSO 5, decidindo qual modelo autorregressivo usar após a transformação de uma matéria-prima Série de tempo em uma série de tempo de covariância-estacionária 1-Estimar um modelo de AR (1) modelo 2 para ver se os resíduos do modelo possuem correlação serial significativa 3-se nenhuma correlação serial significativa você pode usar o modelo AR (1) para previsão

No comments:

Post a Comment