Padrão de movimento média sazonal no Brasil


Modelos ARIMA sazonais gerais: (0,1,1) x (0,1,1) etc. Esboço da modelagem ARIMA sazonal: A parte sazonal de um modelo ARIMA tem a mesma estrutura que a parte não sazonal: pode ter uma AR, um fator MA, ou uma ordem de diferenciação. Na parte sazonal do modelo, todos esses fatores operam em múltiplos de lag s (o número de períodos em uma estação). Um modelo ARIMA sazonal é classificado como um modelo ARIMA (p, d, q) x (P, D, Q), onde Pnúmero de termos sazonais autorregressivos (SAR), Dnúmero de diferenças sazonais, Na identificação de um modelo sazonal, o primeiro passo é determinar se é necessária ou não uma diferença sazonal, além ou talvez em vez de uma diferença não sazonal. Você deve olhar as parcelas de séries temporais e as parcelas ACF e PACF para todas as combinações possíveis de 0 ou 1 diferença não-sazonal e 0 ou 1 diferença sazonal. Cuidado: nunca use mais de uma diferença sazonal, nem mais do que duas diferenças totais (sazonal e não sazonal combinado). Se o padrão sazonal é forte e estável ao longo do tempo (por exemplo, alto no verão e baixa no inverno, ou vice-versa), então você provavelmente deve usar uma diferença sazonal, independentemente de usar uma diferença não sazonal, uma vez que isso vai Evitar o padrão sazonal de quotdying outquot nas previsões de longo prazo. Regra 12: Se a série tem um padrão sazonal forte e consistente, então você deve usar uma ordem de diferenciação sazonal - mas nunca use mais de uma ordem de diferenciação sazonal ou mais de 2 Ordens de diferenças totais (sazonais). A assinatura do SAR puro ou do comportamento SMA puro é semelhante à assinatura do AR puro ou do comportamento MA puro, exceto que o padrão aparece em múltiplos de lag s no ACF e no PACF. Por exemplo, um processo SAR puro (1) tem picos no ACF em defasagens s, 2s, 3s, etc. enquanto o PACF corta após o atraso s. Por outro lado, um processo puro de SMA (1) tem picos no PACF em defasagens s, 2s, 3s, etc. enquanto o ACF corta após o atraso s. Uma assinatura SAR geralmente ocorre quando a autocorrelação no período sazonal é positiva, ao passo que uma assinatura SMA geralmente ocorre quando a autocorrelação sazonal é negativa. Portanto: Regra 13: Se a autocorrelação no período sazonal é positiva. Considere a adição de um termo SAR ao modelo. Se a autocorrelação no período sazonal é negativa. Considere a adição de um termo SMA para o modelo. Tente evitar misturar os termos SAR e SMA no mesmo modelo e evite usar mais de um dos dois tipos. Geralmente, um termo SAR (1) ou SMA (1) é suficiente. Você raramente encontrará um processo SAR genuíno (2) ou SMA (2) e ainda mais raramente terá dados suficientes para estimar 2 ou mais coeficientes sazonais sem que o algoritmo de estimação entre em um loop quotfeedback. Embora um modelo ARIMA sazonal pareça ter Apenas alguns parâmetros, lembre-se que backforecasting requer a estimativa de uma ou duas estações vale de parâmetros implícitos para inicializá-lo. Portanto, você deve ter pelo menos 4 ou 5 temporadas de dados para caber um modelo ARIMA sazonal. Provavelmente, o modelo ARIMA sazonal mais comumente usado é o modelo (0,1,1) x (0,1,1) - isto é. Um modelo MA (1) xSMA (1) com uma diferença sazonal e não sazonal. Este é essencialmente um modelo de suavização exponencial quotseasonal. Quando os modelos ARIMA sazonais são montados em dados registrados, eles são capazes de rastrear um padrão sazonal multiplicativo. Exemplo: série AUTOSALE revisitada Lembre-se de que anteriormente previamos a série de vendas de varejo de automóveis usando uma combinação de deflação, ajuste sazonal e suavização exponencial. Vamos agora tentar montar a mesma série com modelos ARIMA sazonais, usando a mesma amostra de dados de janeiro de 1970 a maio de 1993 (281 observações). Como antes vamos trabalhar com vendas deflated auto - i. e. Vamos usar a série AUTOSALECPI como a variável de entrada. Aqui estão o diagrama de séries temporais e os gráficos ACF e PACF da série original, que são obtidos no procedimento de Previsão, traçando os quotresiduais de um modelo ARIMA (0,0,0) x (0,0,0) com constante: Quotsuspension bridgequot padrão no ACF é típico de uma série que é tanto nonstationary e fortemente sazonal. É claro que precisamos de pelo menos uma ordem de diferenciação. Se considerarmos uma diferença não sazonal, as parcelas correspondentes são as seguintes: A série diferenciada (os resíduos de um modelo de caminhada aleatória com crescimento) parece mais ou menos estacionária, mas ainda há autocorrelação muito forte no período sazonal (Intervalo 12). Como o padrão sazonal é forte e estável, sabemos (a partir da Regra 12) que queremos usar uma ordem de diferenciação sazonal no modelo. Aqui está a aparência da imagem após uma diferença sazonal (apenas): A série sazonalmente diferenciada mostra um padrão muito forte de autocorrelação positiva, como podemos lembrar de nossa tentativa anterior de encaixar um modelo de caminhada aleatória sazonal. Isso poderia ser uma assinatura quotAR - ou poderia sinalizar a necessidade de outra diferença. Se considerarmos uma diferença sazonal e não sazonal, obtêm-se os seguintes resultados: Estes são, naturalmente, os resíduos do modelo de tendência aleatória sazonal que foram ajustados aos dados de vendas de automóveis anteriormente. Agora vemos os sinais indicadores de overdifferencing suave. Os picos positivos no ACF e no PACF tornaram-se negativos. Qual é a ordem correta de diferenciação? Uma outra peça de informação que pode ser útil é um cálculo das estatísticas de erro da série em cada nível de diferenciação. Podemos calculá-los ajustando os correspondentes modelos ARIMA em que apenas é utilizada a diferenciação: Os menores erros, tanto no período de estimação quanto no período de validação, são obtidos pelo modelo A, que utiliza uma diferença de cada tipo. Isto, juntamente com o aparecimento das parcelas acima, sugere fortemente que devemos usar uma diferença sazonal e não sazonais. Observe que, exceto para o termo constante gratuíto, o modelo A é o modelo de tendência aleatória sazonal (SRT), enquanto que o modelo B é apenas o modelo de caminhada aleatória sazonal (SRW). Como observamos anteriormente ao comparar esses modelos, o modelo SRT parece se encaixar melhor do que o modelo SRW. Na análise que se segue, vamos tentar melhorar esses modelos através da adição de termos sazonais ARIMA. Voltar ao topo da página. O modelo ARIMA (0,1,1) x (0,1,1) frequentemente usado: modelo SRT mais MA (1) e SMA (1) termos Retornando ao último conjunto de gráficos acima, observe que com uma diferença de Cada tipo existe um pico negativo no ACF no retardo 1 e também um pico negativo no ACF no retardo 12. Enquanto que o PACF mostra um padrão mais gradual na vizinhança de ambos os intervalos. Aplicando nossas regras para identificar modelos ARIMA (especificamente, Regra 7 e Regra 13), podemos agora concluir que o modelo SRT seria melhorado pela adição de um termo MA (1) e também um termo SMA (1). Além disso, pela Regra 5, excluímos a constante, uma vez que estão envolvidas duas ordens de diferenciação. Se fizermos tudo isso, obtemos o modelo ARIMA (0,1,1) x (0,1,1). Que é o modelo ARIMA sazonal mais utilizado. Sua equação de previsão é: onde 952 1 é o coeficiente MA (1) e 920 1 (capital theta-1) é o coeficiente SMA (1). Observe que este é apenas o modelo de tendência aleatória sazonal adotado pela adição de múltiplos dos erros nos intervalos 1, 12 e 13. Além disso, note que o coeficiente do erro lag-13 é o produto do MA (1) e SMA (1). Este modelo é conceitualmente similar ao modelo de Winters, na medida em que aplica efetivamente o alisamento exponencial ao nível, tendência e sazonalidade de uma só vez, embora se baseie em bases teóricas mais sólidas, particularmente no que se refere ao cálculo de intervalos de confiança para previsões de longo prazo. As suas parcelas residuais neste caso são as seguintes: Embora uma pequena quantidade de autocorrelação permaneça no retardo 12, o aspecto geral das parcelas é bom. Os resultados de ajuste do modelo mostram que os coeficientes MA (1) e SMA (1) estimados (obtidos após 7 iterações) são realmente significativos: As previsões do modelo se assemelham às do modelo de tendência aleatória sazonal - isto é. Eles pegar o padrão sazonal ea tendência local no final da série -, mas eles são ligeiramente mais suave na aparência, uma vez que tanto o padrão sazonal ea tendência estão sendo efetivamente média (em um tipo de suavização exponencial) durante o último Algumas estações: O que esse modelo realmente está fazendo Você pode pensar nisso da seguinte maneira. Primeiro calcula a diferença entre o valor de cada mês e uma média histórica ponderada exponencial 8222 para aquele mês que é calculado aplicando a suavização exponencial a valores que foram observados no mesmo mês em anos anteriores, onde a quantidade de suavização é determinada pela SMA (1 ). Em seguida, aplica a suavização exponencial simples a essas diferenças para prever o desvio da média histórica que será observada no próximo mês. O valor do coeficiente SMA (1) próximo de 1,0 sugere que muitas estações de dados estão sendo usadas para calcular a média histórica para um dado mês do ano. Lembre-se que um coeficiente de MA (1) em um modelo ARIMA (0,1,1) corresponde a 1-menos-alfa no modelo de suavização exponencial correspondente e que a idade média dos dados em um modelo de suavização exponencial é 1alpha. O coeficiente SMA (1) tem uma interpretação similar em relação às médias entre estações. Aqui seu valor de 0,91 sugere que a idade média dos dados utilizados para estimar o padrão sazonal histórico é um pouco mais de 10 anos (quase metade do comprimento do conjunto de dados), o que significa que um padrão sazonal quase constante está sendo assumido. O valor muito menor de 0,5 para o coeficiente MA (1) sugere que relativamente pouco alisamento está sendo feito para estimar o desvio atual da média histórica para o mesmo mês, de modo próximo mês 8217s predito desvio de sua média histórica será perto dos desvios Da média histórica observada nos últimos meses. Modelo ARIMA (1,0,0) x (0,1,0) com constante: modelo SRW mais AR (1) termo O modelo anterior foi um modelo de tendência aleatória sazonal (SRT) ajustado pela adição de MA 1) e SMA (1). Um modelo ARIMA alternativo para esta série pode ser obtido substituindo um termo AR (1) pela diferença não sazonal - isto é. Adicionando um termo AR (1) ao modelo Random Walk (SRW) sazonal. Isso nos permitirá preservar o padrão sazonal no modelo, ao mesmo tempo em que reduzimos a quantidade total de diferenciação, aumentando assim a estabilidade das projeções de tendência, se desejado. (Lembre-se que com uma única diferença sazonal, a série mostrou uma forte assinatura AR (1).) Se fizermos isso, obtemos um modelo ARIMA (1,0,0) x (0,1,0) com constante, Que produz os seguintes resultados: O coeficiente AR (1) é de fato altamente significativo eo RMSE é apenas 2,06, comparado a 3,00 para o modelo SRW (Modelo B no relatório de comparação acima). A equação de previsão para este modelo é: O termo adicional no lado direito é um múltiplo da diferença sazonal observada no último mês, o que tem o efeito de corrigir a previsão para o efeito de um ano excepcionalmente bom ou ruim. Aqui 981 1 denota o coeficiente AR (1), cujo valor estimado é 0,73. Assim, por exemplo, se as vendas no mês passado fossem X dólares à frente das vendas um ano antes, então a quantidade 0.73X seria adicionada à previsão para este mês. 956 denota o CONSTANTE na equação de previsão, cujo valor estimado é 0,20. A MEAN estimada, cujo valor é 0,75, é o valor médio das séries sazonalmente diferenciadas, que é a tendência anual nas previsões de longo prazo deste modelo. A constante é (por definição) igual à média vezes 1 menos o coeficiente AR (1): 0,2 0,75 (1 8211 0,73). O gráfico de previsão mostra que o modelo realmente faz um trabalho melhor do que o modelo SRW de acompanhamento de mudanças cíclicas (isto é, anormalmente bons ou maus anos): No entanto, o MSE para este modelo ainda é significativamente maior do que o obtido para o ARIMA (0, 1,1) x (0,1,1). Se olharmos para as parcelas de resíduos, veremos espaço para melhorias. Os resíduos mostram ainda algum sinal de variação cíclica: O ACF e o PACF sugerem a necessidade de ambos os coeficientes MA (1) e SMA (1): Uma versão melhorada: ARIMA (1,0,1) x (0,1,1) Com constante Se adicionarmos os termos MA (1) e SMA (1) indicados ao modelo precedente, obtemos um modelo ARIMA (1,0,1) x (0,1,1) com constante, cuja equação de previsão é This É quase o mesmo que o modelo ARIMA (0,1,1) x (0,1,1), exceto que substitui a diferença não sazonal por um termo AR (1) (uma diferença quotpartial) e incorpora um termo constante representando a Tendência de longo prazo. Assim, este modelo assume uma tendência mais estável do que o modelo ARIMA (0,1,1) x (0,1,1), e essa é a principal diferença entre eles. Os resultados de ajuste do modelo são os seguintes: Observe que o coeficiente estimado de AR (1) (981 1 na equação do modelo) é 0,96, o que é muito próximo de 1,0, mas não tão próximo como para sugerir que ele deve ser absolutamente substituído Uma primeira diferença: seu erro padrão é 0,02, então é cerca de 2 erros padrão de 1,0. As outras estatísticas do modelo (os coeficientes estimados de MA (1) e SMA (1) e as estatísticas de erro nos períodos de estimação e de validação) são quase idênticas às do ARIMA (0,1,1) x (0,1 , 1) modelo. (Os coeficientes estimados de MA (1) e SMA (1) são 0,45 e 0,91 neste modelo versus 0,48 e 0,91 no outro.) A MEAN estimada de 0,68 é a tendência de longo prazo prevista (aumento anual médio). Este é essencialmente o mesmo valor que foi obtido no modelo (1,0,0) x (0,1,0) com constante. O erro padrão da média estimada é 0,26, portanto a diferença entre 0,75 e 0,68 não é significativa. Se a constante não fosse incluída neste modelo, seria um modelo de tendência atenuada: a tendência em suas previsões de muito longo prazo iria gradualmente se esvaindo. As previsões pontuais deste modelo parecem bastante semelhantes às do modelo (0,1,1) x (0,1,1), porque a tendência média é semelhante à tendência local no final da série. No entanto, os intervalos de confiança para este modelo aumentam um pouco menos rapidamente devido ao seu pressuposto de que a tendência é estável. Observe que os limites de confiança para as previsões de dois anos de antecedência agora permanecem dentro das linhas de grade horizontal em 24 e 44, enquanto que os do modelo (0,1,1) x (0,1,1) não: ARIMA sazonal Versus alisamento exponencial e ajuste sazonal: Agora vamos comparar o desempenho dos dois melhores modelos ARIMA contra modelos de suavização exponencial simples e linear acompanhados de ajuste sazonal multiplicativo, eo modelo de Winters, como mostrado nos slides sobre a previsão com ajuste sazonal: As estatísticas de erro para As previsões de um período antecipado para todos os modelos estão extremamente próximas neste caso. É difícil escolher um 8220winner8221 com base nesses números sozinho. Voltar ao topo da página. Quais são os tradeoffs entre os vários modelos sazonais Os três modelos que usam o ajuste sazonal multiplicativo lidar com a sazonalidade de uma forma explícita - ou seja. Os índices sazonais são explodidos como uma parte explícita do modelo. Os modelos ARIMA lidar com a sazonalidade de forma mais implícita - não podemos ver facilmente na saída ARIMA como a média de dezembro, digamos, difere da média de julho. Dependendo se é considerado importante isolar o padrão sazonal, isso pode ser um fator na escolha entre os modelos. Os modelos ARIMA têm a vantagem de que, uma vez inicializados, eles têm menos peças quotmoving do que os modelos exponenciais de suavização e ajuste e, como tal, eles podem ser menos propensos a sobrecarregar os dados. Os modelos ARIMA também têm uma teoria subjacente mais sólida no que se refere ao cálculo de intervalos de confiança para previsões de horizonte mais longo do que os outros modelos. Há diferenças mais dramáticas entre os modelos com relação ao comportamento de suas previsões e intervalos de confiança para as previsões de mais de um período no futuro. Este é o lugar onde as suposições que são feitas com relação às mudanças na tendência e padrão sazonal são muito importantes. Entre os dois modelos ARIMA, um (modelo A) estima uma tendência variável no tempo, enquanto o outro (modelo B) incorpora uma tendência média de longo prazo. (Poderíamos, se desejássemos, nivelar a tendência de longo prazo no modelo B, suprimindo o termo constante.) Entre os modelos de suavização-mais-ajuste exponencial, um (modelo C) assume uma tendência plana, enquanto o outro Modelo D) assume uma tendência variável no tempo. O modelo Winters (E) também assume uma tendência variável no tempo. Modelos que assumem uma tendência constante são relativamente mais confiantes em suas previsões de longo prazo do que modelos que não, e isso geralmente será refletido na medida em que os intervalos de confiança para as previsões se tornam mais amplos em horizontes de previsão mais longos. Modelos que não assumem tendências que variam no tempo geralmente têm intervalos de confiança mais estreitos para previsões de horizonte mais longo, mas mais estreito não é melhor a menos que esta suposição esteja correta. Os dois modelos de suavização exponencial combinados com o ajuste sazonal pressupõem que o padrão sazonal permaneceu constante ao longo dos 23 anos na amostra de dados, enquanto os outros três não. Na medida em que o padrão sazonal é responsável pela maior parte da variação mensal nos dados, é importante fazer o correto para prever o que acontecerá vários meses no futuro. Se se acredita que o padrão sazonal mudou lentamente ao longo do tempo, outra abordagem seria usar apenas um histórico de dados mais curto para ajustar os modelos que estimam índices sazonais fixos. Para o registro, aqui estão as previsões e 95 limites de confiança para maio de 1995 (24 meses adiante) que são produzidos pelos cinco modelos: As previsões de ponto são realmente surpreendentemente próximas umas das outras, em relação às larguras de todos os intervalos de confiança. A previsão do ponto de SES é a mais baixa, porque é o único modelo que não supor uma tendência ascendente no fim da série. O modelo ARIMA (1,0,1) x (0,1,1) c tem os limites de confiança mais estreitos, pois assume menor variação de tempo nos parâmetros do que os outros modelos. Além disso, sua previsão pontual é ligeiramente maior do que a dos outros modelos, pois está extrapolando uma tendência de longo prazo ao invés de uma tendência de curto prazo (ou tendência zero). O modelo de Winters é o menos estável dos modelos e sua previsão tem, portanto, os limites de confiança mais amplos, como era aparente nos gráficos de previsão detalhados para os modelos. E as previsões e limites de confiança do modelo ARIMA (0,1,1) x (0,1,1) e os do modelo de ajuste LESseasonal são praticamente idênticos Logar ou não logar Algo que ainda não fizemos, mas Pode ter, é incluir uma transformação log como parte do modelo. Os modelos ARIMA sazonais são modelos inerentemente aditivos, portanto, se quisermos capturar um padrão sazonal multiplicativo. Devemos fazer isso registrando os dados antes de montar o modelo ARIMA. Neste caso, a transformação de deflação parece ter feito um trabalho satisfatório de estabilização das amplitudes dos ciclos sazonais, por isso não há Parecem ser uma razão convincente para adicionar uma transformação log em termos de tendências de longo prazo. Se os resíduos mostraram um aumento acentuado da variância ao longo do tempo, poderíamos decidir o contrário. Ainda há uma questão de saber se os erros desses modelos têm uma variação consistente entre meses do ano. Se eles don8217t, então os intervalos de confiança para as previsões podem tender a ser muito grande ou muito estreito de acordo com a época. As parcelas residual-vs-tempo não mostram um problema óbvio a este respeito, mas para ser minucioso, seria bom olhar para a variância erro por mês. Se houver realmente um problema, uma transformação de log pode corrigi-lo. Implementação da folha de cálculo do ajuste sazonal e suavização exponencial É fácil executar o ajuste sazonal e ajustar os modelos de suavização exponencial usando o Excel. As imagens e gráficos de tela a seguir são extraídos de uma planilha que foi configurada para ilustrar o ajuste sazonal multiplicativo e a suavização linear exponencial nos seguintes dados de vendas trimestrais do Outboard Marine: Para obter uma cópia do próprio arquivo de planilha, clique aqui. A versão de suavização exponencial linear que será usada aqui para fins de demonstração é a versão de Brown8217s, simplesmente porque ela pode ser implementada com uma única coluna de fórmulas e há apenas uma constante de suavização para otimizar. Normalmente, é melhor usar a versão Holt8217s que tem constantes de suavização separadas para nível e tendência. O processo de previsão prossegue da seguinte forma: (i) primeiro os dados são ajustados sazonalmente (ii) então as previsões são geradas para os dados ajustados sazonalmente através de suavização exponencial linear e (iii) finalmente as previsões sazonalmente ajustadas são quasi mensuradas para obter previsões para a série original . O processo de ajuste sazonal é realizado nas colunas D a G. O primeiro passo no ajuste sazonal é calcular uma média móvel centrada (realizada aqui na coluna D). Isto pode ser feito tomando a média de duas médias anuais que são compensadas por um período em relação um ao outro. (Uma combinação de duas médias de compensação em vez de uma única média é necessária para fins de centralização quando o número de estações é par.) O próximo passo é calcular a relação com a média móvel - ie. Os dados originais divididos pela média móvel em cada período - o que é realizado aqui na coluna E. (Isso também é chamado de componente quottrend-cyclequot do padrão, na medida em que os efeitos da tendência e do ciclo de negócios podem ser considerados como sendo tudo o que Permanece após a média de dados de um ano inteiro. Naturalmente, as mudanças mês a mês que não são devido à sazonalidade poderia ser determinada por muitos outros fatores, mas a média de 12 meses suaviza sobre eles em grande medida. O índice sazonal estimado para cada estação é calculado pela primeira média de todas as razões para essa estação particular, que é feita nas células G3-G6 usando uma fórmula AVERAGEIF. As razões médias são então redimensionadas de modo que somam exatamente 100 vezes o número de períodos em uma estação, ou 400, neste caso, o que é feito nas células H3-H6. Abaixo na coluna F, as fórmulas VLOOKUP são usadas para inserir o valor do índice sazonal apropriado em cada linha da tabela de dados, de acordo com o trimestre do ano que ele representa. A média móvel centrada e os dados ajustados sazonalmente acabam parecidos com isto: Note que a média móvel normalmente se parece com uma versão mais lisa da série ajustada sazonalmente, e é mais curta em ambas as extremidades. Uma outra planilha no mesmo arquivo do Excel mostra a aplicação do modelo de suavização exponencial linear aos dados ajustados sazonalmente, começando na coluna G. Um valor para a constante de alisamento (alfa) é inserido acima da coluna de previsão (aqui, na célula H9) e Por conveniência, é atribuído o nome de intervalo quotAlpha. quot (O nome é atribuído usando o comando quotInsertNameCreatequot). O modelo LES é inicializado ao definir as duas primeiras previsões iguais ao primeiro valor real da série ajustada sazonalmente. A fórmula usada aqui para a previsão de LES é a forma recursiva de equação única do modelo Brown8217s: Esta fórmula é inserida na célula correspondente ao terceiro período (aqui, célula H15) e copiada para baixo a partir daí. Observe que a previsão do LES para o período atual se refere às duas observações precedentes e aos dois erros de previsão anteriores, bem como ao valor de alfa. Assim, a fórmula de previsão na linha 15 refere-se apenas a dados que estavam disponíveis na linha 14 e anteriores. (É claro que, se desejássemos usar a suavização linear simples em vez de linear, poderíamos substituir a fórmula SES aqui. Podemos também usar Holt8217s ao invés de Brown8217s modelo LES, o que exigiria mais duas colunas de fórmulas para calcular o nível ea tendência Que são utilizados na previsão.) Os erros são calculados na próxima coluna (aqui, coluna J) subtraindo as previsões dos valores reais. O erro quadrático médio é calculado como a raiz quadrada da variância dos erros mais o quadrado da média. (Isto decorre da identidade matemática: VARIANCE MSE (erros) (AVERAGE (erros)) 2.) No cálculo da média e variância dos erros nesta fórmula, os dois primeiros períodos são excluídos porque o modelo não começa realmente a prever até O terceiro período (linha 15 na planilha). O valor ótimo de alfa pode ser encontrado alterando manualmente alfa até que o RMSE mínimo seja encontrado, ou então você pode usar o quotSolverquot para executar uma minimização exata. O valor de alpha que o Solver encontrado é mostrado aqui (alpha0.471). Geralmente é uma boa idéia traçar os erros do modelo (em unidades transformadas) e também calcular e traçar suas autocorrelações em defasagens de até uma estação. Aqui está um gráfico de séries temporais dos erros (ajustados sazonalmente): As autocorrelações de erro são calculadas usando a função CORREL () para calcular as correlações dos erros com elas mesmas atrasadas por um ou mais períodos - detalhes são mostrados no modelo de planilha . Aqui está um gráfico das autocorrelações dos erros nos primeiros cinco lags: As autocorrelações nos intervalos 1 a 3 são muito próximas de zero, mas a espiga no intervalo 4 (cujo valor é 0,35) é ligeiramente problemática - sugere que a Processo de ajuste sazonal não foi completamente bem sucedido. No entanto, é apenas marginalmente significativo. 95 bandas de significância para testar se as autocorrelações são significativamente diferentes de zero são mais ou menos 2SQRT (n-k), onde n é o tamanho da amostra e k é o atraso. Aqui n é 38 e k varia de 1 a 5, então a raiz quadrada de - n-menos-k é de cerca de 6 para todos eles e, portanto, os limites para testar a significância estatística de desvios de zero são aproximadamente mais - Ou-menos 26, ou 0,33. Se você variar o valor de alfa com a mão neste modelo do Excel, você pode observar o efeito sobre as parcelas de tempo de série e autocorrelação dos erros, bem como sobre o erro quadrático médio, que será ilustrado abaixo. Na parte inferior da planilha, a fórmula de previsão é quotbootstrappedquot para o futuro, simplesmente substituindo as previsões de valores reais no ponto onde os dados reais se esgotou - i. e. Onde o futuro começa. (Em outras palavras, em cada célula onde um valor de dados futuro ocorreria, uma referência de célula é inserida que aponta para a previsão feita para esse período.) Todas as outras fórmulas são simplesmente copiadas para baixo de cima: Observe que os erros para previsões de O futuro são todos computados como sendo zero. Isso não significa que os erros reais serão zero, mas sim apenas reflete o fato de que, para fins de previsão, estamos assumindo que os dados futuros serão iguais às previsões em média. As previsões de LES resultantes para os dados ajustados sazonalmente são as seguintes: Com este valor específico de alfa, o que é ótimo para as previsões de um período antecipado, a tendência projetada é ligeiramente alta, refletindo a tendência local observada nos últimos 2 anos ou então. Para outros valores de alfa, uma projeção de tendência muito diferente pode ser obtida. Geralmente é uma boa idéia ver o que acontece com a projeção de tendência de longo prazo quando alfa é variado, porque o valor que é melhor para previsão de curto prazo não será necessariamente o melhor valor para prever o futuro mais distante. Por exemplo, aqui está o resultado que é obtido se o valor de alfa é manualmente definido como 0.25: A tendência de longo prazo projetada é agora negativa em vez de positiva Com um menor valor de alfa, o modelo está colocando mais peso em dados mais antigos em A sua estimativa do nível e da tendência actuais e as suas previsões a longo prazo reflectem a tendência descendente observada nos últimos 5 anos, em vez da tendência ascendente mais recente. Este gráfico também ilustra claramente como o modelo com um valor menor de alfa é mais lento para responder a pontos de quotreação nos dados e, portanto, tende a fazer um erro do mesmo sinal para muitos períodos em uma linha. Seus erros de previsão de 1 passo são maiores em média do que aqueles obtidos antes (RMSE de 34,4 em vez de 27,4) e fortemente positivamente autocorrelacionados. A autocorrelação lag-1 de 0,56 excede largamente o valor de 0,33 calculado acima para um desvio estatisticamente significativo de zero. Como uma alternativa ao avanço do valor de alfa para introduzir mais conservadorismo em previsões de longo prazo, um fator quottrend de amortecimento é às vezes adicionado ao modelo para fazer a tendência projetada aplanar após alguns períodos. O passo final na construção do modelo de previsão é o de ter uma razão razoável para as previsões de LES, multiplicando-as pelos índices sazonais apropriados. Assim, as projeções reseasonalized na coluna I são simplesmente o produto dos índices sazonais na coluna F e as previsões de LES estacionalmente ajustadas na coluna H. É relativamente fácil calcular intervalos de confiança para as previsões de um passo-frente feitas por este modelo: primeiro Calcular o RMSE (erro quadrático médio, que é apenas a raiz quadrada do MSE) e, em seguida, calcular um intervalo de confiança para a previsão ajustada sazonalmente adicionando e subtraindo duas vezes o RMSE. (Em geral, um intervalo de confiança de 95 para uma previsão de um período antecipado é aproximadamente igual à previsão de pontos mais ou menos duas vezes o desvio padrão estimado dos erros de previsão, assumindo que a distribuição de erro é aproximadamente normal eo tamanho da amostra É grande o suficiente, digamos, 20 ou mais. Aqui, o RMSE em vez do desvio padrão da amostra dos erros é a melhor estimativa do desvio padrão de futuros erros de previsão, porque leva bias, bem como variações aleatórias em conta.) Os limites de confiança Para a previsão ajustada sazonalmente são então reseasonalized. Juntamente com a previsão, multiplicando-os pelos índices sazonais apropriados. Neste caso o RMSE é igual a 27,4 e a previsão ajustada sazonalmente para o primeiro período futuro (Dec-93) é 273,2. De modo que o intervalo de confiança ajustado sazonalmente é de 273,2-227,4 218,4 para 273,2227,4 328,0. Multiplicando esses limites por Decembers índice sazonal de 68,61. Obtemos limites de confiança inferior e superior de 149,8 e 225,0 em torno da previsão de ponto Dec-93 de 187,4. Os limites de confiança para as previsões de mais de um período de tempo em geral aumentarão à medida que o horizonte de previsão aumentar, devido à incerteza quanto ao nível e à tendência, bem como aos fatores sazonais, mas é difícil computá-los em geral por métodos analíticos. (The appropriate way to compute confidence limits for the LES forecast is by using ARIMA theory, but the uncertainty in the seasonal indices is another matter.) If you want a realistic confidence interval for a forecast more than one period ahead, taking all sources of error into account, your best bet is to use empirical methods: for example, to obtain a confidence interval for a 2-step ahead forecast, you could create another column on the spreadsheet to compute a 2-step-ahead forecast for every period (by bootstrapping the one-step-ahead forecast). Then compute the RMSE of the 2-step-ahead forecast errors and use this as the basis for a 2-step-ahead confidence interval. Time Series Methods Time series methods are statistical techniques that make use of historical data accumulated over a period of time. Os métodos da série temporal assumem que o que ocorreu no passado continuará a ocorrer no futuro. Como sugere a série temporal de nomes, esses métodos relacionam a previsão a apenas um fator - tempo. Eles incluem a média móvel, suavização exponencial e linha de tendência linear e estão entre os métodos mais populares para a previsão de curto prazo entre as empresas de serviços e de fabricação. Esses métodos pressupõem que padrões históricos identificáveis ​​ou tendências para a demanda ao longo do tempo se repetirão. Média móvel Uma previsão de séries de tempo pode ser tão simples como usar a demanda no período atual para prever a demanda no próximo período. Isso às vezes é chamado de previsão ingênua ou intuitiva. 4 Por exemplo, se a demanda é de 100 unidades esta semana, a previsão para as próximas semanas demanda é de 100 unidades, se a demanda acaba por ser 90 unidades, em seguida, as semanas seguintes demanda é de 90 unidades, e assim por diante. Esse tipo de método de previsão não leva em conta o comportamento histórico da demanda, que se baseia apenas na demanda no período corrente. Ele reage diretamente aos movimentos normais, aleatórios na demanda. O método de média móvel simples usa vários valores de demanda durante o passado recente para desenvolver uma previsão. Isso tende a atenuar, ou suavizar, os aumentos aleatórios e diminuições de uma previsão que usa apenas um período. A média móvel simples é útil para prever a demanda que é estável e não exibe qualquer comportamento de demanda pronunciado, como uma tendência ou padrão sazonal. As médias móveis são calculadas para períodos específicos, como três meses ou cinco meses, dependendo de quanto o meteorologista deseja suavizar os dados da demanda. Quanto mais longo for o período de média móvel, mais suave será. A fórmula para computar a média móvel simples é computar uma média movente simples A empresa instantânea da fonte do escritório do grampo do papel vende e entrega materiais de escritório às companhias, às escolas, e às agências dentro de um raio de 50 milhas de seu armazém. O negócio de suprimentos de escritório é competitivo, ea capacidade de entregar ordens prontamente é um fator para obter novos clientes e manter os antigos. (Os escritórios geralmente não exigem quando eles correm baixos suprimentos, mas quando eles acabam completamente fora. Como resultado, eles precisam de suas ordens imediatamente.) O gerente da empresa quer ser determinados drivers e veículos estão disponíveis para entregar ordens prontamente e Eles têm estoque adequado em estoque. Portanto, o gerente quer ser capaz de prever o número de pedidos que ocorrerão durante o próximo mês (ou seja, para prever a demanda por entregas). A partir de registros de ordens de entrega, a gerência acumulou os seguintes dados para os últimos 10 meses, a partir do qual pretende calcular média móvel de 3 e 5 meses. Vamos supor que é o fim de outubro. A previsão resultante da média móvel de 3 ou 5 meses é tipicamente para o próximo mês na seqüência, que neste caso é novembro. A média móvel é calculada a partir da demanda por ordens para os 3 meses anteriores na seqüência de acordo com a seguinte fórmula: A média móvel de 5 meses é calculada a partir dos dados de demanda de 5 meses anteriores como segue: A média móvel de 3 e 5 meses As projeções de média móvel para todos os meses de demanda são mostradas na tabela a seguir. Na verdade, apenas a previsão para novembro com base na demanda mensal mais recente seria usada pelo gerente. No entanto, as previsões anteriores para meses anteriores nos permitem comparar a previsão com a demanda real para ver quão preciso é o método de previsão - ou seja, quão bem ele faz. Médias de três e cinco meses As previsões de média móvel na tabela acima tendem a suavizar a variabilidade que ocorre nos dados reais. Este efeito de alisamento pode ser observado na seguinte figura em que as médias de 3 meses e 5 meses foram sobrepostas em um gráfico dos dados originais: A média móvel de 5 meses na figura anterior suaviza as flutuações em maior extensão do que A média móvel de 3 meses. No entanto, a média de 3 meses reflete mais de perto os dados mais recentes disponíveis para o gerente de suprimentos de escritório. Em geral, as previsões usando a média móvel de longo prazo são mais lentas para reagir às mudanças recentes na demanda do que aquelas feitas usando médias móveis de período mais curto. Os períodos extras de dados atenuam a velocidade com a qual a previsão responde. Estabelecer o número apropriado de períodos para usar em uma média móvel de previsão muitas vezes requer alguma quantidade de experimentação de tentativa e erro. A desvantagem do método da média móvel é que não reage a variações que ocorrem por uma razão, tais como ciclos e efeitos sazonais. Os fatores que causam mudanças são geralmente ignorados. É basicamente um método mecânico, que reflete dados históricos de forma consistente. No entanto, o método da média móvel tem a vantagem de ser fácil de usar, rápido e relativamente barato. Em geral, este método pode fornecer uma boa previsão para o curto prazo, mas não deve ser empurrado demasiado longe no futuro. Média Móvel Ponderada O método da média móvel pode ser ajustado para refletir mais de perto flutuações nos dados. No método da média móvel ponderada, os pesos são atribuídos aos dados mais recentes de acordo com a seguinte fórmula: Os dados de demanda para PM Computer Services (mostrados na tabela para o Exemplo 10.3) parecem seguir uma tendência linear crescente. A empresa quer calcular uma linha de tendência linear para ver se ela é mais precisa do que as previsões de suavização exponencial e de suavização exponencial ajustadas desenvolvidas nos Exemplos 10.3 e 10.4. Os valores necessários para os cálculos dos mínimos quadrados são os seguintes: Usando esses valores, os parâmetros para a linha de tendência linear são calculados da seguinte forma: Portanto, a equação da linha de tendência linear é: Para calcular uma previsão para o período 13, Linha de tendência: O gráfico a seguir mostra a linha de tendência linear comparada com os dados reais. A linha de tendência parece refletir de perto os dados reais - isto é, ser um bom ajuste - e seria assim um bom modelo de previsão para esse problema. No entanto, uma desvantagem da linha de tendência linear é que ele não vai se ajustar a uma mudança na tendência, como os métodos de previsão de suavização exponencial, ou seja, é assumido que todas as previsões futuras seguirá uma linha reta. Isso limita o uso deste método para um período de tempo mais curto em que você pode ser relativamente certo de que a tendência não vai mudar. Ajustes Sazonais Um padrão sazonal é um aumento repetitivo e diminuição da demanda. Muitos itens de demanda apresentam comportamento sazonal. As vendas de vestuário seguem os padrões sazonais anuais, com a demanda por roupas quentes aumentando no outono e no inverno e diminuindo na primavera e no verão, à medida que aumenta a demanda por roupas mais frias. A demanda por muitos itens de varejo, incluindo brinquedos, equipamentos esportivos, vestuário, aparelhos eletrônicos, presuntos, perus, vinho e frutas, aumentam durante a temporada de férias. A demanda do cartão aumenta em conjunção com dias especiais como Dia dos Namorados e Dia das Mães. Padrões sazonais também podem ocorrer em uma base mensal, semanal ou mesmo diária. Alguns restaurantes têm demanda mais elevada na noite do que no almoço ou nos fins de semana ao contrário dos dias úteis. Tráfego - daí as vendas - em shopping centers pega na sexta-feira e sábado. Existem vários métodos para refletir padrões sazonais em uma previsão de séries temporais. Vamos descrever um dos métodos mais simples usando um fator sazonal. Um fator sazonal é um valor numérico que é multiplicado pela previsão normal para obter uma previsão ajustada sazonalmente. Um método para desenvolver uma demanda por fatores sazonais é dividir a demanda para cada período sazonal pela demanda anual total, de acordo com a seguinte fórmula: Os fatores sazonais resultantes entre 0 e 1,0 são, de fato, a parcela da demanda anual total atribuída a Cada estação. Esses fatores sazonais são multiplicados pela demanda anual prevista para produzir previsões ajustadas para cada estação. Calculando uma Previsão com Ajustes Sazonais A Wishbone Farms cria perus para vender a uma empresa de processamento de carne ao longo do ano. No entanto, sua alta temporada é obviamente durante o quarto trimestre do ano, de outubro a dezembro. A Wishbone Farms experimentou a demanda por perus nos últimos três anos, conforme mostrado na tabela a seguir: Como temos três anos de dados de demanda, podemos calcular os fatores sazonais dividindo a demanda trimestral total pelos três anos pela demanda total nos três anos : Em seguida, queremos multiplicar a demanda prevista para o ano seguinte, 2000, por cada um dos fatores sazonais para obter a demanda prevista para cada trimestre. Para conseguir isso, precisamos de uma previsão de demanda para 2000. Nesse caso, uma vez que os dados de demanda na tabela parecem exibir uma tendência geralmente crescente, calculamos uma linha de tendência linear para os três anos de dados na tabela para obter uma Estimativa de previsão: Assim, a previsão para 2000 é 58.17, ou 58.170 perus. Usando esta previsão anual de demanda, as previsões ajustadas sazonalmente, SF i, para 2000 estão comparando as previsões trimestrais com os valores reais da demanda na tabela, elas pareceriam ser estimativas de previsão relativamente boas, refletindo tanto as variações sazonais nos dados quanto Tendência ascendente geral. 10-12. Como o método da média móvel é semelhante ao alisamento exponencial 10-13. O efeito no modelo de suavização exponencial aumentará a constante de suavização 10-14. Como a suavização exponencial ajustada difere da suavização exponencial 10-15. O que determina a escolha da constante de suavização para a tendência em um modelo de suavização exponencial ajustado 10-16. Nos exemplos de capítulo para métodos de séries temporais, a previsão inicial foi sempre assumida como sendo a mesma da demanda real no primeiro período. Sugira outras maneiras de que a previsão inicial possa ser derivada em uso real. 10-17. Como o modelo de previsão da linha de tendência linear difere de um modelo de regressão linear para previsão 10-18. Dos modelos de séries temporais apresentados neste capítulo, incluindo a média móvel ea média móvel ponderada, a suavização exponencial ea suavização exponencial ajustada, ea linha de tendência linear, qual você considera o melhor Por que 10-19. Quais as vantagens que a suavização exponencial ajustada tem sobre uma linha de tendência linear para a demanda prevista que exibe uma tendência 4 K. B. Kahn e J. T. Mentzer, Forecasting in Consumer and Industrial Markets, The Journal of Business Forecasting 14, no. 2 (Verão 1995): 21-28.

Comments

Popular Posts