Thursday 13 July 2017

Moving Average In Statistics


Média móvel média de dados de séries temporais (observações igualmente espaçadas no tempo) de vários períodos consecutivos. Chamado de movimento porque é continuamente recalculado à medida que novos dados ficam disponíveis, progride soltando o valor mais antigo e adicionando o valor mais recente. Por exemplo, a média móvel das vendas de seis meses pode ser calculada tomando a média das vendas de janeiro a junho, depois a média das vendas de fevereiro a julho, de março a agosto, e assim por diante. As médias móveis (1) reduzem o efeito das variações temporárias nos dados, (2) melhoram o ajuste dos dados para uma linha (um processo chamado suavização) para mostrar a tendência dos dados mais claramente e (3) realçar qualquer valor acima ou abaixo do tendência. Se você está calculando algo com variância muito alta o melhor que você pode fazer é descobrir a média móvel. Eu queria saber qual era a média móvel dos dados, então eu teria uma melhor compreensão de como estávamos fazendo. Quando você está tentando descobrir alguns números que mudam frequentemente, o melhor que você pode fazer é calcular a média móvel. Média móvel: o que é e como calcular isso. Assista ao vídeo ou leia o artigo abaixo: uma média móvel é uma técnica para Obter uma idéia geral das tendências em um conjunto de dados é uma média de qualquer subconjunto de números. A média móvel é extremamente útil para a previsão de tendências a longo prazo. Você pode calculá-lo por qualquer período de tempo. Por exemplo, se você tiver dados de vendas por um período de vinte anos, você pode calcular uma média móvel de cinco anos, uma média móvel de quatro anos, uma média móvel de três anos e assim por diante. Os analistas do mercado de ações costumam usar uma média móvel de 50 ou 200 dias para ajudá-los a ver tendências no mercado de ações e (espero) prever onde as ações estão indo. Uma média representa o valor 8220middling8221 de um conjunto de números. A média móvel é exatamente a mesma, mas a média é calculada várias vezes para vários subconjuntos de dados. Por exemplo, se você quer uma média móvel de dois anos para um conjunto de dados de 2000, 2001, 2002 e 2003, você encontrará médias para os subconjuntos 20002001, 20012002 e 20022003. As médias móveis geralmente são plotadas e são melhor visualizadas. Cálculo de uma média móvel de 5 anos Exemplo de amostra Problema: Calcule uma média móvel de cinco anos a partir do seguinte conjunto de dados: (4M 6M 5M 8M 9M) ​​5 6.4M As vendas médias para o segundo subconjunto de cinco anos (2004, 8211, 2008). Centrada em 2006, é de 6,6M: (6M 5M 8M 9M 5M) 5 6.6M As vendas médias do terceiro subconjunto de cinco anos (2005 8211 2009). Centrado em torno de 2007, é de 6,6M: (5M 8M 9M 5M 4M) 5 6.2M Continue calculando cada média de cinco anos, até chegar ao final do conjunto (2009-2013). Isso lhe dá uma série de pontos (médias) que você pode usar para traçar um gráfico das médias móveis. A seguinte tabela do Excel mostra as médias móveis calculadas para 2003-2012 juntamente com um gráfico de dispersão dos dados: assista o vídeo ou leia as etapas abaixo: o Excel possui um complemento poderoso, o Data Analysis Toolpak (como carregar os dados Analysis Toolpak) que oferece muitas opções extras, incluindo uma função de média móvel automática. A função não só calcula a média móvel para você, mas também grafica os dados originais ao mesmo tempo. Salvando-lhe muitas batidas de teclas. Excel 2013: Passos Etapa 1: clique na guia 8220Data8221 e clique em 8220Data Analysis.8221 Etapa 2: clique em 8220Moving average8221 e depois clique em 8220OK.8221 Etapa 3: clique na caixa 8220Input Range8221 e selecione seus dados. Se você incluir cabeçalhos de coluna, certifique-se de verificar a caixa Etiquetas na primeira linha. Etapa 4: digite um intervalo na caixa. Um intervalo é quantos pontos anteriores você deseja que o Excel use para calcular a média móvel. Por exemplo, 822058221 usaria os 5 pontos de dados anteriores para calcular a média para cada ponto subsequente. Quanto menor o intervalo, mais próxima sua média móvel é para o seu conjunto de dados original. Etapa 5: clique na caixa 8220Output Range8221 e selecione uma área na planilha onde deseja que o resultado apareça. Ou, clique no botão de opção 8220New worksheet8221. Etapa 6: Verifique a caixa 8220Chart Output8221 se você quiser ver um gráfico do seu conjunto de dados (se esquecer de fazer isso, você sempre pode voltar e adicioná-lo ou escolher um gráfico na guia 8220Insert8221.8221 Etapa 7: Pressione 8220OK .8221 O Excel retornará os resultados na área que você especificou no Passo 6. Assista ao vídeo ou leia os passos abaixo: Problema de exemplo: Calcule a média móvel de três anos no Excel para os seguintes dados de vendas: 2003 (33M), 2004 (22M), 2005 (36M), 2006 (34M), 2007 (43M), 2008 (39M), 2009 (41M), 2010 (36M), 2011 (45M), 2012 (56M), 2013 (64M). 1: Digite seus dados em duas colunas no Excel. A primeira coluna deve ter o ano e a segunda coluna os dados quantitativos (neste problema de exemplo, os números de vendas). Certifique-se de que não existam linhas em branco nos dados da sua célula. Etapa 2 : Calcule a primeira média de três anos (2003-2005) para os dados. Para esse problema de amostra, digite 8220 (B2B3B4) 38221 na célula D3. Cálculo da primeira média. Etapa 3: Arraste o quadrado no canto inferior direito d Próprio para mover a fórmula para todas as células na coluna. Isso calcula médias para anos sucessivos (por exemplo, 2004-2006, 2005-2007). Arrastando a fórmula. Etapa 4: (Opcional) Crie um gráfico. Selecione todos os dados na planilha. Clique na aba 8220Insert8221 e, em seguida, clique em 8220Scatter, 8221 e clique em 8220Scatter com linhas e marcadores suaves.8221 Um gráfico da sua média móvel aparecerá na planilha. Veja o nosso canal do YouTube para obter mais ajuda e dicas de estatísticas Média de movimento: o que é e como calcular isso foi modificado pela última vez: 8 de janeiro de 2016 por Andale 22 pensamentos sobre ldquo Média de movimento: o que é e como calculá-lo rdquo Este é Perfeito e simples de assimilar. Obrigado pelo trabalho Isso é muito claro e informativo. Pergunta: como se calcula uma média móvel de 4 anos Em que ano seria a média móvel de 4 anos no centro desse foco no final do segundo ano (ou seja, 31 de dezembro). Posso usar uma média de renda para prever ganhos futuros que alguém conhece sobre o meio centrado, por favor, diga-me se alguém sabe. Aqui, é que devemos considerar 5 anos para obter o meio que está no centro. Então, o que sobre os anos de descanso se quisermos obter a média de 20118230, pois não temos mais valores após 2012, então, como é que vamos calcular isso? Como você Don8217t tenha mais informações, seria impossível calcular o MA de 5 anos para 2011. Você poderia obter uma média móvel de dois anos. Oi, obrigado pelo vídeo. No entanto, uma coisa não é clara. Como fazer uma previsão para os próximos meses. O vídeo mostra a previsão dos meses para os quais os dados já estão disponíveis. Oi, Raw, I8217m trabalhando na expansão do artigo para incluir a previsão. O processo é um pouco mais complicado do que usar dados passados. Dê uma olhada neste artigo da Duke University, que o explica em profundidade. Saudações, Stephanie obrigado por uma explicação clara. Oi Não é possível localizar o link para o artigo sugerido pela Duke University. Solicitar para publicar o link novamente. Médias móveis Médias móveis Com conjuntos de dados convencionais, o valor médio é geralmente o primeiro e uma das estatísticas de resumo mais úteis para calcular. Quando os dados são na forma de uma série temporal, a série significa uma medida útil, mas não reflete a natureza dinâmica dos dados. Os valores médios calculados em períodos curtos, quer antes do período atual ou centrados no período atual, são geralmente mais úteis. Como esses valores médios variam, ou se movem, à medida que o período atual se move do tempo t 2, t 3. etc., eles são conhecidos como médias móveis (Mas). Uma média móvel simples é (tipicamente) a média não ponderada de k valores anteriores. Uma média móvel ponderada exponencialmente é essencialmente a mesma que uma média móvel simples, mas com contribuições para a média ponderada pela proximidade com a hora atual. Como não há um, mas toda uma série de médias móveis para qualquer série, o conjunto de Mas pode ser plotado em gráficos, analisados ​​como uma série e usados ​​em modelagem e previsão. Uma série de modelos pode ser construída usando médias móveis, e estas são conhecidas como modelos MA. Se esses modelos forem combinados com modelos autorregressivos (AR), os modelos compostos resultantes são conhecidos como modelos ARMA ou ARIMA (o I é para integrado). Médias móveis simples Uma vez que uma série temporal pode ser considerada como um conjunto de valores, t 1,2,3,4, n a média desses valores pode ser calculada. Se assumirmos que n é bastante grande, e selecionamos um inteiro k, que é muito menor do que n. Podemos calcular um conjunto de médias de bloco, ou médias móveis simples (da ordem k): cada medida representa a média dos valores de dados ao longo de um intervalo de observações k. Observe que o primeiro MA possível da ordem k gt0 é aquele para t k. Mais geralmente podemos soltar o subíndice extra nas expressões acima e escrever: Isto indica que a média estimada no tempo t é a média simples do valor observado no tempo t e os passos de tempo precedentes de k-1. Se forem aplicados pesos que diminuam a contribuição das observações que estão mais longe no tempo, a média móvel é dito suavizar exponencialmente. As médias móveis são freqüentemente usadas como forma de previsão, pelo que o valor estimado para uma série no instante t 1, S t1. É tomado como MA durante o período até e inclusive o tempo t. por exemplo. A estimativa de hoje é baseada em uma média de valores previamente registrados até e inclusive ontem (para dados diários). As médias móveis simples podem ser vistas como uma forma de suavização. No exemplo ilustrado abaixo, o conjunto de dados de poluição do ar mostrado na introdução deste tópico foi aumentado por uma linha de média móvel de 7 dias (MA), mostrada aqui em vermelho. Como pode ser visto, a linha MA suaviza os picos e as depressões nos dados e pode ser muito útil na identificação de tendências. A fórmula de cálculo de frente padrão significa que os primeiros pontos de dados de k -1 não possuem valor de MA, mas, posteriormente, os cálculos se estendem ao ponto de dados final da série. PM10 valores médios diários, Greenwich fonte: London Air Quality Network, londonair. org. uk Um dos motivos para o cálculo de médias móveis simples da maneira descrita é que ele permite que os valores sejam computados para todos os intervalos de tempo do tempo tk até o presente, e Como uma nova medida é obtida para o tempo t 1, o MA para o tempo t 1 pode ser adicionado ao conjunto já calculado. Isso fornece um procedimento simples para conjuntos de dados dinâmicos. No entanto, existem algumas questões com essa abordagem. É razoável argumentar que o valor médio nos últimos 3 períodos, por exemplo, deve estar localizado no tempo t -1, e não no tempo t. E para um MA em um número par de períodos, talvez ele deve estar localizado no meio do ponto entre dois intervalos de tempo. Uma solução para esta questão é usar cálculos de MA centrados, nos quais o MA no tempo t é a média de um conjunto simétrico de valores em torno de t. Apesar de seus méritos óbvios, essa abordagem não é geralmente usada, pois exige que os dados estejam disponíveis para eventos futuros, o que pode não ser o caso. Nos casos em que a análise é inteiramente de uma série existente, o uso de Mas centrado pode ser preferível. As médias móveis simples podem ser consideradas como uma forma de suavização, eliminando alguns componentes de alta freqüência de uma série de tempo e destacando (mas não removendo) as tendências de maneira similar à noção geral de filtragem digital. De fato, as médias móveis são uma forma de filtro linear. É possível aplicar uma computação média móvel a uma série que já foi suavizada, ou seja, suavizando ou filtrando uma série já suavizada. Por exemplo, com uma média móvel da ordem 2, podemos considerá-la como sendo computada usando pesos, de modo que o MA em x 2 0,5 x 1 0,5 x 2. Do mesmo modo, o MA em x 3 0,5 x 2 0,5 x 3. Se nós Aplicar um segundo nível de suavização ou filtragem, temos 0,5 x 2 0,5 x 3 0,5 (0,5 x 1 0,5 x 2) 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3, ou seja, a filtragem de 2 estágios O processo (ou convolução) produziu uma média móvel simétrica ponderada de forma variável, com pesos. Várias convoluções podem produzir médias móveis bastante ponderadas, algumas das quais foram encontradas de particular uso em campos especializados, como nos cálculos do seguro de vida. As médias móveis podem ser usadas para remover efeitos periódicos se computados com o comprimento da periodicidade como conhecido. Por exemplo, com os dados mensais, as variações sazonais podem muitas vezes ser removidas (se este for o objetivo), aplicar uma média móvel simétrica de 12 meses com todos os meses ponderados igualmente, exceto o primeiro e o último que são ponderados por 12. Isso ocorre porque haverá Ter 13 meses no modelo simétrico (tempo atual, t. - 6 meses). O total é dividido por 12. Procedimentos similares podem ser adotados para qualquer periodicidade bem definida. Médias móveis ponderadas exponencialmente (EWMA) Com a fórmula média móvel simples: todas as observações são igualmente ponderadas. Se chamássemos esses pesos iguais, alfa t. Cada um dos pesos k seria igual a 1 k. Então a soma dos pesos seria de 1, e a fórmula seria: já vimos que as múltiplas aplicações desse processo resultam na variação dos pesos. Com médias móveis exponencialmente ponderadas, a contribuição para o valor médio de observações mais removidas no tempo é deliberada reduzida, enfatizando eventos mais recentes (locais). Essencialmente, um parâmetro de suavização, 0lt alfa lt1, e a fórmula revisada para: Uma versão simétrica desta fórmula seria da forma: se os pesos no modelo simétrico forem selecionados como os termos dos termos da expansão binomial, (1212) 2q. Eles somarão para 1, e como q se tornar grande, irá se aproximar da distribuição Normal. Esta é uma forma de ponderação do kernel, com o Binomial atuando como a função do kernel. A convolução de dois estágios descrita na subseção anterior é precisamente esse arranjo, com q 1, produzindo os pesos. Em suavização exponencial, é necessário usar um conjunto de pesos que somem para 1 e que reduzem de tamanho geométricamente. Os pesos utilizados são geralmente da forma: Para mostrar que esses pesos somam para 1, considere a expansão de 1 como uma série. Podemos escrever e expandir a expressão entre parênteses usando a fórmula binomial (1- x) p. Onde x (1-) e p -1, que dá: Isto fornece uma forma de média móvel ponderada da forma: Este somatório pode ser escrito como uma relação de recorrência: o que simplifica bastante a computação e evita o problema de que o regime de ponderação Deve ser estritamente infinito para que os pesos somem para 1 (para valores pequenos de alfa. Isso geralmente não é o caso). A notação utilizada por diferentes autores varia. Alguns usam a letra S para indicar que a fórmula é essencialmente uma variável suavizada e escreve: enquanto a literatura da teoria do controle geralmente usa Z ao invés de S para valores ponderados exponencialmente ou suavizados (veja, por exemplo, Lucas e Saccucci, 1990, LUC1 , E o site NIST para mais detalhes e exemplos trabalhados). As fórmulas citadas acima derivam do trabalho de Roberts (1959, ROB1), mas Hunter (1986, HUN1) usa uma expressão da forma: que pode ser mais apropriada para uso em alguns procedimentos de controle. Com alfa 1, a estimativa média é simplesmente seu valor medido (ou o valor do item de dados anterior). Com 0,5 a estimativa é a média móvel simples das medições atual e anterior. Nos modelos de previsão, o valor, S t. É freqüentemente usado como estimativa ou valor de previsão para o próximo período de tempo, ou seja, como a estimativa para x no tempo t 1. Assim, temos: Isso mostra que o valor de previsão no tempo t 1 é uma combinação da média móvel ponderada exponencialmente anterior Mais um componente que representa o erro de previsão ponderado, epsilon. No tempo t. Assumindo que uma série de tempo é fornecida e uma previsão é necessária, é necessário um valor para alfa. Isso pode ser estimado a partir dos dados existentes, avaliando a soma dos erros de predição quadrados obtidos com valores variáveis ​​de alfa para cada t 2,3. Definindo a primeira estimativa para ser o primeiro valor de dados observado, x 1. Nas aplicações de controle, o valor de alfa é importante, isto é, é usado na determinação dos limites de controle superior e inferior e afeta o comprimento de execução médio (ARL) esperado Antes que esses limites de controle sejam quebrados (sob o pressuposto de que a série temporal representa um conjunto de variáveis ​​independentes aleatoriamente, distribuídas de forma idêntica com variância comum). Nessas circunstâncias, a variância da estatística de controle: é (Lucas e Saccucci, 1990): Os limites de controle geralmente são definidos como múltiplos fixos desta variância assintótica, e. - 3 vezes o desvio padrão. Se alfa 0.25, por exemplo, e os dados que estão sendo monitorados assumem ter uma distribuição Normal, N (0,1), quando no controle, os limites de controle serão - 1.134 e o processo atingirá um ou outro limite em 500 etapas na média. Lucas e Saccucci (1990 LUC1) derivam os ARLs para uma ampla gama de valores alfa e sob vários pressupostos usando os procedimentos da Cadeia de Markov. Eles tabulam os resultados, incluindo o fornecimento de ARL quando a média do processo de controle foi deslocada por algum múltiplo do desvio padrão. Por exemplo, com uma mudança de 0,5 com alfa 0.25, o ARL tem menos de 50 etapas de tempo. As abordagens descritas acima são conhecidas como suavização exponencial única. Uma vez que os procedimentos são aplicados uma vez na série temporal e, em seguida, os processos de análise ou controle são realizados no conjunto de dados suavizado resultante. Se o conjunto de dados incluir uma tendência e / ou componentes sazonais, o alisamento exponencial de dois ou três estágios pode ser aplicado como meio de remoção (modelagem explícita) desses efeitos (veja mais adiante, a seção sobre Previsão abaixo e o exemplo do NIST). CHA1 Chatfield C (1975) The Analysis of Times Series: Teoria e Prática. Chapman and Hall, London HUN1 Hunter J S (1986) A média móvel ponderada exponencialmente. J of Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Esquemas de controle de média móvel ponderada exponencialmente: propriedades e aprimoramentos. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Testes de gráficos de controle baseados em médias móveis geométricas. Technometrics, 1, 239-250

No comments:

Post a Comment