Saturday 10 March 2018

Plot moving average python


Estou jogando em Python um pouco mais, e eu encontrei um livro limpo com exemplos. Um dos exemplos é traçar alguns dados. Eu tenho um arquivo. txt com duas colunas e eu tenho os dados. Eu traçou os dados apenas multa, mas no exercício diz: Modifique seu programa mais para calcular e traçar a média running dos dados, definida por: onde r5 neste caso (eo yk é a segunda coluna no arquivo de dados) . Faça com que o programa trace os dados originais e a média em execução no mesmo gráfico. Até agora eu tenho isso: Então, como eu calculo a soma Em Mathematica sua simples desde a sua manipulação simbólica (Sumi, por exemplo), mas como calcular a soma em python que leva a cada dez pontos nos dados e médias, e faz isso Até o final dos pontos eu olhei para o livro, mas não encontrei nada que poderia explicar isso: heltonbikers código fez o truque: D Muito obrigado :) Há um problema com a resposta aceita. Eu acho que precisamos usar válido em vez de mesmo aqui - return numpy. convolve (intervalo, janela, mesmo). Como exemplo, teste o MA deste conjunto de dados 1,5,7,2,6,7,8,2,2,7,8,3,7,3,7,3,15,6 - o resultado Deve ser 4.2.5.4,6.0,5.0,5.0,5.2,5.4,4.4,5.4,5.6,5.6,4.6,7.0,6.8. Mas tendo o mesmo nos dá uma saída incorreta de 2.6.3.0,4.2,5.4,6.0,5.0,5.0,5.2,5.4,4.4,5.4,5.6,5.6, 4.6,7.0,6.8,6.2,4.8 Código enferrujado para tentar isso -: Tente isso com amplificador válido mesmo e ver se a matemática faz sentido. Respondeu Oct 29 14 at 4:27 Haven39t tentou isso, mas I39ll olhar para ele, It39s sido um tempo desde I39ve codificado em Python. Ndash dingod Oct 29 14 at 7:07 dingod Por que don39t você rapidamente tentar isso com o código enferrujado (eo conjunto de dados de exemplo (como uma lista simples), eu postei. Para algumas pessoas preguiçoso (como eu tinha sido no início) - suas máscaras para fora o fato de que a média móvel é incorreta. Probably você deve considerar a edição de sua resposta original. Eu tentei isso ontem e verificação dupla me salvou cara de olhar ruim em relatar ao nível Cxo. Tudo o que você precisa fazer, é tentar Sua mesma média móvel uma vez com quotvalidquot e outro tempo com quotsamequot - e uma vez que você está convencido me dar algum amor (aka-up-vote) ndash ekta 29 de outubro 14 às 7: 16Eu sei que esta é uma velha questão, mas aqui está uma solução Que não usa qualquer estrutura de dados extra ou bibliotecas. Ele é linear no número de elementos da lista de entrada e não consigo pensar em qualquer outra forma de torná-lo mais eficiente (na verdade, se alguém sabe de uma maneira melhor para alocar o resultado, por favor Deixe-me saber). NOTA: isso seria muito mais rápido usando uma matriz numpy em vez de um li St, mas eu queria eliminar todas as dependências. Seria também possível melhorar o desempenho por execução multi-threaded A função assume que a lista de entrada é um dimensional, por isso tenha cuidado. Você pode calcular uma corrida média com: Felizmente, numpy inclui uma função convolve que podemos usar para acelerar as coisas. A média de corrida é equivalente a convolver x com um vetor que é N longo, com todos os membros igual a 1N. A implementação numpy de convolve inclui o transiente inicial, então você tem que remover os primeiros N-1 pontos: Na minha máquina, a versão rápida é 20-30 vezes mais rápida, dependendo do comprimento do vetor de entrada e do tamanho da janela de média . Note que convolve não incluir um mesmo modo que parece que ele deve abordar a questão transitória inicial, mas ele divide-lo entre o início eo fim. Ele remove o transiente do final, eo início não tem um. Bem, eu acho que é uma questão de prioridades, eu não preciso do mesmo número de resultados à custa de obter uma inclinação para zero que não está lá nos dados. BTW, aqui está um comando para mostrar a diferença entre os modos: modos (39full39, 39same39, 39valid39) plot (convolve (ones ((200)), uns (50,)) 4750, modem) (-10, 251, -.1, 1.1) legenda (modos, loc39lower center39) (com pyplot e numpy importados). Ndash lapis Mar 24 14 at 13:56 pandas é mais adequado para isso do que NumPy ou SciPy. Sua função rollingmean faz o trabalho convenientemente. Ele também retorna um array NumPy quando a entrada é uma matriz. É difícil de bater o rollingmean no desempenho com qualquer implementação personalizada Python puro. Aqui está um exemplo de desempenho contra duas das soluções propostas: Existem também opções agradáveis ​​sobre como lidar com os valores de limite. I39m sempre irritado pela função de processamento de sinal que retornam sinais de saída de forma diferente dos sinais de entrada quando ambas as entradas e saídas são da mesma natureza (por exemplo, ambos os sinais temporais). Ele quebra a correspondência com a variável independente relacionada (por exemplo, tempo, freqüência) tornando a plotagem ou comparação não uma questão direta. De qualquer maneira, se você compartilhar o sentimento, você pode querer mudar as últimas linhas da função proposta como ynp. convolve (ww. sum (), s, mode39same39) return ywindowlen-1 :-( windowlen-1) ndash Christian O39Reilly Aug 25 15 at 19:56 Um pouco tarde para a festa, mas Ive fez a minha própria pequena função que não envolver em torno das extremidades ou almofadas com zeros que são usados ​​para encontrar a média também. Como um tratamento adicional é, que também re-amostras o sinal em pontos linearmente espaçados. Personalize o código à vontade para obter outros recursos. O método é uma simples multiplicação matricial com um kernel normalizado gaussiano. Um uso simples em um sinal sinusoidal com ruído distribuído normal adicionado: Esta pergunta é agora mesmo mais velha do que quando NeXuS escreveu sobre ela o mês passado, MAS eu gosto de como seu código trata dos casos da borda. No entanto, por ser uma média móvel simples, seus resultados ficam atrás dos dados aos quais se aplicam. Eu pensei que lidar com borda casos de uma forma mais satisfatória do que NumPys modos válidos. mesmo. E full poderia ser alcançado através da aplicação de uma abordagem semelhante a um convolution () método baseado. Minha contribuição usa uma média de execução central para alinhar seus resultados com seus dados. Quando há dois pontos disponíveis para a janela de tamanho completo a ser usado, as médias de execução são calculadas a partir de janelas sucessivamente menores nas bordas da matriz. Na verdade, a partir de janelas sucessivamente maiores, mas isso é um detalhe de implementação. É relativamente lento porque usa convolve (). E poderia provavelmente ser spruced acima completamente muito por um Pythonista verdadeiro, entretanto, eu acredito que a idéia está. Respondeu Jan 2 às 0:28 np. convolve é bom, mas lento quando a largura da janela cresce grande. Algumas respostas fornecem algoritmos mais eficientes com np. cumsum, mas parecem incapazes de lidar com valores de limite. Eu mesmo tenho implementado um algoritmo que pode lidar bem com este problema, se este problema é declarado como: parâmetro de entrada mergenum pode ser pensado como 2 windowwidth 1. Eu sei que este código é um pouco ilegível se u encontrá-lo útil e quer algumas expansões, por favor me avise e atualizar esta resposta. (Uma vez que escrever uma explicação pode custar-me muito tempo, espero que eu fazê-lo apenas quando alguém precisa dele. Por favor, perdoe-me por minha preguiça :)) Se apenas u estão interessados ​​em sua versão original: Seu ainda mais ilegível: a primeira solução Se livrar do problema de borda por zeros de preenchimento em torno da matriz, mas a segunda solução postada aqui lida com ela de uma maneira dura e direta :) lapis sim, mas vamos dizer que você usar o método cumsum no primeiro tick e salvar a sua média de rolamento médio para o Próxima marca. Cada carrapato depois disso você só tem que acrescentar o mais recente valor de média móvel para a sua matriz de rolamento em armazenamento. Usando este método você não está recalculando coisas que você já calculou: Na primeira vez que você cumsum depois disso, basta acrescentar o quotmean dos elementos do último período que é 2x mais rápido para todos os carrapatos subseqüentes. Ndash litepresence Jun 10 16 at 12:29 Se você escolher rolar o seu próprio, em vez de usar uma biblioteca existente, por favor, esteja consciente de erro de ponto flutuante e tentar minimizar seus efeitos: Se todos os seus valores são aproximadamente a mesma ordem de grandeza , Então isso ajudará a preservar a precisão sempre adicionando valores de magnitudes aproximadamente semelhantes. Na minha última frase eu estava tentando indicar por que ele ajuda a flutuação de erro de ponto. Se dois valores são aproximadamente a mesma ordem de grandeza, então adicioná-los perde menos precisão do que se você adicionou um número muito grande para um muito pequeno. O código combina valores quotadjacentquot de uma forma que mesmo somas intermediárias devem sempre ser razoavelmente próximos em magnitude, para minimizar o erro de ponto flutuante. Nada é à prova de tolo, mas este método salvou um casal projetos muito mal implementados na produção. Ndash Mayur Patel Dec 15 14 at 17:22 Alleo: Em vez de fazer uma adição por valor, você estará fazendo dois. A prova é o mesmo que o problema de bit-flipping. No entanto, o ponto dessa resposta não é necessariamente desempenho, mas precisão. O uso de memória para a média de valores de 64 bits não excederia os 64 elementos no cache, portanto também é amigável no uso de memória. Ndash Mayur Patel 29 de dezembro às 17: 04 Nós introduzimos anteriormente como criar médias móveis usando python. Este tutorial será uma continuação deste tópico. Uma média móvel no contexto da estatística, também chamada de média de rolamento, é um tipo de resposta ao impulso finito. Em nosso tutorial anterior traçamos os valores das matrizes x e y: Let8217s traçam x contra a média móvel de y que chamaremos yMA: Em primeiro lugar, let8217s equalizar o comprimento de ambos os arrays: E para mostrar isso no contexto: Gráfico: Para ajudar a entender isso, let8217s trama dois relacionamentos diferentes: x vs y e x vs MAy: A média móvel aqui é a parcela verde que começa em 3: Compartilhar este: Como este: Navegação de posts Deixar uma resposta Cancelar resposta Very useful I Gostaria de ler a última parte em grandes conjuntos de dados Espero que venha em breve8230 d blogueiros como este:

No comments:

Post a Comment