<a href="https://colab.research.google.com/github/cbeuter/Disc_CSL_e_EB/blob/main/EB_alg_Welford.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# O algoritmo de Welford
O algoritmo de Welford é uma técnica para calcular a média e o desvio padrão de um conjunto de números em tempo real, à medida que novos números são adicionados à sequência. Ele foi proposto por B. P. Welford em 1962.

O algoritmo de Welford mantém três variáveis principais:

1. **k**: O número de elementos na sequência.
2. **M**: A média acumulada dos elementos na sequência até o momento.
3. **S**: A soma dos quadrados das diferenças entre cada elemento e a média acumulada.

À medida que novos elementos são adicionados à sequência, o algoritmo atualiza essas variáveis de acordo com as seguintes fórmulas:

1. **Atualização da média (M)**:
   $M_n = M_{n-1} + \frac{(x_n - M_{n-1})}{n}$

   Onde:
   - $M_n$ é a nova média após a adição do $n$-ésimo elemento.
   - $M_{n-1}$ é a média anterior.
   - $x_n$ é o $n$-ésimo elemento.
   - $n$ é o número total de elementos na sequência após adicionar o $n$-ésimo elemento.

2. **Atualização da soma dos quadrados das diferenças (S)**:
   $S_n = S_{n-1} + (x_n - M_{n-1}) \times (x_n - M_n)$

   Onde:
   - $S_n$ é a nova soma dos quadrados das diferenças após a adição do $n$-ésimo elemento.

No algoritmo de Welford, essas atualizações são feitas de forma iterativa para cada novo elemento adicionado à sequência. Isso permite calcular a média e o desvio padrão de forma eficiente e precisa, mesmo quando os dados estão chegando em tempo real e quando a memória é limitada.

Após a adição de todos os elementos, a média é simplesmente \(M\) e o desvio padrão pode ser calculado dividindo \(S\) pelo número de elementos menos 1 e tirando a raiz quadrada desse resultado.

Este algoritmo é especialmente útil em situações onde é necessário calcular estatísticas de forma dinâmica, à medida que novos dados são gerados ou recebidos. Ele é amplamente utilizado em áreas como processamento de sinais, análise de dados em tempo real e estatísticas online.

Execução do algoritmo em uma classe

In [8]:
import math
import statistics

class Welford:
    def __init__(self):
        self.k = 0
        self.M = 0
        self.S = 0

    def update(self, x):
        self.k += 1
        new_M = self.M + (x - self.M) / self.k
        new_S = self.S + (x - self.M) * (x - new_M)
        self.M = new_M
        self.S = new_S

    def mean(self):
        return self.M

    def variance(self):
        if self.k == 1:
            return 0
        else:
            return self.S / (self.k - 1)

    def stddev(self):
        return math.sqrt(self.variance())

# Exemplo de uso:
data = [2, 4, 4, 4, 5, 5, 7, 9]
w = Welford()
for num in data:
    w.update(num)

print("Média:", w.mean())
print("Desvio Padrão:", w.stddev())

# compare com o uso de biblioteca
desvPad = statistics.stdev(data)
print("Desvio Padrão:", desvPad)

Média: 5.0
Desvio Padrão: 2.138089935299395
Desvio Padrão: 2.138089935299395
