<a href="https://colab.research.google.com/github/Alixandrini/ENGJ22/blob/main/Aula%2011/Filtro_de_Kalman.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Filtro de Kalman (estimando velocidade e posição)
Vamos olhar para o Filtro de Kalman como uma caixa preta. O Filtro Kalman possui entradas e saídas. As entradas são medições ruidosas e às vezes imprecisas. As saídas são menos ruidosas e, às vezes, estimativas mais precisas. As estimativas podem ser parâmetros de estado do sistema que não foram medidos ou observados. Esta última frase descreve o super poder do Filtro de Kalman. Novamente, o Filtro de Kalman estima os parâmetros do sistema que não são observados ou medidos. <br>
Simplificando, o Filtro de Kalman é um algoritmo genérico usado para estimar os parâmetros do sistema. Ele pode usar medições imprecisas ou ruidosas para estimar o estado dessa variável ou outra variável não observável com maior precisão. Por exemplo, a Filtragem Kalman é usada para fazer o seguinte: <br>


  * Rastreamento de objetos – Use a posição medida de um objeto para estimar com mais precisão a posição e a velocidade desse objeto.
  * Estimativa de peso corporal em balança digital – Use a pressão medida em uma superfície para estimar o peso do objeto nessa superfície.
  * Orientação, Navegação e Controle – Use sensores da Unidade de Medição Inercial (IMU) para estimar a localização, velocidade e aceleração de um objeto; e use essas estimativas para controlar os próximos movimentos dos objetos. <br>


O verdadeiro poder do Filtro de Kalman não é suavizar as medições. É a capacidade de estimar parâmetros do sistema que não podem ser medidos ou observados com precisão. Estimativas com maior precisão em sistemas que operam em tempo real, permitem aos sistemas maior controle e, portanto, mais capacidades.
## Algoritimo do Filtro de Kalman
<br>
<img src="https://raw.githubusercontent.com/Alixandrini/ENGJ22/main/Aula%2011/Diagrama-Filtro-de-Kalman-Linear.png">  <br>
O diagrama de processo acima mostra o algoritmo do Filtro de Kalman passo a passo. Eu sei que essas equações são intimidantes, mas garanto que tudo fará sentido quando você terminar de ler este artigo. Vejamos este processo um passo de cada vez. Para sua referência, aqui está uma tabela de definições que serão referenciadas ao longo.
### Ganho de Kalman

O ganho de Kalman é usado para determinar quanto das novas medições deve ser usado para atualizar a nova estimativa.

Para calcular o ganho, precisamos de duas coisas. Primeiro, precisamos do erro na estimativa (ou do erro original). Toda vez que calculamos o erro na estimativa, usamos essa informação para atualizar o ganho de Kalman. Dois, precisamos de erro nos dados/medição, porque como continuamente obtemos entradas de dados na estimativa, precisamos determinar como isso afeta o ganho.

O que o ganho faz é colocar uma importância relativa entre o erro na estimativa versus o erro na medição. Se o erro na estimativa for menor, colocamos mais ênfase nele. Vice-versa para o erro nos dados. O que alimenta o cálculo geral depende do quanto podemos confiar na previsão e nos dados (nos quais nos baseamos no erro).  <br>

<img src="https://miro.medium.com/max/556/1*u6vcFfpbTKenwsIP4QPQOw.png">  <br> 

O número para o ganho de Kalman será algo entre 0 e 1. Ele é então usado para atualizar o valor da estimativa atual. Na equação abaixo, x representa a estimativa, K é o ganho de Kalman, que é multiplicado (agindo como um peso) pela diferença entre a medida (p) e a estimativa anterior.  <br>
<img src="https://miro.medium.com/max/750/1*MDAbcwJ-yas1GSdwisOvPA.png">  <br>
Se o Granho de Kalman estiver próximo de 1, significa que as medições são precisas, mas as estimativas são instáveis. Podemos inferir isso olhando para a razão de ganho de Kalman, onde se o erro da medição for pequeno (e praticamente não contribuindo em nada para E_est sobre E_st), então K será igual a um. Quando o erro da medição for pequeno, as previsões futuras serão fortemente atualizadas com base nos novos dados de entrada.

No entanto, se o ganho de Kalman for pequeno, então o erro na estimativa é grande em relação ao erro na estimativa. As estimativas são mais estáveis ​​e as medições são imprecisas. Como resultado, qualquer diferença entre os novos dados e a previsão terá um efeito menor na eventual atualização.

A cada iteração, o modelo fará estimativas mais próximas do valor verdadeiro, resultando em um ganho de Kalman menor. Novos dados podem ter muita incerteza e não queremos que isso afaste o modelo preditivo.  <br>
<img src="https://miro.medium.com/max/1018/1*G-8xt2DUEkU2vPz3QpxYag.png">   <br>

Para recalcular o erro na estimativa, basta multiplicar o erro da medida pelo erro da estimativa anterior e dividi-lo pela soma dos erros.

A equação às vezes é escrita da seguinte forma:  <br>
<img src="https://miro.medium.com/max/546/1*BXTthrf_UBNuz58jnC_b3w.png">  <br>
Onde E é o erro da estimativa e o Kalman Gain é multiplicado pela estimativa anterior. O fator um menos K sendo multiplicado pelo erro anterior é o inverso do tamanho do ganho de Kalman. Se o Kalman Gain for grande, o erro na medição é pequeno, então novos dados podem atualizar rapidamente o modelo para o valor verdadeiro, o que reduzirá posteriormente o erro na estimativa. No entanto, se o Kalman Gain for muito pequeno, o erro na medição deve ser muito grande, então as atualizações devem ser lentas.

O Kalman Gain, em última análise, direciona a velocidade na qual o valor estimado é zerado no valor verdadeiro.

### Matriz de Estado

A matriz de estado registra o objeto que está sendo rastreado. Pode ser outro carro na estrada ou um avião no ar.  <br>
<img src="https://miro.medium.com/max/774/1*5bRGEOaSgp1qWiT939b6Ow.png">  <br>
A condição do estado é atualizada com base na condição anterior do estado mais a matriz da variável de controle u, com w representando o ruído que pode ter sido acumulado ao longo do processo.  <br>
<img src="https://miro.medium.com/max/964/1*VxcpqL-LE_3E4xizRaeZBA.png">  <br>
A matriz de estado pode conter informações como a posição (x e y) e a velocidade (x ponto e y ponto) de um objeto.  <br>
<img src="https://miro.medium.com/max/1394/1*IEAqEmvSi3S4pZZksM3LqQ.png">  <br>
<img src="https://miro.medium.com/max/1072/1*qyySArwtotRe5aEdpNuQQA.png">  <br>
A matriz A vezes x representa o estado atual e a velocidade com base no próximo passo de tempo (delta t). Um passo de tempo é dado e a velocidade é adicionada à posição anterior para atualizar a posição do objeto. A velocidade continua a mesma. A velocidade pode ter mudado após o passo de tempo devido à aceleração (matriz de variável de controle). Se houvesse aceleração, esse cálculo não estaria completo, pois a aceleração afetaria a velocidade. Esta atualização, no entanto, é aplicada na Matriz B vezes u.  <br>
<img src="https://miro.medium.com/max/950/1*kyV5hG_2q_ITrQfC2WdN_w.png">  <br>
A matriz B imita parte da equação cinemática onde a velocidade e a aceleração são multiplicadas pelo tempo. Quando a matriz B é multiplicada pela variável de controle (neste caso, aceleração) e somada a AX, resulta em uma mudança na posição e velocidade devido à aceleração.  <br>
### Dados de Observação

Parte do processo de filtro de Kalman é transmitir dados de observação com a matriz de estado que contém a previsão mais recente.  <br>
<img src="https://miro.medium.com/max/486/1*QRJZdVeqw5g3axokzJhpJw.png">  <br>
A observação é igual à matriz C vezes as variáveis ​​observadas mais o ruído de medição. A forma e as entradas da matriz C dependem do número de variáveis ​​que queremos observar. Se quisermos examinar todas as variáveis ​​em Y, então C seria em grande parte apenas uma matriz identidade. Se, no entanto, algumas variáveis ​​de Y não estiverem sendo observadas, C pode ser moldado de forma a descartar algumas das variáveis ​​de Y.

Por exemplo, se os dados de entrada contiverem quatro entradas (x, y, x velocidade, y velocidade), mas queremos apenas duas (x e y), a matriz C pode ser moldada para nos fornecer apenas as informações que queremos reter ( neste caso, uma matriz 4 x 2 com unidades ao longo da diagonal).

Z representa o ruído de medição.
### Covariância de Estado e Matriz de Covariância de Medição

A matriz de covariância de estado é um erro da estimativa. As matrizes de estado são estimativas dos estados subsequentes. Como as estimativas têm ruído, erros e incertezas, Q, uma matriz de covariância de ruído de processo é adicionada, que ajustará a matriz de covariância de estado. Ele será usado para ajudar o Kalman a dar ênfase no valor previsto ou no valor medido. <br>

<img src="https://miro.medium.com/max/514/1*h74KsnFtB2SbyUF9Exp78g.png"> <br>
Se a variância for definida como 0, significa que temos uma certeza bastante grande na medição correspondente. Assim, por exemplo, se a covariância de estado da posição x for 0, significa alta confiança na previsão da posição x.

A matriz de covariância de medição (R) é o erro da medição. Sempre que uma medição é feita para o objeto que está sendo rastreado, isso não significa que a medição seja exata, pois pode haver algum erro na forma como o objeto é rastreado.  <br>
<img src="https://miro.medium.com/max/624/1*YGOAe0T3NTR3oH0WkxnfgA.png">  <br>
<img src="https://miro.medium.com/max/600/1*ATgAd8Ygr6WG8bQMtuJCfg.png">  <br>
Lembre-se do anterior, se os erros de medição são pequenos em relação aos erros de previsão, queremos colocar mais confiança neles (portanto, o ganho de Kalman será mais próximo de 1). Caso contrário, se os erros de medição forem maiores que os erros de previsão, o ganho de Kalman dará menos ênfase à diferença entre a previsão e a medição.

Se P for 0, as atualizações de medição serão ignoradas. Isso implicaria que os valores preditivos são bastante precisos e ignoram as observações. É altamente improvável que o modelo tenha tal exatidão, então um dos benefícios de Q é que impede que P seja zero.

As matrizes A e H estão amplamente presentes para ajudar a formatar as matrizes.  <br>
<img src="https://miro.medium.com/max/862/1*ntKB23Lp9oitDC-kr-d3uw.png">  <br>
A covariância é uma medida da variabilidade conjunta de duas variáveis ​​aleatórias. Se as variáveis ​​tendem a apresentar comportamento semelhante (por exemplo, os valores mais altos de uma variável correspondem aos valores mais altos da outra variável aleatória), a covariância é positiva. No entanto, se os valores mais altos de uma variável corresponderem aos valores mais baixos da outra variável, a covariância é negativa. O sinal é importante porque indica a tendência na relação linear entre as variáveis.

O seguinte é uma simples matriz de covariância 2x2, onde as variâncias de x e y estão ao longo da diagonal principal, e as covariâncias ocupam a metade superior e inferior das diagonais. A variância de x pode representar a variância da velocidade, enquanto y pode representar a variância da posição.  <br>
<img src="https://miro.medium.com/max/428/1*p7dpXTLzJfhgv7WV19kdeQ.png">  <br>
<img src="https://miro.medium.com/max/650/1*itH940lmAbvvXvQwSQ_bpw.png">  <br>
A variância, tanto positiva quanto negativa, deve nos fornecer o leque de possibilidades dentro da distribuição. Também nos informa a que distância da média poderíamos antecipar uma medida, quase garantindo que nenhum valor sairá do intervalo da média menos/mais a variância.

Para praticar o cálculo de uma matriz de covariância, produzi o código a seguir que resolveria o problema de amostra fornecido nesta palestra, onde o professor Michel van Biezen dá um exemplo de análise da variância e covariância das pontuações dos alunos. As linhas dos dados de entrada representam conjuntos de pontuações dos alunos, com cada coluna agrupada por assunto.

O produto escalar entre a matriz das unidades e a matriz A resultará em uma matriz 5 x 3 onde cada coluna contém o total de todas as notas acumuladas para cada disciplina, que é então dividida pelo número total de testes realizados para cada disciplina, fornecendo essencialmente a nota média de cada disciplina. A média é então subtraída da matriz A, produzindo o desvio.

O produto escalar de A transpõe A produz a matriz de covariância.



In [1]:
import numpy as np

A = np.array([[90, 80, 40],
              [90, 60, 80],
              [60, 50, 70],
              [30, 40, 70],
              [30, 20, 90]])

ones = np.ones([5, 5])
deviation = A - (ones.dot(A) / len(A))
covariance = deviation.T.dot(deviation)

In [2]:
# Initial Values
x = 50
x_dot = 5

# Standard Deviations
x_std = 0.5
x_dot_std = 0.2

# Variance
x_var = x_std ** 2
x_dot_var = x_dot_std ** 2

x_cov_x_dot = x_std * x_dot_std
x_dot_cov_x = x_dot_std * x_std

X = np.array([[x], [x_dot]])
P = np.array([[x_var, x_cov_x_dot],
              [x_dot_cov_x, x_dot_var]])

In [3]:
from numpy.linalg import inv

x_observations = np.array([4000, 4260, 4550, 4860, 5110])
v_observations = np.array([280, 282, 285, 286, 290])

z = np.c_[x_observations, v_observations]

# Initial Conditions
a = 2  # Acceleration
v = 280
t = 1  # Difference in time

# Process / Estimation Errors
error_est_x = 20
error_est_v = 5

# Observation Errors
error_obs_x = 25  # Uncertainty in the measurement
error_obs_v = 6

def prediction2d(x, v, t, a):
    A = np.array([[1, t],
                  [0, 1]])
    X = np.array([[x],
                  [v]])
    B = np.array([[0.5 * t ** 2],
                  [t]])
    X_prime = A.dot(X) + B.dot(a)
    return X_prime


def covariance2d(sigma1, sigma2):
    cov1_2 = sigma1 * sigma2
    cov2_1 = sigma2 * sigma1
    cov_matrix = np.array([[sigma1 ** 2, cov1_2],
                           [cov2_1, sigma2 ** 2]])
    return np.diag(np.diag(cov_matrix))


# Initial Estimation Covariance Matrix
P = covariance2d(error_est_x, error_est_v)
A = np.array([[1, t],
              [0, 1]])

# Initial State Matrix
X = np.array([[z[0][0]],
              [v]])
n = len(z[0])

for data in z[1:]:
    X = prediction2d(X[0][0], X[1][0], t, a)
    # To simplify the problem, professor
    # set off-diagonal terms to 0.
    P = np.diag(np.diag(A.dot(P).dot(A.T)))

    # Calculating the Kalman Gain
    H = np.identity(n)
    R = covariance2d(error_obs_x, error_obs_v)
    S = H.dot(P).dot(H.T) + R
    K = P.dot(H).dot(inv(S))

    # Reshape the new data into the measurement space.
    Y = H.dot(data).reshape(n, -1)

    # Update the State Matrix
    # Combination of the predicted state, measured values, covariance matrix and Kalman Gain
    X = X + K.dot(Y - H.dot(X))

    # Update Process Covariance Matrix
    P = (np.identity(len(K)) - K.dot(H)).dot(P)

print("Kalman Filter State Matrix:\n", X)

Kalman Filter State Matrix:
 [[5127.05898493]
 [ 288.55147059]]
