In [1]:
%%markdown
# Фильтр Калмана
При использовании алгоритма фильтра Калмана [\[1\]](Fundamentals-of-Kalman-Filtering.pdf).
в задачах оценки состояния
системы обычно делаются следующие основные допущения:
1. Линейность: Алгоритм фильтра Калмана предназначен для линейных
динамических систем. Он предполагает, что модель системы (уравнение состояний) и
наблюдений (уравнение наблюдений) являются линейными функциями, а шумы в системе и
наблюдениях являются гауссовскими.

2. Нормальность и независимость шумов: Шумы в системе и наблюдениях $z_{k+1}$ предполагаются
гауссовскими (нормальными) и независимыми друг от друга. Это допущение
позволяет использовать математические свойства нормального распределения при оценке и
обновлении состояния.

3. Известные параметры: Алгоритм фильтра Калмана требует знания матриц
системы (матрицы перехода $A_k$ и матрицы наблюдений $H_k$) и ковариационных матриц шумов
$Q_k$ и $R_k$.

4. Начальные условия: Для запуска алгоритма фильтра Калмана требуется задание
начальных условий - начальной оценки состояния $x_{0|0}$ и начальной ковариационной матрицы
ошибки оценки $P_{0|0}$.

Цикл Калмана представляет собой итеративный процесс, который включает в себя
последовательное выполнение операций предсказания и коррекции для оценки состояния
системы во времени. На рисунке 2.1 [\[2\]](https://www.mathworks.com/help/radar/ug/linear-kalman-filters.html), иллюстрирующем цикл работы фильтра Калмана,
показаны основные этапы этого процесса.

![Рисунок 2.1  Алгоритм фильтра Калмана](kalmanloop.png)

# Фильтр Калмана
При использовании алгоритма фильтра Калмана [\[1\]](Fundamentals-of-Kalman-Filtering.pdf).
в задачах оценки состояния
системы обычно делаются следующие основные допущения:
1. Линейность: Алгоритм фильтра Калмана предназначен для линейных
динамических систем. Он предполагает, что модель системы (уравнение состояний) и
наблюдений (уравнение наблюдений) являются линейными функциями, а шумы в системе и
наблюдениях являются гауссовскими.

2. Нормальность и независимость шумов: Шумы в системе и наблюдениях $z_{k+1}$ предполагаются
гауссовскими (нормальными) и независимыми друг от друга. Это допущение
позволяет использовать математические свойства нормального распределения при оценке и
обновлении состояния.

3. Известные параметры: Алгоритм фильтра Калмана требует знания матриц
системы (матрицы перехода $A_k$ и матрицы наблюдений $H_k$) и ковариационных матриц шумов
$Q_k$ и $R_k$.

4. Начальные условия: Для запуска алгоритма фильтра Калмана требуется задание
начальных условий - начальной оценки состояния $x_{0|0}$ и начальной ковариационной матрицы
ошибки оценки $P_{0|0}$.

Цикл Калмана представляет собой итеративный процесс, который включает в себя
последовательное выполнение операций предсказания и коррекции для оценки состояния
системы во времени. На рисунке 2.1 [\[2\]](https://www.mathworks.com/help/radar/ug/linear-kalman-filters.html), иллюстрирующем цикл работы фильтра Калмана,
показаны основные этапы этого процесса.

![Рисунок 2.1  Алгоритм фильтра Калмана](kalmanloop.png)


In [2]:
%%markdown
# Численное интегрирование дифференциальных уравнений
В этом тексте мы будем моделировать как линейные, так и нелинейные обыкновенные дифференциальные уравнения.
Поскольку, как правило, эти уравнения не имеют решений в замкнутой форме, для решения или моделирования этих уравнений необходимо будет прибегнуть к методам численного интегрирования.
Для решения дифференциальных уравнений существует множество методов численного интегрирования. Начнем с самого простого — интегрирования по Эйлеру[3]
Интегрирование по Эйлеру — это метод численного интегрирования, который подходит для большинства примеров в этом тексте. Рассмотрим дифференциальное уравнение первого порядка вида:
$$
\dot{\boldsymbol{x}}=f(\boldsymbol{x}, t)
$$$$
\dot{\boldsymbol{x}}=f(\boldsymbol{x}, t)
$$
Мы знаем из исчисления, что определение производной функции может быть аппроксимировано выражением
$$
\dot{x}=f(x, t)=\frac{x(t+h)-x(t)}{h}=\frac{x_k-x_{k-1}}{h}
$$
для малого $h$. Перестановка терминов дает
$$
\boldsymbol{x}_k=\boldsymbol{x}_{k-1}+h f(\boldsymbol{x}, t)
$$
Предыдущее уравнение известно как интегрирование по Эйлеру. При интегрировании по Эйлеру значение состояния $x$ на следующем интервале интегрирования $h$ связано с
более ранним значением x плюс член, пропорциональный производной, оцененной в момент времени $t$.
Для каждой рекурсии время увеличивается на интервал интегрирования $h$. Чтобы начать процесс численного интегрирования, нам нужно начальное значение $x$.
Это значение исходит из начальных условий, необходимых для дифференциального уравнения.
Из исчисления мы узнали, что интегрирование функции эквивалентно нахождению площади под функцией при ее построении. Интегрирование по Эйлеру — простейшее приближение,
доступное для вычисления площади под кривой, представленной $f (x, t)$.
Он представляет собой сумму площадей небольших прямоугольников, имеющих высоту $f (x, t)$ и ширину $h$, как это видно на рис. 1.1. Конечно, использование маленьких
прямоугольников для аппроксимации кривой приведет к ошибкам интегрирования, но эти ошибки можно уменьшить, уменьшив ширину каждого из прямоугольников.
Уменьшение ширины прямоугольников эквивалентно уменьшению размера шага интегрирования.
![Рисунок 2.2  Нахождение площади под кривой с помощью метода Эйлера](eulerintegration.jpg)

Размер шага интегрирования h должен быть достаточно мал, чтобы получить ответы с достаточной точностью.
Простой тест, обычно практикуемый среди инженеров, состоит в том, чтобы найти подходящий размер шага интегрирования экспериментальным путем. Как правило, начальный размер шага
выбирается в несколько раз меньше наименьшей постоянной времени в рассматриваемой системе. Затем размер шага уменьшается вдвое, чтобы увидеть, существенно ли
изменились ответы. Если новые ответы примерно одинаковы, используется больший размер шага интегрирования, чтобы избежать чрезмерного времени работы компьютера.
Если ответы существенно меняются, то интервал интегрирования снова уменьшается вдвое и процесс повторяется.

Чтобы увидеть, как метод интегрирования Эйлера можно использовать для решения дифференциального уравнения, давайте составим задачу, для которой
мы знаем решение. Если решение дифференциального уравнения (т. е. мы еще не составили дифференциальное уравнение) для x задается синусоидой
$$
x=\sin \omega t
$$
затем дифференцирование один раз дает
$$
\dot{x}=\omega \cos \omega t
$$
и дифференцирование еще раз дает
$$
\ddot{x}=-\omega^2 \sin \omega t
$$
Учитывая, что последнее уравнение может быть выражено в слагаемых первого, получаем
$$
\ddot{x}=-\omega^2 x
$$
которое представляет собой линейное дифференциальное уравнение второго порядка. Начальные условия для этого дифференциального уравнения можно получить, установив время равным нулю в первых двух уравнениях (т. Е. Для $x$ и производной $x$), что дает
$$
\begin{aligned}
& x(0)=0 \\
& \dot{x}(0)=\omega
\end{aligned}
$$
Опять же, мы заранее знаем, что решение линейного дифференциального уравнения второго порядка с двумя предыдущими начальными условиями просто
$$
x=\sin \omega t
$$
Посмотрим, можно ли получить правильное решение и путем численного интегрирования.
Чтобы проверить предыдущее теоретическое решение в замкнутой форме для $x$, была написана симуляция, включающая численное интегрирование.
Моделирование дифференциального уравнения второго порядка с использованием численного метода интегрирования Эйлера показано в листинге 1.6. Сначала представлено
дифференциальное уравнение второго порядка. Мы находим первую производную от $х$, а затем находим $х$. Затем время увеличивается на интервал интегрирования $h$, и
мы повторяем процесс, пока время не превысит 10 с. Мы распечатываем как теоретические, так и смоделированные (т. е. полученные интегрированием Эйлера)
значения $x$ каждые 0,1 с.

# Численное интегрирование дифференциальных уравнений
В этом тексте мы будем моделировать как линейные, так и нелинейные обыкновенные дифференциальные уравнения.
Поскольку, как правило, эти уравнения не имеют решений в замкнутой форме, для решения или моделирования этих уравнений необходимо будет прибегнуть к методам численного интегрирования.
Для решения дифференциальных уравнений существует множество методов численного интегрирования. Начнем с самого простого — интегрирования по Эйлеру[3]
Интегрирование по Эйлеру — это метод численного интегрирования, который подходит для большинства примеров в этом тексте. Рассмотрим дифференциальное уравнение первого порядка вида:
$$
\dot{\boldsymbol{x}}=f(\boldsymbol{x}, t)
$$$$
\dot{\boldsymbol{x}}=f(\boldsymbol{x}, t)
$$
Мы знаем из исчисления, что определение производной функции может быть аппроксимировано выражением
$$
\dot{x}=f(x, t)=\frac{x(t+h)-x(t)}{h}=\frac{x_k-x_{k-1}}{h}
$$
для малого $h$. Перестановка терминов дает
$$
\boldsymbol{x}_k=\boldsymbol{x}_{k-1}+h f(\boldsymbol{x}, t)
$$
Предыдущее уравнение известно как интегрирование по Эйлеру. При интегрировании по Эйлеру значение состояния $x$ на следующем интервале интегрирования $h$ связано с
более ранним значением x плюс член, пропорциональный производной, оцененной в момент времени $t$.
Для каждой рекурсии время увеличивается на интервал интегрирования $h$. Чтобы начать процесс численного интегрирования, нам нужно начальное значение $x$.
Это значение исходит из начальных условий, необходимых для дифференциального уравнения.
Из исчисления мы узнали, что интегрирование функции эквивалентно нахождению площади под функцией при ее построении. Интегрирование по Эйлеру — простейшее приближение,
доступное для вычисления площади под кривой, представленной $f (x, t)$.
Он представляет собой сумму площадей небольших прямоугольников, имеющих высоту $f (x, t)$ и ширину $h$, как это видно на рис. 1.1. Конечно, использование маленьких
прямоугольников для аппроксимации кривой приведет к ошибкам интегрирования, но эти ошибки можно уменьшить, уменьшив ширину каждого из прямоугольников.
Уменьшение ширины прямоугольников эквивалентно уменьшению размера шага интегрирования.
![Рисунок 2.2  Нахождение площади под кривой с помощью метода Эйлера](eulerintegration.jpg)

Размер шага интегрирования h должен быть достаточно мал, чтобы получить ответы с достаточной точностью.
Простой тест, обычно практикуемый среди инженеров, состоит в том, чтобы найти подходящий размер шага интегрирования экспериментальным путем. Как правило, начальный размер шага
выбирается в несколько раз меньше наименьшей постоянной времени в рассматриваемой системе. Затем размер шага уменьшается вдвое, чтобы увидеть, существенно ли
изменились ответы. Если новые ответы примерно одинаковы, используется больший размер шага интегрирования, чтобы избежать чрезмерного времени работы компьютера.
Если ответы существенно меняются, то интервал интегрирования снова уменьшается вдвое и процесс повторяется.

Чтобы увидеть, как метод интегрирования Эйлера можно использовать для решения дифференциального уравнения, давайте составим задачу, для которой
мы знаем решение. Если решение дифференциального уравнения (т. е. мы еще не составили дифференциальное уравнение) для x задается синусоидой
$$
x=\sin \omega t
$$
затем дифференцирование один раз дает
$$
\dot{x}=\omega \cos \omega t
$$
и дифференцирование еще раз дает
$$
\ddot{x}=-\omega^2 \sin \omega t
$$
Учитывая, что последнее уравнение может быть выражено в слагаемых первого, получаем
$$
\ddot{x}=-\omega^2 x
$$
которое представляет собой линейное дифференциальное уравнение второго порядка. Начальные условия для этого дифференциального уравнения можно получить, установив время равным нулю в первых двух уравнениях (т. Е. Для $x$ и производной $x$), что дает
$$
\begin{aligned}
& x(0)=0 \\
& \dot{x}(0)=\omega
\end{aligned}
$$
Опять же, мы заранее знаем, что решение линейного дифференциального уравнения второго порядка с двумя предыдущими начальными условиями просто
$$
x=\sin \omega t
$$
Посмотрим, можно ли получить правильное решение и путем численного интегрирования.
Чтобы проверить предыдущее теоретическое решение в замкнутой форме для $x$, была написана симуляция, включающая численное интегрирование.
Моделирование дифференциального уравнения второго порядка с использованием численного метода интегрирования Эйлера показано в листинге 1.6. Сначала представлено
дифференциальное уравнение второго порядка. Мы находим первую производную от $х$, а затем находим $х$. Затем время увеличивается на интервал интегрирования $h$, и
мы повторяем процесс, пока время не превысит 10 с. Мы распечатываем как теоретические, так и смоделированные (т. е. полученные интегрированием Эйлера)
значения $x$ каждые 0,1 с.


In [3]:
%%markdown
# Пространство состояний
Часто в этом тексте мы будем помещать линейные дифференциальные уравнения в форму пространства состояний,
потому что это потребуется для постановки задачи калмановской фильтрации. С помощью обозначения в пространстве состояний мы говорим, что любой набор линейных дифференциальных уравнений
можно представить в виде матричного дифференциального уравнения первого порядка.
$$
\dot{x}=F x+G u+w
$$
где $x$ известен как вектор состояния системы, $F$ — матрица динамики системы, $u$ — детерминированный вход, иногда называемый вектором управления, а $w$ — функция случайного воздействия,
также известная как шум процесса.
В предыдущем разделе у нас был белый шум, поступающий в фильтр нижних частот. Дифференциальное уравнение, описывающее процесс, имело вид
$$
\dot{y}=\frac{(x-y)}{T}
$$
где $y$ — интересующая выходная величина, а $x$ — входной сигнал белого шума. Изменив обозначение предыдущего уравнения, чтобы избежать путаницы, мы получаем
$$
\dot{x}=\frac{(n-x)}{T}
$$
где $x$ представляет как состояние системы, так и выходные данные для этого примера,
а $n$ представляет входной сигнал белого шума. Если бы предыдущее уравнение было представлено в форме пространства состояний, все соответствующие матрицы были бы скалярами со значениями
$$
\begin{aligned}
\boldsymbol{F} & =-\frac{1}{T} \\
\boldsymbol{G} & =0 \\
\boldsymbol{w} & =\frac{n}{T}
\end{aligned}
$$
В качестве другого примера рассмотрим дифференциальное уравнение второго порядка без каких-либо случайных входных данных.
$$
\ddot{y}+2 \dot{y}+3 y=4
$$
Во-первых, мы перепишем предыдущее уравнение в терминах его старшей производной
$$
\ddot{y}=-2 \dot{y}-3 y+4
$$
который может быть выражен как
$$
\left[\begin{array}{l}
\dot{y} \\
\ddot{y}
\end{array}\right]=\left[\begin{array}{cc}
0 & 1 \\
-3 & -2
\end{array}\right]\left[\begin{array}{l}
y \\
\dot{y}
\end{array}\right]+\left[\begin{array}{l}
0 \\
1
\end{array}\right] 4
$$
В этом случае соответствующие матрицы в пространстве состояний будут
$$
\begin{aligned}
\boldsymbol{x} & =\left[\begin{array}{l}
y \\
\dot{y}
\end{array}\right] \\
\boldsymbol{F} & =\left[\begin{array}{cc}
0 & 1 \\
-3 & -2
\end{array}\right] \\
\boldsymbol{G} & =\left[\begin{array}{l}
0 \\
1
\end{array}\right] \\
\boldsymbol{u} & =4 \\
\boldsymbol{w} & =\left[\begin{array}{l}
0 \\
0
\end{array}\right]
\end{aligned}
$$

# Пространство состояний
Часто в этом тексте мы будем помещать линейные дифференциальные уравнения в форму пространства состояний,
потому что это потребуется для постановки задачи калмановской фильтрации. С помощью обозначения в пространстве состояний мы говорим, что любой набор линейных дифференциальных уравнений
можно представить в виде матричного дифференциального уравнения первого порядка.
$$
\dot{x}=F x+G u+w
$$
где $x$ известен как вектор состояния системы, $F$ — матрица динамики системы, $u$ — детерминированный вход, иногда называемый вектором управления, а $w$ — функция случайного воздействия,
также известная как шум процесса.
В предыдущем разделе у нас был белый шум, поступающий в фильтр нижних частот. Дифференциальное уравнение, описывающее процесс, имело вид
$$
\dot{y}=\frac{(x-y)}{T}
$$
где $y$ — интересующая выходная величина, а $x$ — входной сигнал белого шума. Изменив обозначение предыдущего уравнения, чтобы избежать путаницы, мы получаем
$$
\dot{x}=\frac{(n-x)}{T}
$$
где $x$ представляет как состояние системы, так и выходные данные для этого примера,
а $n$ представляет входной сигнал белого шума. Если бы предыдущее уравнение было представлено в форме пространства состояний, все соответствующие матрицы были бы скалярами со значениями
$$
\begin{aligned}
\boldsymbol{F} & =-\frac{1}{T} \\
\boldsymbol{G} & =0 \\
\boldsymbol{w} & =\frac{n}{T}
\end{aligned}
$$
В качестве другого примера рассмотрим дифференциальное уравнение второго порядка без каких-либо случайных входных данных.
$$
\ddot{y}+2 \dot{y}+3 y=4
$$
Во-первых, мы перепишем предыдущее уравнение в терминах его старшей производной
$$
\ddot{y}=-2 \dot{y}-3 y+4
$$
который может быть выражен как
$$
\left[\begin{array}{l}
\dot{y} \\
\ddot{y}
\end{array}\right]=\left[\begin{array}{cc}
0 & 1 \\
-3 & -2
\end{array}\right]\left[\begin{array}{l}
y \\
\dot{y}
\end{array}\right]+\left[\begin{array}{l}
0 \\
1
\end{array}\right] 4
$$
В этом случае соответствующие матрицы в пространстве состояний будут
$$
\begin{aligned}
\boldsymbol{x} & =\left[\begin{array}{l}
y \\
\dot{y}
\end{array}\right] \\
\boldsymbol{F} & =\left[\begin{array}{cc}
0 & 1 \\
-3 & -2
\end{array}\right] \\
\boldsymbol{G} & =\left[\begin{array}{l}
0 \\
1
\end{array}\right] \\
\boldsymbol{u} & =4 \\
\boldsymbol{w} & =\left[\begin{array}{l}
0 \\
0
\end{array}\right]
\end{aligned}
$$


In [4]:
%%markdown
# Фундаментальная матрица
Если у нас есть уравнение, выраженное в форме пространства состояний как
$$
\dot{\boldsymbol{x}}=\boldsymbol{F} \boldsymbol{x}
$$
где матрица системной динамики $F$ не зависит от времени, то мы можем сказать, что существует переходная или фундаментальная матрица $Φ$, которую можно использовать для точного распространения состояния вперед от любого момента времени $t_0$ до момента времени $t$ в соответствии с
$$
\boldsymbol{x}(t)=\Phi\left(t-t_0\right) x\left(t_0\right)
$$
Два простых способа найти фундаментальную матрицу для инвариантных во времени систем — это преобразование Лапласа и разложение в ряд Тейлора. Для метода преобразования Лапласа мы используем
$$
\Phi(t)=\mathfrak{L}^{-1}\left[(s I-F)^{-1}\right]
$$
где $\mathfrak{L}^{-1}$ обозначает обратное преобразование Лапласа. Также можно использовать разложение в ряд Тейлора для фундаментальной матрицы, что дает
$$
\Phi(t)=\mathrm{e}^{F t}=\boldsymbol{I}+\boldsymbol{F} t+\frac{(\boldsymbol{F} t)^2}{2 !}+\cdots+\frac{(\boldsymbol{F} t)^n}{n !}+\cdots
$$
Имея Φ(t), мы можем найти Φ(t − t0), просто заменой t на t − t0
Мы уже показали в разделе о численном интегрировании, что решение дифференциального уравнения
$$
\ddot{x}=-\omega^2 x
$$
было
$$
x=\sin \omega t
$$
Используя исчисление, мы можем видеть, что производная решения дается выражением
$$
\dot{x}=\omega \cos \omega t
$$
Если мы перепишем исходное дифференциальное уравнение второго порядка в форме пространства состояний, мы получим
$$
\left[\begin{array}{c}
\dot{x} \\
\ddot{x}
\end{array}\right]=\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right]\left[\begin{array}{l}
x \\
\dot{x}
\end{array}\right]
$$
Таким образом, матрица системной динамики имеет вид
$$
\boldsymbol{F}=\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right]
$$
Мы уже заявили, что для стационарной матрицы системной динамики мы можем получить фундаментальную матрицу в соответствии с
$$
\Phi(t)=\mathscr{L}^{-1}\left[(s \boldsymbol{I}-\boldsymbol{F})^{-1}\right]
$$
где $I$ — единичная матрица. Подставляя соответствующие матрицы, мы сначала выражаем обратную $sI −F$ как
$$
(\boldsymbol{s} \boldsymbol{I}-\boldsymbol{F})^{-1}=\left[\begin{array}{cc}
s & -1 \\
\omega^2 & s
\end{array}\right]^{-1}
$$
Обратную матрицу 2 × 2 можно легко сделать путем проверки с использованием формул, представленных в этой главе, и легко показать, что
$$
\Phi(s)=(s \boldsymbol{I}-\boldsymbol{F})^{-1}=\frac{1}{s^2+\omega^2}\left[\begin{array}{cc}
s & 1 \\
-\omega^2 & 0
\end{array}\right]
$$
Теперь у нас есть фундаментальная матрица в преобразовании Лапласа или $σ$-области. Мы должны использовать обратное преобразование Лапласа, чтобы выразить фундаментальную матрицу
как функцию времени. Использование таблиц обратного преобразования Лапласа дает фундаментальную матрицу во временной области как
$$
\Phi(t)=\left[\begin{array}{cc}
\cos \omega t & \frac{\sin \omega t}{\omega} \\
-\omega \sin \omega t & \cos \omega t
\end{array}\right]
$$
Прежде чем использовать другой метод для получения фундаментальной матрицы, давайте проверим правильность решения. Для нашего примера задачи мы знаем,
что начальные условия для линейного дифференциального уравнения второго порядка задаются формулой
$$
\begin{gathered}
x(0)=\sin \omega(0)=0 \\
\dot{x}(0)=\omega \cos \omega(0)=\omega
\end{gathered}
$$
Потому что
$$
\boldsymbol{x}(t)=\Phi\left(t-t_0\right) \boldsymbol{x}\left(t_0\right)
$$
мы также можем сказать, что
$$
x(t)=\Phi(t) x(0)
$$
Проверим предыдущее утверждение подстановкой
$$
\begin{aligned}
{\left[\begin{array}{l}
x(t) \\
\dot{x}(t)
\end{array}\right] } & =\left[\begin{array}{cc}
\cos \omega t & \frac{\sin \omega t}{\omega} \\
\omega \sin \omega t & \cos \omega t
\end{array}\right]\left[\begin{array}{l}
x(0) \\
\dot{x}(0)
\end{array}\right] \\
& =\left[\begin{array}{cc}
\cos \omega t & \frac{\sin \omega t}{\omega} \\
\omega \sin \omega t & \cos \omega t
\end{array}\right]\left[\begin{array}{l}
0 \\
\omega
\end{array}\right]=\left[\begin{array}{c}
\sin \omega t \\
\omega \cos \omega t
\end{array}\right]
\end{aligned}
$$
Предыдущее утверждение говорит, что
$$
\begin{aligned}
& x(t)=\sin \omega t \\
& \dot{x}(t)=\omega \cos \omega t
\end{aligned}
$$
что правильно. Другими словами, когда у нас есть фундаментальная матрица, нам не нужно интегрировать дифференциальные уравнения для распространения состояний вперед.
Мы можем распространять состояния вперед путем умножения матриц. В фильтрации Калмана мы должны распространять оценки состояния вперед на один период выборки.
Если у нас есть точное выражение для фундаментальной матрицы, мы сможем выполнить распространение по матрице умножения.
Когда точная фундаментальная матрица недоступна, нам придется прибегнуть к численному интегрированию, чтобы опережать оценки состояния.
Чтобы проиллюстрировать, что такой же ответ для фундаментальной матрицы можно было бы получить и путем разложения в ряд Тейлора, вспомним,
что матрица системной динамики задавалась выражением
$$
\boldsymbol{F}=\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right]
$$
Следовательно, мы можем найти
$$
\begin{aligned}
\boldsymbol{F}^2 & =\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right]\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right]=\left[\begin{array}{cc}
-\omega^2 & 0 \\
0 & -\omega^2
\end{array}\right] \\
\boldsymbol{F}^3 & =\left[\begin{array}{cc}
-\omega^2 & 0 \\
0 & -\omega^2
\end{array}\right]\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right]=\left[\begin{array}{cc}
0 & -\omega^2 \\
\omega^4 & 0
\end{array}\right] \\
\boldsymbol{F}^4 & =\left[\begin{array}{cc}
0 & -\omega^2 \\
\omega^4 & 0
\end{array}\right]\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right]=\left[\begin{array}{cc}
\omega^4 & 0 \\
0 & \omega^4
\end{array}\right] \\
\boldsymbol{F}^5 & =\left[\begin{array}{cc}
\omega^4 & 0 \\
0 & \omega^4
\end{array}\right]\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right]=\left[\begin{array}{cc}
0 & \omega^4 \\
-\omega^6 & 0
\end{array}\right] \\
\boldsymbol{F}^6 & =\left[\begin{array}{cc}
0 & \omega^4 \\
-\omega^6 & 0
\end{array}\right]\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right]=\left[\begin{array}{cc}
-\omega^6 & 0 \\
0 & -\omega^6
\end{array}\right]
\end{aligned}
$$
Если мы урежем разложение в ряд Тейлора для фундаментальную матрицу из шести членов, мы получаем
$$
\Phi(t)=\mathrm{e}^{F t} \approx \boldsymbol{I}+\boldsymbol{F} t+\frac{(\boldsymbol{F} t)^2}{2 !}+\frac{(\boldsymbol{F} t)^3}{3 !}+\frac{(\boldsymbol{F} t)^4}{4 !}+\frac{(\boldsymbol{F} t)^5}{5 !}+\frac{(\boldsymbol{F} t)^6}{6 !}
$$
или
$$
\begin{aligned}
\Phi(t) \approx & {\left[\begin{array}{ll}
1 & 0 \\
0 & 1
\end{array}\right]+\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right] t+\left[\begin{array}{cc}
-\omega^2 & 0 \\
0 & -\omega^2
\end{array}\right] \frac{t^2}{2}+\left[\begin{array}{cc}
0 & -\omega^2 \\
\omega^4 & 0
\end{array}\right] \frac{t^3}{6} } \\
& +\left[\begin{array}{cc}
\omega^4 & 0 \\
0 & \omega^4
\end{array}\right] \frac{t^4}{24}+\left[\begin{array}{cc}
0 & \omega^4 \\
-\omega^6 & 0
\end{array}\right] \frac{t^5}{120}+\left[\begin{array}{cc}
-\omega^6 & 0 \\
0 & -\omega^6
\end{array}\right] \frac{t^6}{720}
\end{aligned}
$$
Выполнение необходимых сложений и вычитаний и объединение терминов дает
$$
\Phi(t) \approx\left[\begin{array}{cc}
1-\frac{\omega^2 t^2}{2}+\frac{\omega^4 t^4}{24}-\frac{\omega^6 t^6}{720} & t-\frac{\omega^2 t^3}{6}+\frac{\omega^4 t^5}{120} \\
-\omega^2 t+\frac{\omega^4 t^3}{6}-\frac{\omega^6 t^5}{120} & 1-\frac{\omega^2 t^2}{2}+\frac{\omega^4 t^4}{24}-\frac{\omega^6 t^6}{720}
\end{array}\right]
$$
Узнав, что тригонометрический ряд Тейлора расширения даются
$$
\begin{aligned}
& \sin \omega t \approx \omega t-\frac{\omega^3 t^3}{3 !}+\frac{\omega^5 t^5}{5 !}-\cdots \\
& \cos \omega t \approx 1-\frac{\omega^2 t^2}{2 !}+\frac{\omega^4 t^4}{4 !}-\frac{\omega^6 t^6}{6 !}+\cdots
\end{aligned}
$$
мы получаем более компактную форму для фундаментальной матрицы как
$$
\Phi(t)=\left[\begin{array}{cc}
\cos \omega t & \frac{\sin \omega t}{\omega} \\
-\omega \sin \omega t & \cos \omega t
\end{array}\right]
$$
Предыдущее выражение является тем же ответом, который был
полученный методом преобразования Лапласа.
Строго говоря, подход ряда Тейлора к нахождению фундаментальной матрицы применяется только тогда, когда матрица системной динамики не зависит от времени.
Однако в практических задачах, где матрица системной динамики изменяется во времени, часто предполагается, что матрица системной динамики приблизительно постоянна в
интересующей области (т. Е. Время между выборками), и по-прежнему используется подход ряда Тейлора.



# Фундаментальная матрица
Если у нас есть уравнение, выраженное в форме пространства состояний как
$$
\dot{\boldsymbol{x}}=\boldsymbol{F} \boldsymbol{x}
$$
где матрица системной динамики $F$ не зависит от времени, то мы можем сказать, что существует переходная или фундаментальная матрица $Φ$, которую можно использовать для точного распространения состояния вперед от любого момента времени $t_0$ до момента времени $t$ в соответствии с
$$
\boldsymbol{x}(t)=\Phi\left(t-t_0\right) x\left(t_0\right)
$$
Два простых способа найти фундаментальную матрицу для инвариантных во времени систем — это преобразование Лапласа и разложение в ряд Тейлора. Для метода преобразования Лапласа мы используем
$$
\Phi(t)=\mathfrak{L}^{-1}\left[(s I-F)^{-1}\right]
$$
где $\mathfrak{L}^{-1}$ обозначает обратное преобразование Лапласа. Также можно использовать разложение в ряд Тейлора для фундаментальной матрицы, что дает
$$
\Phi(t)=\mathrm{e}^{F t}=\boldsymbol{I}+\boldsymbol{F} t+\frac{(\boldsymbol{F} t)^2}{2 !}+\cdots+\frac{(\boldsymbol{F} t)^n}{n !}+\cdots
$$
Имея Φ(t), мы можем найти Φ(t − t0), просто заменой t на t − t0
Мы уже показали в разделе о численном интегрировании, что решение дифференциального уравнения
$$
\ddot{x}=-\omega^2 x
$$
было
$$
x=\sin \omega t
$$
Используя исчисление, мы можем видеть, что производная решения дается выражением
$$
\dot{x}=\omega \cos \omega t
$$
Если мы перепишем исходное дифференциальное уравнение второго порядка в форме пространства состояний, мы получим
$$
\left[\begin{array}{c}
\dot{x} \\
\ddot{x}
\end{array}\right]=\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right]\left[\begin{array}{l}
x \\
\dot{x}
\end{array}\right]
$$
Таким образом, матрица системной динамики имеет вид
$$
\boldsymbol{F}=\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right]
$$
Мы уже заявили, что для стационарной матрицы системной динамики мы можем получить фундаментальную матрицу в соответствии с
$$
\Phi(t)=\mathscr{L}^{-1}\left[(s \boldsymbol{I}-\boldsymbol{F})^{-1}\right]
$$
где $I$ — единичная матрица. Подставляя соответствующие матрицы, мы сначала выражаем обратную $sI −F$ как
$$
(\boldsymbol{s} \boldsymbol{I}-\boldsymbol{F})^{-1}=\left[\begin{array}{cc}
s & -1 \\
\omega^2 & s
\end{array}\right]^{-1}
$$
Обратную матрицу 2 × 2 можно легко сделать путем проверки с использованием формул, представленных в этой главе, и легко показать, что
$$
\Phi(s)=(s \boldsymbol{I}-\boldsymbol{F})^{-1}=\frac{1}{s^2+\omega^2}\left[\begin{array}{cc}
s & 1 \\
-\omega^2 & 0
\end{array}\right]
$$
Теперь у нас есть фундаментальная матрица в преобразовании Лапласа или $σ$-области. Мы должны использовать обратное преобразование Лапласа, чтобы выразить фундаментальную матрицу
как функцию времени. Использование таблиц обратного преобразования Лапласа дает фундаментальную матрицу во временной области как
$$
\Phi(t)=\left[\begin{array}{cc}
\cos \omega t & \frac{\sin \omega t}{\omega} \\
-\omega \sin \omega t & \cos \omega t
\end{array}\right]
$$
Прежде чем использовать другой метод для получения фундаментальной матрицы, давайте проверим правильность решения. Для нашего примера задачи мы знаем,
что начальные условия для линейного дифференциального уравнения второго порядка задаются формулой
$$
\begin{gathered}
x(0)=\sin \omega(0)=0 \\
\dot{x}(0)=\omega \cos \omega(0)=\omega
\end{gathered}
$$
Потому что
$$
\boldsymbol{x}(t)=\Phi\left(t-t_0\right) \boldsymbol{x}\left(t_0\right)
$$
мы также можем сказать, что
$$
x(t)=\Phi(t) x(0)
$$
Проверим предыдущее утверждение подстановкой
$$
\begin{aligned}
{\left[\begin{array}{l}
x(t) \\
\dot{x}(t)
\end{array}\right] } & =\left[\begin{array}{cc}
\cos \omega t & \frac{\sin \omega t}{\omega} \\
\omega \sin \omega t & \cos \omega t
\end{array}\right]\left[\begin{array}{l}
x(0) \\
\dot{x}(0)
\end{array}\right] \\
& =\left[\begin{array}{cc}
\cos \omega t & \frac{\sin \omega t}{\omega} \\
\omega \sin \omega t & \cos \omega t
\end{array}\right]\left[\begin{array}{l}
0 \\
\omega
\end{array}\right]=\left[\begin{array}{c}
\sin \omega t \\
\omega \cos \omega t
\end{array}\right]
\end{aligned}
$$
Предыдущее утверждение говорит, что
$$
\begin{aligned}
& x(t)=\sin \omega t \\
& \dot{x}(t)=\omega \cos \omega t
\end{aligned}
$$
что правильно. Другими словами, когда у нас есть фундаментальная матрица, нам не нужно интегрировать дифференциальные уравнения для распространения состояний вперед.
Мы можем распространять состояния вперед путем умножения матриц. В фильтрации Калмана мы должны распространять оценки состояния вперед на один период выборки.
Если у нас есть точное выражение для фундаментальной матрицы, мы сможем выполнить распространение по матрице умножения.
Когда точная фундаментальная матрица недоступна, нам придется прибегнуть к численному интегрированию, чтобы опережать оценки состояния.
Чтобы проиллюстрировать, что такой же ответ для фундаментальной матрицы можно было бы получить и путем разложения в ряд Тейлора, вспомним,
что матрица системной динамики задавалась выражением
$$
\boldsymbol{F}=\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right]
$$
Следовательно, мы можем найти
$$
\begin{aligned}
\boldsymbol{F}^2 & =\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right]\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right]=\left[\begin{array}{cc}
-\omega^2 & 0 \\
0 & -\omega^2
\end{array}\right] \\
\boldsymbol{F}^3 & =\left[\begin{array}{cc}
-\omega^2 & 0 \\
0 & -\omega^2
\end{array}\right]\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right]=\left[\begin{array}{cc}
0 & -\omega^2 \\
\omega^4 & 0
\end{array}\right] \\
\boldsymbol{F}^4 & =\left[\begin{array}{cc}
0 & -\omega^2 \\
\omega^4 & 0
\end{array}\right]\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right]=\left[\begin{array}{cc}
\omega^4 & 0 \\
0 & \omega^4
\end{array}\right] \\
\boldsymbol{F}^5 & =\left[\begin{array}{cc}
\omega^4 & 0 \\
0 & \omega^4
\end{array}\right]\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right]=\left[\begin{array}{cc}
0 & \omega^4 \\
-\omega^6 & 0
\end{array}\right] \\
\boldsymbol{F}^6 & =\left[\begin{array}{cc}
0 & \omega^4 \\
-\omega^6 & 0
\end{array}\right]\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right]=\left[\begin{array}{cc}
-\omega^6 & 0 \\
0 & -\omega^6
\end{array}\right]
\end{aligned}
$$
Если мы урежем разложение в ряд Тейлора для фундаментальную матрицу из шести членов, мы получаем
$$
\Phi(t)=\mathrm{e}^{F t} \approx \boldsymbol{I}+\boldsymbol{F} t+\frac{(\boldsymbol{F} t)^2}{2 !}+\frac{(\boldsymbol{F} t)^3}{3 !}+\frac{(\boldsymbol{F} t)^4}{4 !}+\frac{(\boldsymbol{F} t)^5}{5 !}+\frac{(\boldsymbol{F} t)^6}{6 !}
$$
или
$$
\begin{aligned}
\Phi(t) \approx & {\left[\begin{array}{ll}
1 & 0 \\
0 & 1
\end{array}\right]+\left[\begin{array}{cc}
0 & 1 \\
-\omega^2 & 0
\end{array}\right] t+\left[\begin{array}{cc}
-\omega^2 & 0 \\
0 & -\omega^2
\end{array}\right] \frac{t^2}{2}+\left[\begin{array}{cc}
0 & -\omega^2 \\
\omega^4 & 0
\end{array}\right] \frac{t^3}{6} } \\
& +\left[\begin{array}{cc}
\omega^4 & 0 \\
0 & \omega^4
\end{array}\right] \frac{t^4}{24}+\left[\begin{array}{cc}
0 & \omega^4 \\
-\omega^6 & 0
\end{array}\right] \frac{t^5}{120}+\left[\begin{array}{cc}
-\omega^6 & 0 \\
0 & -\omega^6
\end{array}\right] \frac{t^6}{720}
\end{aligned}
$$
Выполнение необходимых сложений и вычитаний и объединение терминов дает
$$
\Phi(t) \approx\left[\begin{array}{cc}
1-\frac{\omega^2 t^2}{2}+\frac{\omega^4 t^4}{24}-\frac{\omega^6 t^6}{720} & t-\frac{\omega^2 t^3}{6}+\frac{\omega^4 t^5}{120} \\
-\omega^2 t+\frac{\omega^4 t^3}{6}-\frac{\omega^6 t^5}{120} & 1-\frac{\omega^2 t^2}{2}+\frac{\omega^4 t^4}{24}-\frac{\omega^6 t^6}{720}
\end{array}\right]
$$
Узнав, что тригонометрический ряд Тейлора расширения даются
$$
\begin{aligned}
& \sin \omega t \approx \omega t-\frac{\omega^3 t^3}{3 !}+\frac{\omega^5 t^5}{5 !}-\cdots \\
& \cos \omega t \approx 1-\frac{\omega^2 t^2}{2 !}+\frac{\omega^4 t^4}{4 !}-\frac{\omega^6 t^6}{6 !}+\cdots
\end{aligned}
$$
мы получаем более компактную форму для фундаментальной матрицы как
$$
\Phi(t)=\left[\begin{array}{cc}
\cos \omega t & \frac{\sin \omega t}{\omega} \\
-\omega \sin \omega t & \cos \omega t
\end{array}\right]
$$
Предыдущее выражение является тем же ответом, который был
полученный методом преобразования Лапласа.
Строго говоря, подход ряда Тейлора к нахождению фундаментальной матрицы применяется только тогда, когда матрица системной динамики не зависит от времени.
Однако в практических задачах, где матрица системной динамики изменяется во времени, часто предполагается, что матрица системной динамики приблизительно постоянна в
интересующей области (т. Е. Время между выборками), и по-прежнему используется подход ряда Тейлора.



In [5]:
%%markdown
Чтобы применить теорию фильтрации Калмана, наша модель реального мира должна быть описана набором дифференциальных уравнений. Эти уравнения должны быть приведены в матричной форме или в
форме пространства состояний как:
$$
\dot{x}=A x+B u+w
$$
где $x$ — вектор-столбец с состояниями системы, $A$ – матрица динамики системы, $u$ – известная вектор, который иногда называют вектором управления,
$w$ — белый шум, который также выражается как вектор. Существует матрица шума процесса $Q$, которая связана к вектору шума процесса согласно
$$
Q=E\left[w w^T\right]
$$
Мы также увидим, что, хотя шум процесса может и не всегда имеют физический смысл, иногда его используют как
устройство для сообщения фильтру, что мы знаем модель описания реального мира не точна. Фильтр Калмана формулировка требует, чтобы измерения были связанны линейно вектором состояния системы
в соответствии с
$$
z=H x+v
$$
где $z$ — вектор измерения, $H$ — матрица измерения, а $v$ — белый гауссовский шум измерения, который также выражается вектором. Матрица шумов измерения $R$ связана с
вектор шума измерения $v$ согласно
$$
R=E\left[v v^T\right]
$$
Предшествующие cотношения должны быть дискретизированы что-бы можно было построить дискретный фильтр Калмана.
Если мы проводим измерения каждые $T_s$ секунд, нам сначала нужно найти фундаментальную матрицу $Φ$. Для стационарной системы фундаментальная матрица может быть найдена из матрицы динамики системы в соответствии с
$$
\Phi(t)=\mathscr{L}^{-1}\left[(s \boldsymbol{I}-\boldsymbol{F})^{-1}\right]
$$
где $I$ — единичная матрица, $\mathscr{L}^{-1}$ — обратное преобразование Лапласа, $F$ — матрица системной динамики.
Обычно обратные преобразования Лапласа можно найти в таблицах инженерных справочников. Еще один способ найти фундаментальную матрицу — вычислить разложение в ряд Тейлора:
$$
\Phi(t)=e^{\boldsymbol{F} t}=\boldsymbol{I}+\boldsymbol{F} t+\frac{(\boldsymbol{F} t)^2}{2 !}+\cdots+\frac{(\boldsymbol{F} t)^n}{n !}+\cdots
$$
Дискретную основную матрицу или матрицу перехода можно легко найти, вычислив основную матрицу в момент дискретизации $Ts$ или
$$
\Phi_k=\Phi\left(T_s\right)
$$
Дискретная форма измерения калмановской фильтрации уравнение становится
$$
z_k=\boldsymbol{H} x_k+v_k
$$
и
$$
\boldsymbol{R}_k=E\left(\boldsymbol{v}_k \boldsymbol{v}_k^T\right)
$$
где $R_k$ — матрица, состоящая из дисперсий каждого источников шума измерения. В случае полиномиальные фильтры Калмана, $R_k$ — скаляр. Результирующий Уравнение фильтрации Калмана имеет вид:
$$
\hat{\boldsymbol{x}}_k=\Phi_k \hat{x}_{k-1}+\boldsymbol{G}_k \boldsymbol{u}_{k-1}+\boldsymbol{K}_k\left(z_k-\boldsymbol{H} \Phi_k \hat{\boldsymbol{x}}_{k-1}-\boldsymbol{H} \boldsymbol{G}_k \boldsymbol{u}_{k-1}\right)
$$
где $K_k$ представляет собой матрицу усиления Калмана, а $G_k$ представляет собой получен из
$$
\boldsymbol{G}_k=\int_0^{T_s} \Phi(\tau) \boldsymbol{G} \mathrm{d} \tau
$$
если $u_{k−1}$ предполагается постоянным между выборкой мгновения. Усиления Калмана вычисляются, а фильтр работает, из матричных уравнений Риккати.
Уравнения Риккати представляют собой набор рекурсивных матричных уравнений, заданных формулой:
$$
\begin{gathered}
\boldsymbol{M}_k=\Phi_k \boldsymbol{P}_{k-1} \Phi_k^T+\boldsymbol{Q}_k \\
\boldsymbol{K}_k=\boldsymbol{M}_k \boldsymbol{H}^T\left(\boldsymbol{H} \boldsymbol{M}_k \boldsymbol{H}^T+\boldsymbol{R}_k\right)^{-1} \\
\boldsymbol{P}_k=\left(\boldsymbol{I}-\boldsymbol{K}_k \boldsymbol{H}\right) \boldsymbol{M}_k
\end{gathered}
$$
где $P_k$ — ковариационная матрица, представляющая ошибки в оценках состояния (т. е. дисперсия истинности минус оценка) после обновления,
а $M_k$ — ковариационная матрица, представляющая ошибки в оценках состояния до обновления.
Дискретная матрица технологического шума $Q_k$ может быть найдена из непрерывной матрицы технологического шума $Q$ и основной матрицы согласно формуле
$$
\boldsymbol{Q}_k=\int_0^{T_s} \Phi(\tau) \boldsymbol{Q} \Phi^T(\tau) \mathrm{d} t
$$
Чтобы начать уравнения Риккати, нам нужна начальная ковариационная матрица $P_0$

Чтобы применить теорию фильтрации Калмана, наша модель реального мира должна быть описана набором дифференциальных уравнений. Эти уравнения должны быть приведены в матричной форме или в
форме пространства состояний как:
$$
\dot{x}=A x+B u+w
$$
где $x$ — вектор-столбец с состояниями системы, $A$ – матрица динамики системы, $u$ – известная вектор, который иногда называют вектором управления,
$w$ — белый шум, который также выражается как вектор. Существует матрица шума процесса $Q$, которая связана к вектору шума процесса согласно
$$
Q=E\left[w w^T\right]
$$
Мы также увидим, что, хотя шум процесса может и не всегда имеют физический смысл, иногда его используют как
устройство для сообщения фильтру, что мы знаем модель описания реального мира не точна. Фильтр Калмана формулировка требует, чтобы измерения были связанны линейно вектором состояния системы
в соответствии с
$$
z=H x+v
$$
где $z$ — вектор измерения, $H$ — матрица измерения, а $v$ — белый гауссовский шум измерения, который также выражается вектором. Матрица шумов измерения $R$ связана с
вектор шума измерения $v$ согласно
$$
R=E\left[v v^T\right]
$$
Предшествующие cотношения должны быть дискретизированы что-бы можно было построить дискретный фильтр Калмана.
Если мы проводим измерения каждые $T_s$ секунд, нам сначала нужно найти фундаментальную матрицу $Φ$. Для стационарной системы фундаментальная матрица может быть найдена из матрицы динамики системы в соответствии с
$$
\Phi(t)=\mathscr{L}^{-1}\left[(s \boldsymbol{I}-\boldsymbol{F})^{-1}\right]
$$
где $I$ — единичная матрица, $\mathscr{L}^{-1}$ — обратное преобразование Лапласа, $F$ — матрица системной динамики.
Обычно обратные преобразования Лапласа можно найти в таблицах инженерных справочников. Еще один способ найти фундаментальную матрицу — вычислить разложение в ряд Тейлора:
$$
\Phi(t)=e^{\boldsymbol{F} t}=\boldsymbol{I}+\boldsymbol{F} t+\frac{(\boldsymbol{F} t)^2}{2 !}+\cdots+\frac{(\boldsymbol{F} t)^n}{n !}+\cdots
$$
Дискретную основную матрицу или матрицу перехода можно легко найти, вычислив основную матрицу в момент дискретизации $Ts$ или
$$
\Phi_k=\Phi\left(T_s\right)
$$
Дискретная форма измерения калмановской фильтрации уравнение становится
$$
z_k=\boldsymbol{H} x_k+v_k
$$
и
$$
\boldsymbol{R}_k=E\left(\boldsymbol{v}_k \boldsymbol{v}_k^T\right)
$$
где $R_k$ — матрица, состоящая из дисперсий каждого источников шума измерения. В случае полиномиальные фильтры Калмана, $R_k$ — скаляр. Результирующий Уравнение фильтрации Калмана имеет вид:
$$
\hat{\boldsymbol{x}}_k=\Phi_k \hat{x}_{k-1}+\boldsymbol{G}_k \boldsymbol{u}_{k-1}+\boldsymbol{K}_k\left(z_k-\boldsymbol{H} \Phi_k \hat{\boldsymbol{x}}_{k-1}-\boldsymbol{H} \boldsymbol{G}_k \boldsymbol{u}_{k-1}\right)
$$
где $K_k$ представляет собой матрицу усиления Калмана, а $G_k$ представляет собой получен из
$$
\boldsymbol{G}_k=\int_0^{T_s} \Phi(\tau) \boldsymbol{G} \mathrm{d} \tau
$$
если $u_{k−1}$ предполагается постоянным между выборкой мгновения. Усиления Калмана вычисляются, а фильтр работает, из матричных уравнений Риккати.
Уравнения Риккати представляют собой набор рекурсивных матричных уравнений, заданных формулой:
$$
\begin{gathered}
\boldsymbol{M}_k=\Phi_k \boldsymbol{P}_{k-1} \Phi_k^T+\boldsymbol{Q}_k \\
\boldsymbol{K}_k=\boldsymbol{M}_k \boldsymbol{H}^T\left(\boldsymbol{H} \boldsymbol{M}_k \boldsymbol{H}^T+\boldsymbol{R}_k\right)^{-1} \\
\boldsymbol{P}_k=\left(\boldsymbol{I}-\boldsymbol{K}_k \boldsymbol{H}\right) \boldsymbol{M}_k
\end{gathered}
$$
где $P_k$ — ковариационная матрица, представляющая ошибки в оценках состояния (т. е. дисперсия истинности минус оценка) после обновления,
а $M_k$ — ковариационная матрица, представляющая ошибки в оценках состояния до обновления.
Дискретная матрица технологического шума $Q_k$ может быть найдена из непрерывной матрицы технологического шума $Q$ и основной матрицы согласно формуле
$$
\boldsymbol{Q}_k=\int_0^{T_s} \Phi(\tau) \boldsymbol{Q} \Phi^T(\tau) \mathrm{d} t
$$
Чтобы начать уравнения Риккати, нам нужна начальная ковариационная матрица $P_0$


In [6]:
%%markdown
# Модель движения

Для большинства типов объектов, отслеживаемых в наборе инструментов, вектор состояния состоит из одно-,
двух- или трехмерных положений и скоростей.

Рассмотрим объект, движущийся в направлении х с постоянным ускорением. Вы можете написать уравнение движения,
используя уравнения Ньютона, как:

$$
\begin{aligned}
& m \ddot{x}=f \\
& \ddot{x}=\frac{f}{m}=a
\end{aligned}
$$

Кроме того, если вы определяете состояние как:
$$
\begin{aligned}
& x_1=x \\
& x_2=\dot{x}
\end{aligned}
$$
вы можете написать уравнение движения в форме пространства состояний как:
$$
\frac{d}{d t}\left[\begin{array}{l}
x_1 \\
x_2
\end{array}\right]=\left[\begin{array}{ll}
0 & 1 \\
0 & 0
\end{array}\right]\left[\begin{array}{l}
x_1 \\
x_2
\end{array}\right]+\left[\begin{array}{l}
0 \\
1
\end{array}\right] a
$$
В большинстве случаев модель движения не полностью моделирует движение объекта, и вам необходимо включить шум процесса, чтобы компенсировать
неопределенность в модели движения. Для модели с постоянной скоростью можно добавить шум процесса в качестве условия ускорения.
$$
\frac{d}{d t}\left[\begin{array}{l}
x_1 \\
x_2
\end{array}\right]=\left[\begin{array}{ll}
0 & 1 \\
0 & 0
\end{array}\right]\left[\begin{array}{l}
x_1 \\
x_2
\end{array}\right]+\left[\begin{array}{l}
0 \\
1
\end{array}\right] a+\left[\begin{array}{l}
0 \\
1
\end{array}\right] v_k
$$

Здесь vk — неизвестное шумовое возмущение ускорения. Чтобы фильтр был оптимальным, вы должны предположить, что шум процесса представляет собой белый гауссовский шум с нулевым средним значением.

Вы можете расширить этот тип уравнения до более чем одного измерения. В двух измерениях уравнение имеет вид:
$$
\frac{d}{d t}\left[\begin{array}{l}
x_1 \\
x_2 \\
y_1 \\
y_2
\end{array}\right]=\left[\begin{array}{llll}
0 & 1 & 0 & 0 \\
0 & 0 & 0 & 0 \\
0 & 0 & 0 & 1 \\
0 & 0 & 0 & 0
\end{array}\right]\left[\begin{array}{l}
x_1 \\
x_2 \\
y_1 \\
y_2
\end{array}\right]+\left[\begin{array}{c}
0 \\
a_x \\
0 \\
a_y
\end{array}\right]+\left[\begin{array}{c}
0 \\
v_x \\
0 \\
v_y
\end{array}\right]
$$
Матрица 4 на 4 в этом уравнении является матрицей перехода состояния. Для независимых $x$- и $y$-движений эта
матрица является блочно-диагональной.

Когда вы преобразуете модель непрерывного времени в модель дискретного времени, вы интегрируете уравнения движения по
длине временного интервала. В дискретной форме для интервала выборки $T$ представление состояния принимает следующий вид:

$$
\left[\begin{array}{c}
x_{1, k+1} \\
x_{2, k+1}
\end{array}\right]=\left[\begin{array}{ll}
1 & T \\
0 & 1
\end{array}\right]\left[\begin{array}{c}
x_{1, k} \\
x_{2, k}
\end{array}\right]+\left[\begin{array}{c}
\frac{1}{2} T^2 \\
T
\end{array}\right] a+\left[\begin{array}{c}
\frac{1}{2} T^2 \\
T
\end{array}\right] \tilde{v}
$$

где $x_{k+1}$ — состояние в дискретный момент времени $k+1$, а $x_k$ — состояние в более ранний дискретный момент времени $k$.
Если вы включаете шум, уравнение усложняется, потому что интегрирование шума не является прямым. Подробнее о том, как
получить дискретизированный технологический шум из непрерывной системы, см. в [1].

# Модель движения

Для большинства типов объектов, отслеживаемых в наборе инструментов, вектор состояния состоит из одно-,
двух- или трехмерных положений и скоростей.

Рассмотрим объект, движущийся в направлении х с постоянным ускорением. Вы можете написать уравнение движения,
используя уравнения Ньютона, как:

$$
\begin{aligned}
& m \ddot{x}=f \\
& \ddot{x}=\frac{f}{m}=a
\end{aligned}
$$

Кроме того, если вы определяете состояние как:
$$
\begin{aligned}
& x_1=x \\
& x_2=\dot{x}
\end{aligned}
$$
вы можете написать уравнение движения в форме пространства состояний как:
$$
\frac{d}{d t}\left[\begin{array}{l}
x_1 \\
x_2
\end{array}\right]=\left[\begin{array}{ll}
0 & 1 \\
0 & 0
\end{array}\right]\left[\begin{array}{l}
x_1 \\
x_2
\end{array}\right]+\left[\begin{array}{l}
0 \\
1
\end{array}\right] a
$$
В большинстве случаев модель движения не полностью моделирует движение объекта, и вам необходимо включить шум процесса, чтобы компенсировать
неопределенность в модели движения. Для модели с постоянной скоростью можно добавить шум процесса в качестве условия ускорения.
$$
\frac{d}{d t}\left[\begin{array}{l}
x_1 \\
x_2
\end{array}\right]=\left[\begin{array}{ll}
0 & 1 \\
0 & 0
\end{array}\right]\left[\begin{array}{l}
x_1 \\
x_2
\end{array}\right]+\left[\begin{array}{l}
0 \\
1
\end{array}\right] a+\left[\begin{array}{l}
0 \\
1
\end{array}\right] v_k
$$

Здесь vk — неизвестное шумовое возмущение ускорения. Чтобы фильтр был оптимальным, вы должны предположить, что шум процесса представляет собой белый гауссовский шум с нулевым средним значением.

Вы можете расширить этот тип уравнения до более чем одного измерения. В двух измерениях уравнение имеет вид:
$$
\frac{d}{d t}\left[\begin{array}{l}
x_1 \\
x_2 \\
y_1 \\
y_2
\end{array}\right]=\left[\begin{array}{llll}
0 & 1 & 0 & 0 \\
0 & 0 & 0 & 0 \\
0 & 0 & 0 & 1 \\
0 & 0 & 0 & 0
\end{array}\right]\left[\begin{array}{l}
x_1 \\
x_2 \\
y_1 \\
y_2
\end{array}\right]+\left[\begin{array}{c}
0 \\
a_x \\
0 \\
a_y
\end{array}\right]+\left[\begin{array}{c}
0 \\
v_x \\
0 \\
v_y
\end{array}\right]
$$
Матрица 4 на 4 в этом уравнении является матрицей перехода состояния. Для независимых $x$- и $y$-движений эта
матрица является блочно-диагональной.

Когда вы преобразуете модель непрерывного времени в модель дискретного времени, вы интегрируете уравнения движения по
длине временного интервала. В дискретной форме для интервала выборки $T$ представление состояния принимает следующий вид:

$$
\left[\begin{array}{c}
x_{1, k+1} \\
x_{2, k+1}
\end{array}\right]=\left[\begin{array}{ll}
1 & T \\
0 & 1
\end{array}\right]\left[\begin{array}{c}
x_{1, k} \\
x_{2, k}
\end{array}\right]+\left[\begin{array}{c}
\frac{1}{2} T^2 \\
T
\end{array}\right] a+\left[\begin{array}{c}
\frac{1}{2} T^2 \\
T
\end{array}\right] \tilde{v}
$$

где $x_{k+1}$ — состояние в дискретный момент времени $k+1$, а $x_k$ — состояние в более ранний дискретный момент времени $k$.
Если вы включаете шум, уравнение усложняется, потому что интегрирование шума не является прямым. Подробнее о том, как
получить дискретизированный технологический шум из непрерывной системы, см. в [1].
