<a href="https://colab.research.google.com/github/deltorobarba/machinelearning/blob/master/filtration.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Filtration**

In [None]:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

**Filtration and Stochastic Processes**

https://almostsure.wordpress.com/2009/11/08/filtrations-and-adapted-processes/

* In mathematics, a filtration $\mathcal{F}$ is an indexed family $\left(S_{i}\right)_{i \in I}$ of subobjects of a given algebraic structure $S,$ with the index $i$ running over some totally ordered index set $I$, subject to the condition
that

> if $i \leq j$ in $I,$ then $S_{i} \subset S_{j}$

* If the index i is the time parameter of some stochastic process, then the filtration can be interpreted as **representing all historical but not future information available about the stochastic process**, with the algebraic structure S<sub>i</sub> gaining in complexity with time. 

* Hence, a process that is adapted to a filtration F, is also called **non-anticipating**, i.e. one that cannot see into the future.

* Eine Filtrierung (auch Filtration, Filterung oder Filtern) ist in der Theorie der stochastischen Prozesse eine Familie von verschachtelten σ-Algebren. Sie modelliert die zu verschiedenen Zeitpunkten verfügbaren Informationen zum Verlauf eines Zufallsprozesses.

**Filtration & Stopping Time**

* Der Begriff der Filtrierung ist unerlässlich, um, ausgehend vom Begriff des stochastischen Prozesses,
wichtige Begriffe wie Martingale oder Stoppzeiten einzuführen.

* Als Menge $T$ wird wie bei stochastischen Prozessen meist $\mathbb{R}_{+}$ oder $\mathbb{N}_{0}$ gewählt und $t \in T$ als Zeitpunkt interpretiert.

* **$\sigma$ -Algebren modellieren verfügbare Information**. Die Mengen der $\sigma$ -Algebra $\mathcal{F}_{t}$ geben zu jedem Zeitpunkt $t$ an, wie viele Informationen zur Zeit bekannt sind. Für jedes Ereignis $A \subseteq \Omega$ bedeutet $A \in \mathcal{F}_{t}$ übersetzt, dass zum Zeitpunkt $t$ die Frage $,$ ist $\omega \in A ?^{\prime \prime}$ eindeutig mit $,$ ja" oder $,$ nein" beantwortet werden kann. 

* Dass die Filtrierung stets aufsteigend geordnet ist, bedeutet demnach, **dass eine einmal erlangte Information nicht mehr verloren geht.**

* Ist ein stochastischer Prozess $\left(X_{t}\right)_{t \in T}$ an eine Filtrierung $\left(\mathcal{F}_{t}\right)_{t \in T}$ adaptiert, bedeutet dies also, dass der Verlauf der Funktion $s \mapsto X_{s}(\omega)$ im Intervall $[0, t]$ zum Zeitpunkt $t$ (für beliebiges, aber unbekanntes $\omega \in \Omega$ und in Hinsicht auf die durch Ereignisse $A \in \mathcal{F}_{s}, s \in[0, t]$ formulierbaren Fragen bekannt ist.

* Der Begriff wird aufgrund seiner Bedeutung in den meisten fortgeschrittenen Lehrbüchern über stochastische Prozesse definiert. In einigen Lehrbüchern, zum Beispiel im Buch Probability von Albert N. Schirjajew, wird der Begriff aus didaktischen Gründen zunächst umfassend für Prozesse mit diskreten
Werten in diskreter Zeit eingeführt.

https://de.m.wikipedia.org/wiki/Filtrierung_(Wahrscheinlichkeitstheorie)

**Beispiel**

Betrachtet man als Beispiel einen Wahrscheinlichkeitsraum $(\mathbb{Z}, \mathcal{P}(\mathbb{Z}), P)$ mit abzählbarer Grundmenge $\mathbb{Z}$ die standardmäßig mit der Potenzmenge als $\sigma$ -Algebra ausgestattet ist, so wäre eine mögliche Filtrierung beispielsweise

$\mathcal{F}_{n}:=\sigma(\mathcal{P}(\{-n, \ldots, n\}))$

Sie modelliert die Informationen, dass man bis zum n-ten Zeitschritt sich bis zu n Schritte vom Ursprung entfernt hat und wäre beispielsweise die passende Filtrierung für einen einfachen symmetrischen Random
Walk.

**Filtration and Martingales**

* In martingale theory and the theory of stochastic processes, a **filtration is an increasing sequence of σ-algebras on a measurable space**.

* That is, given a measurable space $(\Omega, \mathcal{F}),$ a filtration is a sequence of $\sigma$ -algebras $\left\{\mathcal{F}_{t}\right\}_{t \geq 0}$ with $\mathcal{F}_{t} \subseteq \mathcal{F}$ where each $t$ is a non-negative real number and 

> $t_{1} \leq t_{2} \Longrightarrow \mathcal{F}_{t_{1}} \subseteq \mathcal{F}_{t_{2}}$

* The exact range of the "times" $t$ will usually depend on context: the set of values for $t$ might be discrete or continuous, bounded or unbounded. For example,

> $t \in\{0,1, \ldots, N\}, \mathbb{N}_{0},[0, T]$ or $[0,+\infty)$

* **A σ-algebra defines the set of events that can be measured, which in a probability context is equivalent to events that can be discriminated, or "questions that can be answered at time t".** 

* **Therefore, a filtration is often used to represent the change in the set of events that can be measured, through gain or loss of information**. 

* A typical example is in mathematical finance, where a filtration represents the information available up to and including each time t, and is more and more precise (the set of measurable events is staying the same or increasing) as more information from the evolution of the stock price becomes available.

A Filtration is a growing sequence of sigma algebras

> $\mathcal{F}_{1} \subseteq \mathcal{F}_{2} \ldots \subseteq \mathcal{F}_{n}$



When talking of martingales we need to talk of conditional expectations, and in particular conditional expectations w.r.t σ algebra's. So whenever we write

> $E\left[Y_{n} \mid X_{1}, X_{2}, \ldots, X_{n}\right]$

which can be written as

> $E\left[Y_{n+1} \mid \mathcal{F}_{n}\right]$

where F𝑛 is a sigma algebra that makes random variables

> $X_{1}, \ldots, X_{n}$

measurable. Finally a flitration F1,…Fn is simply an increasing sequence of sigma algebras. That is **we are conditioning on growing amounts of information**.