<a href="https://colab.research.google.com/github/deltorobarba/machinelearning/blob/master/set.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Set Theory**

In [None]:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

## **General Notation**

### **Definition of Set**

A set is a well-defined collection of distinct objects, considered as an object in its own right. The arrangement of the objects in the set does not matter. For example, 

* the numbers 2, 4, and 6 are distinct objects when considered separately, 

* but when they are considered collectively they form a single set of size three, written as {2, 4, 6}, which could also be written as {2, 6, 4}

Set theory begins with a fundamental binary relation between an object o and a set A. If o is a member (or element) of A, the notation o ∈ A is used. A set is described by listing elements separated by commas, or by a characterizing property of its elements, within braces { }. Since sets are objects, the membership relation can relate sets as well.

* A derived binary relation between two sets is the subset relation, also called set inclusion. If all the members of set A are also members of set B, then A is a subset of B, denoted A ⊆ B. For example, {1, 2} is a subset of {1, 2, 3} , and so is {2} but {1, 4} is not. 

* As insinuated from this definition, a set is a subset of itself. For cases where this possibility is unsuitable or would make sense to be rejected, the term proper subset is defined. A is called a proper subset of B if and only if A is a subset of B, but A is not equal to B. 

* Also 1, 2, and 3 are members (elements) of the set {1, 2, 3} but are not subsets of it; and in turn, the subsets, such as {1}, are not members of the set {1, 2, 3}.

https://en.m.wikipedia.org/wiki/Set_(mathematics)

https://en.m.wikipedia.org/wiki/Set_theory

### **Set-Builder Notation**

In set-builder notation, the set is specified as a subset of a larger set, where the subset is determined by a statement or condition involving the elements. For example, a set F can be specified as follows:

> $F=\{n \mid n \text { is an integer, and } 0 \leq n \leq 19\}$

* In this notation, the vertical bar ("|") means "such that", and the description can be interpreted as 
* **"F is the set of all numbers n, such that n is an integer in the range from 0 to 19 inclusive"**
* Sometimes the colon (":") is used instead of the vertical bar.

https://en.m.wikipedia.org/wiki/Set-builder_notation

### **Intervall Schreibweisen**

Ein Intervall kann (beidseitig) beschränkt oder – auch einseitig – unbeschränkt sein. Es ist durch seine untere und seine obere Intervallgrenze eindeutig bestimmt, wenn zusätzlich angegeben wird, ob diese Grenzen im Intervall enthalten sind.

Es gibt zwei verschiedene häufig verwendete Intervallschreibweisen:

* **Bei der häufigeren der beiden verwendet man für Grenzen, die zum Intervall gehören, eckige Klammern und runde für Grenzen, die nicht zum Intervall gehören. Die eckigen Klammern entsprechen einem schwachen Ungleichheitszeichen ≤. Die runden Klammern () entsprechen einem starken Ungleichheitszeichen <.**

* Bei der anderen Schreibweise werden statt der runden Klammern nach außen gewendete (gespiegelte) eckige verwendet. Im Folgenden werden beide Schreibweisen gezeigt und der Mengenschreibweise gegenübergestellt:

https://de.m.wikipedia.org/wiki/Intervall_(Mathematik)

### **Sets**

**Special Sets**

* One of these is the empty set, denoted { } or ∅.

* A set with exactly one element, x, is a unit set, or singleton, {x}.

* P or ℙ, denoting the set of all primes: P = {2, 3, 5, 7, 11, 13, 17, ...}.

* N, denoting the set of all natural numbers: N = {0, 1, 2, 3, ...} (sometimes defined excluding 0).

* Z, denoting the set of all integers (whether positive, negative or zero): Z = {..., −2, −1, 0, 1, 2, ...}.

* .. until Quaternions!

**Cartesian Product**

* A new set can be constructed by associating every element of one set with every element of another set. 

* The Cartesian product of two sets A and B, denoted by A × B is the set of all ordered pairs (a, b) such that a is a member of A and b is a member of B.

* For example: {1, 2} × {1, 2} = {(1, 1), (1, 2), (2, 1), (2, 2)}.


https://en.m.wikipedia.org/wiki/Set_(mathematics)

**Empty Set**

**Power Set**

## **Fundamental Concepts in Point-set Topology**

### **Point Set (General) Topology**

General topology is the branch of topology that deals with the basic set-theoretic definitions and constructions used in topology. It is the foundation of most other branches of topology, including differential topology, geometric topology, and algebraic topology. Another name for general topology is point-set topology.

The fundamental concepts in point-set topology are continuity, compactness, and connectedness:

* **Continuous functions**, intuitively, take nearby points to nearby points.

* **Compact sets** are those that can be covered by finitely many sets of arbitrarily small size.

* **Connected sets** are sets that cannot be divided into two pieces that are far apart.

### **Fundamental Concepts**

#### **Open vs Closed Sets**

Once a choice of open sets is made, the properties of continuity, connectedness, and compactness, which use notions of nearness, can be defined using these open sets.

https://en.m.wikipedia.org/wiki/Open_set

* A closed set is a set whose complement is an open set. 

* In a topological space, a closed set can be defined as a set which contains all its limit points. In a complete metric space, a closed set is a set which is closed under the limit operation.

* In a topological space, a set is closed if and only if it coincides with its closure. Equivalently, **a set is closed if and only if it contains all of its limit points**. Yet another equivalent definition is that a set is closed if and only **if it contains all of its boundary points**.

https://en.m.wikipedia.org/wiki/Closed_set

**Abgeschlossene Menge / Intervall**

Ein einfaches Beispiel ist das Intervall [0,1] in den reellen Zahlen (mit der Standardtopologie, erzeugt durch die Metrik $d_{x y}=|x-y|$. 

* Das Komplement von [0,1] ist die Vereinigung $(-\infty, 0) \cup(1, \infty)$ zweier offener Intervalle, also eine offene Menge, also ist [0,1] eine abgeschlossene Menge. 

* Deshalb nennt man das Intervall [0,1] ein abgeschlossenes Intervall. 

* Dagegen ist das Intervall (0,1] nicht abgeschlossen, denn das Komplement $(-\infty, 0] \cup(1, \infty)$ ist
nicht offen.

https://de.m.wikipedia.org/wiki/Abgeschlossene_Menge

**Abgeschlossenes Intervall**

>$[a, b]:=\{x \in \mathbb{R} \mid a \leq x \leq b\}$

Das Intervall enthält sowohl $a$ als auch $b$.
Ein Intervall ist genau dann kompakt, wenn es abgeschlossen und beschränkt ist.

**Offenes Intervall**

>$(a, b)=] a, b[:=\{x \in \mathbb{R} \mid a<x<b\}$

Das Intervall enthält weder $a$ noch $b$. Die Notation $(a, b)$ ist die traditionell verwendete, während ] $a, b\left[\text { auf Bourbaki zurückgeht. }^{[3]}\right.$
Halboffenes (genauer rechtsoffenes) Intervall

>$[a, b)=[a, b[:=\{x \in \mathbb{R} \mid a \leq x<b\}$

Das Intervall enthält $a$, aber nicht $b$.
Halboffenes (genauer linksoffenes) Intervall

> $(a, b]=\mid a, b]:=\{x \in \mathbb{R} \mid a<x \leq b\}$

Das Intervall enthält nicht $a,$ wohl aber $b$
Im Fall von $a=0$ und $b=1$ heißt $(a, b)$ das offene Einheitsintervall und $[a, b]$ das abgeschlossene Einheitsintervall.

#### **Bounded Set (Beschränkte Menge)**

Sei a < b. 
* Ein beschränktes Intervall mit der unteren Grenze a und der oberen Grenze b ist abgeschlossen, wenn es beide Grenzen enthält, und offen, wenn beide Grenzen nicht enthalten sind. 
* Ein beschränktes Intervall heißt halboffen, wenn es genau eine der beiden Intervallgrenzen enthält.

* A set is called bounded if it is, in a certain sense, of finite size. Conversely, a set which is not bounded is called unbounded. 

* The word 'bounded' makes no sense in a general topological space without a corresponding metric.

https://en.m.wikipedia.org/wiki/Bounded_set

**Unbeschränktes Intervall**

Wenn auf einer Seite die Intervallgrenze fehlt, es dort also keine Schranke geben soll, spricht man von einem (auf dieser Seite) unbeschränkten Intervall. Meist werden hierfür die bekannten Symbole −∞ und ∞ als „Ersatz“-Intervallgrenzen verwendet, die selbst nie zum Intervall gehören (deshalb die Schreibung mit runder Klammer). In mancher Literatur werden beschränkte Intervalle auch als eigentlich, unbeschränkte als uneigentlich bezeichnet.

#### **Bounded/Unbounded & Open/Closed Set**

Linksseitig unendliches abgeschlossenes Intervall

>$(-\infty, b]=]-\infty, b]:=\{x \in \mathbb{R} \mid x \leq b\}$

Es enthält alle Zahlen, die kleiner oder gleich $b$ sind.
Linksseitig unendliches offenes Intervall

>$(-\infty, b)=]-\infty, b[:=\{x \in \mathbb{R} \mid x<b\}$

Es enthält alle Zahlen, die kleiner als $b$ sind.
Rechtsseitig unendliches abgeschlossenes Intervall

>$[a, \infty)=[a, \infty[:=\{x \in \mathbb{R} \mid a \leq x\}$

Es enthält alle Zahlen, die größer oder gleich $a$ sind.
Rechtsseitig unendliches offenes Intervall

>$(a, \infty)=] a, \infty[:=\{x \in \mathbb{R} \mid a<x\}$

Es enthält alle Zahlen, die größer als $a$ sind.
Beidseitig unendliches offenes (und zugleich abgeschlossenes) Intervall $(-\infty, \infty)=]-\infty, \infty[:=\mathbb{R}$

https://de.m.wikipedia.org/wiki/Intervall_(Mathematik)

#### **Convergence**

https://en.m.wikipedia.org/wiki/Limit_of_a_sequence

#### **Complete metric space**

https://en.m.wikipedia.org/wiki/Complete_metric_space

### **Abstract Topological Concepts**

#### **Continuity**

https://en.m.wikipedia.org/wiki/Continuous_function

#### **Compactness**

![alternativer Text](https://upload.wikimedia.org/wikipedia/commons/thumb/7/7c/Compact.svg/512px-Compact.svg.png)

Per the compactness criteria for Euclidean space as stated in the Heine-Borel Theorem:

* the interval A = (−∞, −2] is not compact because it is not bounded. 

* The interval C = (2, 4) is not compact because it is not closed. 

* The interval B = [0, 1] is compact because it is both closed and bounded.

Compactness is a property that generalizes the notion of a subset of Euclidean space **being closed** (i.e., containing all its limit points) and **bounded** (i.e., having all its points lie within some fixed distance of each other).

* Examples include a closed interval, a rectangle, or a finite set of points. This notion is defined for more general topological spaces than Euclidean space in various ways.

* importance of including the boundary points of the interval, since the limit points must be in the space itself — an open (or half-open) interval of the real numbers is not compact. 

* It is also crucial that the interval be bounded, since in the interval [0,∞), one could choose the sequence of points 0, 1, 2, 3, ..., of which no sub-sequence ultimately gets arbitrarily close to any given real number.

https://en.m.wikipedia.org/wiki/Compact_space

#### **Connectedness**

https://en.m.wikipedia.org/wiki/Connected_space

## **Measure & Measurable Space**

* A measure space is a basic object of measure theory, a branch of mathematics that studies generalized notions of volumes. 

* It contains an underlying set, the subsets of this set that are feasible for measuring (the σ-algebra) and the method that is used for measuring (the measure). 

* **One important example of a measure space is a probability space**.

* A measurable space consists of the first two components without a specific measure.

A measure space is a triple $(X, \mathcal{A}, \mu),$ where

* $X$ is a set

* $\mathcal{A}$ is a $\sigma$ -algebra on the set $X$

* $\boldsymbol{\mu}$ is a measure on $(X, \mathcal{A})$

https://en.m.wikipedia.org/wiki/Measure_space

A **complete measure** (or, more precisely, a complete measure space) is a measure space in which every subset of every null set is measurable (having measure zero). 

https://en.m.wikipedia.org/wiki/Complete_measure

## **Mengenalgebra (Fields of Sets)**

**Mengensystem** oder **Mengenalgebra** oder **Fields of Sets**

Ω (Omega) sei eine beliebige Menge. Ein System $\mathcal{A}$ von Teilmengen von Ω heißt eine Mengenalgebra oder Algebra über Ω, wenn folgende Eigenschaften erfüllt sind:

1. $\mathcal{A} \neq \emptyset$ ( $\mathcal{A}$ ist nicht leer)

2. $A, B \in \mathcal{A} \Rightarrow A \cup B \in \mathcal{A}$ (Stabilität/Abgeschlossenheit bezüglich Vereinigung)

3. $A \in \mathcal{A} \Rightarrow A^{\mathrm{c}} \in \mathcal{A}$ (Stabilität/Abgeschlossenheit bezüglich Komplementbildung $\left.A^{c}=\Omega \backslash A\right)$

* In der Mathematik ist (Mengen-)Algebra ein Grundbegriff der Maßtheorie. Er beschreibt ein nicht-leeres Mengensystem, das vereinigungs- und komplementstabil ist.

* A field of sets is a **pair ⟨X,F⟩** where X is a set and F is an algebra over X i.e., a subset of the power set of X, closed under complements of individual sets and under the union (hence also under the intersection) of pairs of sets, and satisfying X ∈ F. 

* In other words, F forms a subalgebra of the power set Boolean algebra of X (with the same identity element X ∈ F). (Many authors refer to F itself as a field of sets.) 

* **Elements of X are called points and those of F are called complexes and are said to be the admissible sets of X.**

* For arbitrary set $Y$, its power set (Potenzmenge) $2^{Y}$ (or, somewhat pedantically, the pair $\left\langle Y, 2^{Y}\right\rangle$ of this set and its power set) is a field of sets. 

* If $Y$ is finite (namely, $n$ -element), then $2^{Y}$ is finite (namely, $2^{n}$ element). 

* It appears that every finite field of sets (it means, $\langle X, \mathcal{F}\rangle$ with $\mathcal{F}$ finite, while $X$ may be infinite) admits a representation of the form $\left\langle Y, 2^{Y}\right\rangle$ with finite $Y ;$ it means a function $f: X \rightarrow Y$ that establishes a one-to-one correspondence between $\mathcal{F}$ and $2^{Y}$ via inverse image:
$S=f^{-1}[B]=\{x \in X \mid f(x) \in B\}$ where $S \in \mathcal{F}$ and $B \in 2^{Y}$ (that is, $B \subset Y$ ). 

* One notable consequence: the number of complexes, if finite, is always of the form $2^{n}$.

**Beispiele für Algebra**

* Für jede beliebige Menge $\Omega$ ist $\{\emptyset, \Omega\}$ die kleinste und die Potenzmenge $\mathcal{P}(\Omega)$ die größtmögliche Mengenalgebra.
* Jede $\sigma$ -Algebra ist eine Mengenalgebra.
* Für jede Menge $\Omega$ ist das Mengensystem $\mathcal{A}=\left\{A \subseteq \Omega \mid A \text { endlich oder } A^{c} \text { endlich }\right\}$ eine Mengenalgebra. Wenn $\Omega$ unendich ist, dann ist $\mathcal{A}$ keine $\sigma$ -Algebra.

**Separative and compact fields of sets: towards Stone duality**

* A field of sets is called **separative (or differentiated)** if and only if for every pair of distinct points there is a complex containing one and not the other.

* A field of sets is called **compact** if and only if for every proper filter over X the intersection of all the complexes contained in the filter is non-empty.

Given a field of sets $\mathbf{X}=\langle X, \mathcal{F}\rangle$ the complexes form a base for a topology. We denote by $T(\mathbf{X})$ the corresponding topological space, $\langle X, \mathcal{T}\rangle$ where $\mathcal{T}$ is the topology formed by taking arbitrary unions of complexes. Then

1. $T(\mathbf{X})$ is always a [zero-dimensional space](https://en.m.wikipedia.org/wiki/Zero-dimensional_space)

2. $T(\mathbf{X})$ is a [Hausdorff space](https://en.m.wikipedia.org/wiki/Hausdorff_space) if and only if $\mathbf{X}$ is separative.

3. $T(\mathbf{X})$ is a compact space with compact open sets $\mathcal{F}$ if and only if $\mathbf{X}$ is compact.

4. $T(\mathbf{X})$ is a Boolean space with clopen sets $\mathcal{F}$ if and only if $\mathbf{X}$ is both separative and compact (in which case it is described as being descriptive)

https://en.m.wikipedia.org/wiki/Field_of_sets

## **σ-algebra**

If an algebra over a **set is closed under countable unions** (hence also under countable intersections), it is called a **sigma algebra** and the corresponding field of sets (Mengensystem) is called a **measurable space**. The complexes of a measurable space are called measurable sets.

* A measure space is a triple $\langle X, \mathcal{F}, \mu\rangle$ where $\langle X, \mathcal{F}\rangle$ is a measurable space and $\mu$ is a measure defined on it. 

* If $\mu$ is in fact a probability measure we speak of a probability space and call its underlying measurable space a sample space. 

* The points of a sample space are called samples and represent potential outcomes while the measurable sets (complexes) are called events and represent properties of outcomes for which we wish to assign probabilities. (Many use the term sample space simply for the underlying set of a probability space, particularly in the case where every subset is an event.) 

* Measure spaces and probability spaces play a foundational role in measure theory and probability theory respectively.

https://de.m.wikipedia.org/wiki/Algebra_(Mengensystem)

https://de.m.wikipedia.org/wiki/Algebraische_Struktur

**Pain Point**

* How to define a messbare Menge?

* Wenn wir eine Menge aus den reellen Zahlen haben und mochten eine Teilbereich [a bis b] messen, dann brauchen wir einen allgemeinen Massbegriff unabhangig von der konkreten Menge. Hier kommt Masstheorie und Sigma-Algebra.

**Definition**

* A σ-algebra defines the **set of events that can be measured**, which in a probability context is equivalent to events that can be discriminated, or "questions that can be answered at time t".

* Exkurs: Ergebnis vs Ereignis. Die möglichen Ausgänge eines Zufallsexperimentes nennt man **Ergebnisse** (zB auf einem Wüfel die Zahlen 1,2,3..). Wenn man alle möglichen Ergebnisse eines Zufallsexperimentes in einer Menge zusammenfasst, erhält man die **Ergebnismenge**. Sie wird üblicherweise mit dem Symbol Ω (sprich Omega) bezeichnet. Beim Würfeln ist Ω= {1; 2; 3; 4; 5; 6} die Ergebnismenge. Jede Zusammenfassung von einem oder mehreren Ergebnissen eines Zufallsexperimentes in einer Menge nennt man **Ereignis** (zB auf einem Würfel die Menge an geraden Zahlen {2,4,6} und ungeraden Zahlen {1,3,5}.

* Eine Sigma-Algebra F ist ein System, um alle möglichen **Ereignisse** (nicht Ergebnisse!) eines Zufallsexperiment zu beschreiben. Ereignisse sind an sich selbst Mengen, die man wie jede Menge vereinigen oder schneiden bzw. auch das Komplement bilden kann um so das Gegenereignis zu erhalten. Fasst man hier alle möglichen Kombinationen an Ereignissen in einer Menge zusammen, bekommt man eine Menge, die wiederum Mengen als Elemente enthält - eine Menge von Mengen sozusagen. Oft sagt man dazu auch einfach Mengensystem. Welche Eigenschaften ein Mengensystem genau haben muss, damit es eine Sigma-Algebra ist steht weiter unten.

* Beispiel: Glücksrad mit blau, rot und grün. Dann haben wir folglich drei Ergebnisse, die wir auch abkürzen können: Ω={B,R,G}. Generell kann man sich schon merken: Ω und ∅ sind immer Elemente einer Sigma-Algebra. Daher haben wir hier 8 mögliche Teilmengen von Ω, die wir als Ereignis betrachten können und demnach als Menge in der Sigma-Algebra zusammenfassen (Potenzmenge von Omega): F ={∅, {B}, {R}, {G}, {B,R}, {B,G}, {R,G}, {B,R,G}} ([Source](https://www.massmatics.de/merkzettel/#!876:Ereignisraum_&_Sigma-Algebra)).

* Bei diskreten Ergebnismengen kann man für die Sigma-Algebra immer die Potenzmenge P(Ω)nehmen und hat demnach dann stets diesen **Ereignisraum: (Ω,P(Ω))**

* Und für die reellen Zahlen gibt es die sogenannte **Borelsche Sigma-Algebra B**, die man dann auch in der Regel benutzt. Ist die Ergebnismenge Ω eine Teilmenge der reellen Zahlen (oder ℝ selbst), so nehmen wir die Borelsche-Sigma B und der Ereignisraum lautet (Ω,B).

* Wenn wir eine Sigma Algebra A gegeben haben, dann heisst jede Teilmenge in diesem Mengensystem (jedes Element aus dieser Sigma Algebra A) eine messbare Teilmenge (=die Mengen die wir messen wollen).

* **<u>Die Elemente der Sigma Algebra sind die messbaren Teilmengen von unserer Grundmenge X</u>** (Und messbar ist der wesentliche Begriff). Das ist zB die Menge an vergangenen Trading-Events am Finanzmarkt bis zum Zeitpunkt t.

* Sigma Algebra ist ein **Mengensystem von einer Teilmenge einer gegebenen Grundmenge** = der Raum, **den wir beschreiben wollen** (mit drei Eigenschaften). Die Menge einer Sigma-Algebra nennt man „**messbare Teilmengen**“.

**Eigenschaften**

**A $\subseteq$ P(X) (=Potenzmenge) heisst Sigma Algebra, wenn gilt** (Die Mengen, die in dieser Sigma Algebra liegen, das sind jene, die folgende drei Eigenschaften erfüllen, und sind die, die wir messen wollen (=diesen Mengen wollen wir ein Mass zuordnen). Potenzmenge selbst soll eine Sigma Algebra sein. Sollten gewissen Eigenschaften der Potenzmenge fordern). **<u>A collection of subsets</u> A is called a σ-algebra on a set X if the following properties are met:**

1. **A contains X (the set itself)**: $\quad \phi, X \in A$ (Leere Menge (sollte Länge oder Volumen Null haben) und ganze Grundmenge selbst haben wir im Mengensystem / sollen messbar sein. Das ist was Sigma Algebra sagt). **Ω ∈ F (Ergebnismenge muss enthalten sein)**

2. **If A contains a subset S, then A also contains the complement of S**: $A \in A \Rightarrow A^{c}:=X \backslash A \in A$ (Irgendein Element in der Algebra: dann sollte auch dessen Komplement im Mengensystem enthalten sein.) Hiermit ist auch Regel 1 eingeschlossen! Deswegen liegt auch die leere Menge (Gegenereignis von Ω) in F.

3. **Consider a countable collection of subsets. If each subset is included in A, then A must also contain their reunion.**: $A_{i} \in A$ fur i $\in N \Rightarrow \bigcup_{i=1}^{\infty} A_{i} \in A$ ((Letzter Punkt macht das Sigma aus): Abzählbarkeit, abzählbare Summe (A i‘s aus unseren Mengensystem A): wir haben endlich viele bzw. abzählbar viele, dann können wir die Vereinigung bilden / abziehbare Vereinigung. Die abzählbare Vereinigung soll wieder in der Sigma Algebra liegen = Wenn wir Längen haben, dann sollten wir die auch addieren können, auch wenn sich die Addition bis unendlich streckt! (blick auf messbarkeit))

Having defined such a σ-algebra A, we call **the elements of σ-algebra A measurable sets** and the couple (X, A) a measurable space. An arbitrary set X can be a member of a multitude of σ-algebras. We denote the set of all σ-algebras that contain X with M(X). The **intersection of all those σ-algebras is called the σ-algebra generated by X**.

**A σ-algebra (also σ-field) on a set X is a collection Σ of subsets of X that includes X itself, is closed under complement, and is closed under countable unions**. The definition implies that it also includes the empty subset and that it is closed under countable intersections. The pair (X, Σ) is called a measurable space or Borel space. A σ-algebra is a type of algebra of sets. An algebra of sets needs only to be closed under the union or intersection of finitely many subsets, which is a weaker condition.

**Borel‘sche Sigma-Algebra**

* T ist ein topologischer Raum (oder ein metrischer Raum im engeren Sinn.) und X eine Menge darin. „Offene Mengen“.

* Die Borel’sche Sigma Algebra auf topologischen Raum X ist jene kleinste Sigma Algebra, die von den offenen Mengen erzeugt wird. 

* B(X) := (T)

**Measurable function**

* **A set is measurable when it’s included in a σ-algebra.**

* We can also extend the “measurable” attribute to functions. Here’s how:

* Let’s consider (X, A) and (Y, B) two measurable spaces. A function f from A to B is called measurable if every set from B comes from applying f to a set from A. Formally, we say that for any element S of B, the pre-image of S under the function f is in A.


**Application**

* The main use of σ-algebras is in the definition of measures; specifically, the collection of those subsets for which a given measure is defined is necessarily a σ-algebra. 

* This concept is important in mathematical analysis as the **foundation for Lebesgue integration**, and in probability theory, where it is **interpreted as the collection of events which can be assigned probabilities**. 

* Also, in probability, σ-algebras are pivotal in the definition of conditional expectation.

* In statistics, (sub) σ-algebras are needed for the formal mathematical definition of a sufficient statistic, particularly when the statistic is a function or a random process and the notion of conditional density is not applicable.

**Examples**

1. **Minimum**: Sigma Algebra A enthält leere Menge und Grundmenge selbst (kleinste Sigma Algebra die möglich ist): A = {𝜙,X}
2. **Maximum**: Sigma Algebra enthält die Potenzmenge (beinhaltet alle Teilmengen von X): A = P(X)

* If {A1, A2, A3, …} is a countable partition of X then the **collection of all unions of sets in the partition** (including the empty set) is a σ-algebra.

* A more useful example is the set of subsets of the real line formed by starting with all open intervals and adding in all countable unions, countable intersections, and relative complements and continuing this process (by transfinite iteration through all countable ordinals) until the relevant closure properties are achieved - the σ-algebra produced by this process is known as the Borel algebra on the real line, and can also be conceived as the smallest (i.e. "coarsest") σ-algebra containing all the open sets, or equivalently containing all the closed sets. It is foundational to measure theory, and therefore modern probability theory, and a related construction known as the Borel hierarchy is of relevance to descriptive set theory.

https://medium.com/towards-artificial-intelligence/what-is-measure-theory-67c281f8a094

## **Filtrations**

* In a multiperiod market, information about the market scenario is revealed in stages. 

* Some events may be completely determined by the end of the first trading period, others by the end of the second, and others not until the termination of all trading. 

* This suggests the following classification of events: for each t ≤ T ,

(1) Ft = {all events determined in the first t trading periods}.

* The finite sequence (Ft)0≤t≤T is a filtration of the space Ω of market scenarios. 

* In general, a filtration of a set Ω (not necessarily finite) is defined to be a collection Ft, indexed by a time parameter t (time may be either discrete or continuous), such that

(a) each Ft is a σ−algebra of subsets (events) of Ω; and 

(b) if s<t then Fs ⊆Ft.

**Filtration and Stochastic Processes**

https://almostsure.wordpress.com/2009/11/08/filtrations-and-adapted-processes/

* In mathematics, a filtration $\mathcal{F}$ is an indexed family $\left(S_{i}\right)_{i \in I}$ of subobjects of a given algebraic structure $S,$ with the index $i$ running over some totally ordered index set $I$, subject to the condition
that

> if $i \leq j$ in $I,$ then $S_{i} \subset S_{j}$

* If the index i is the time parameter of some stochastic process, then the filtration can be interpreted as **representing all historical but not future information available about the stochastic process**, with the algebraic structure S<sub>i</sub> gaining in complexity with time. 

* Hence, a process that is adapted to a filtration F, is also called **non-anticipating**, i.e. one that cannot see into the future.

* Eine Filtrierung (auch Filtration, Filterung oder Filtern) ist in der Theorie der stochastischen Prozesse eine Familie von verschachtelten σ-Algebren. Sie modelliert die zu verschiedenen Zeitpunkten verfügbaren Informationen zum Verlauf eines Zufallsprozesses.

https://de.m.wikipedia.org/wiki/Filtrierung_(Wahrscheinlichkeitstheorie)

## **Stopping Time**

* Der Begriff der Filtrierung ist unerlässlich, um, ausgehend vom Begriff des stochastischen Prozesses,
wichtige Begriffe wie Martingale oder Stoppzeiten einzuführen.

* Als Menge $T$ wird wie bei stochastischen Prozessen meist $\mathbb{R}_{+}$ oder $\mathbb{N}_{0}$ gewählt und $t \in T$ als Zeitpunkt interpretiert.

* **$\sigma$ -Algebren modellieren verfügbare Information**. Die Mengen der $\sigma$ -Algebra $\mathcal{F}_{t}$ geben zu jedem Zeitpunkt $t$ an, wie viele Informationen zur Zeit bekannt sind. Für jedes Ereignis $A \subseteq \Omega$ bedeutet $A \in \mathcal{F}_{t}$ übersetzt, dass zum Zeitpunkt $t$ die Frage $,$ ist $\omega \in A ?^{\prime \prime}$ eindeutig mit $,$ ja" oder $,$ nein" beantwortet werden kann. 

* Dass die Filtrierung stets aufsteigend geordnet ist, bedeutet demnach, **dass eine einmal erlangte Information nicht mehr verloren geht.**

* Ist ein stochastischer Prozess $\left(X_{t}\right)_{t \in T}$ an eine Filtrierung $\left(\mathcal{F}_{t}\right)_{t \in T}$ adaptiert, bedeutet dies also, dass der Verlauf der Funktion $s \mapsto X_{s}(\omega)$ im Intervall $[0, t]$ zum Zeitpunkt $t$ (für beliebiges, aber unbekanntes $\omega \in \Omega$ und in Hinsicht auf die durch Ereignisse $A \in \mathcal{F}_{s}, s \in[0, t]$ formulierbaren Fragen bekannt ist.

* Der Begriff wird aufgrund seiner Bedeutung in den meisten fortgeschrittenen Lehrbüchern über stochastische Prozesse definiert. In einigen Lehrbüchern, zum Beispiel im Buch Probability von Albert N. Schirjajew, wird der Begriff aus didaktischen Gründen zunächst umfassend für Prozesse mit diskreten
Werten in diskreter Zeit eingeführt.

https://de.m.wikipedia.org/wiki/Filtrierung_(Wahrscheinlichkeitstheorie)

**Beispiel**

Betrachtet man als Beispiel einen Wahrscheinlichkeitsraum $(\mathbb{Z}, \mathcal{P}(\mathbb{Z}), P)$ mit abzählbarer Grundmenge $\mathbb{Z}$ die standardmäßig mit der Potenzmenge als $\sigma$ -Algebra ausgestattet ist, so wäre eine mögliche Filtrierung beispielsweise

$\mathcal{F}_{n}:=\sigma(\mathcal{P}(\{-n, \ldots, n\}))$

Sie modelliert die Informationen, dass man bis zum n-ten Zeitschritt sich bis zu n Schritte vom Ursprung entfernt hat und wäre beispielsweise die passende Filtrierung für einen einfachen symmetrischen Random
Walk.

**Optional Stopping Theorem**

* Das Optional Stopping Theorem ist ein mathematischer Satz über Martingale, eine spezielle Klasse von stochastischen Prozessen, und damit der Wahrscheinlichkeitstheorie zuzuordnen.

https://de.m.wikipedia.org/wiki/Optional_Stopping_Theorem

**Optional Sampling Theorem**

* Eine populäre Version dieses Theorems besagt, dass es bei einem fairen, sich wiederholenden Spiel keine Abbruchstrategie gibt, mit der man seinen Gesamtgewinn verbessern kann.

https://de.m.wikipedia.org/wiki/Optional_Sampling_Theorem

**Starke Markoweigenschaft**

https://de.m.wikipedia.org/wiki/Starke_Markoweigenschaft

**Stoppzeit (Markov Moment)**

* In der Stochastik bezeichnet der Begriff der Stoppzeit eine spezielle Art von Zufallsvariablen, die auf filtrierten Wahrscheinlichkeitsräumen definiert werden. 

* Stoppzeiten sind nicht nur von Bedeutung für die Theorie der stochastischen Prozesse (beispielsweise bei der Lokalisierung von Prozessklassen oder Untersuchungen von gestoppten Prozessen), sondern auch von praktischer Relevanz, etwa für das Problem des optimalen Ausübungszeitpunkts für amerikanische Optionen.

* Eine Stoppzeit kann man als die Wartezeit interpretieren, die vergeht, bis ein bestimmtes zufälliges Ereignis eintritt. Wenn wie üblich die Filtrierung die vorhandene Information zu verschiedenen Zeitpunkten angibt, bedeutet die obige Bedingung also, dass zu jeder Zeit bekannt sein soll, ob dieses Ereignis bereits eingetreten ist oder nicht.



https://de.m.wikipedia.org/wiki/Stoppzeit

**Filtrierung von Stoppzeiten**

* Eine Stoppzeit $\tau: \Omega \rightarrow[0, \infty]$ bezüglich einer beliebigen Filtrierung $\left(\mathcal{F}_{t}\right)_{t \in[0, \infty)}$ erzeugt in Analogie zur natürlichen Filtrierung eine $\sigma$ -Algebra, die sogenannte $\sigma$ -Algebra der $\tau$ -Vergangenheit

$\mathcal{F}_{\tau}:=\left\{A \in \mathcal{F}_{\infty} \mid \forall t \in[0, \infty): A \cap\{\tau \leq t\} \in \mathcal{F}_{t}\right\} \text { mit } \mathcal{F}_{\infty}=\sigma\left(\bigcup_{t \in[0, \infty)} \mathcal{F}_{t}\right)$

* Sei nun $\left(\tau_{j}\right)_{j \in J}$ eine geordnete Familie von Stoppzeiten mit $P\left(\tau_{i} \leq \tau_{j}\right)=1$ für alle $i, j \in J$ mit $i \leq j$ dann ist die Familie $\left(\mathcal{F}_{\tau_{j}}\right)_{j \in J}$ eine Filtrierung, diese ist beim Studium von Stoppzeiten stochastischer Prozesse von Bedeutung. 

* In Analogie erzeugt man die rechtsstetige Version der Filtrierung $\left(\mathcal{F}_{\tau_{j}+}\right)_{j \in J}$ wobei:

$\mathcal{F}_{r+}:=\left\{A \in \mathcal{F}_{\infty} \mid \forall t \in[0, \infty): A \cap\{\tau \leq t\} \in \mathcal{F}_{t+}\right\} \text { und } \mathcal{F}_{t+}=\bigcap_{u \in(t, \infty)} \mathcal{F}_{u}$

* Es gilt immer $\mathcal{F}_{\tau} \subseteq \mathcal{F}_{r+}$

**Vorhersagbarer Prozess**

https://de.m.wikipedia.org/wiki/Vorhersagbarer_Prozess

## **Martingales**

* In martingale theory and the theory of stochastic processes, a **filtration is an increasing sequence of σ-algebras on a measurable space**.

* That is, given a measurable space $(\Omega, \mathcal{F}),$ a filtration is a sequence of $\sigma$ -algebras $\left\{\mathcal{F}_{t}\right\}_{t \geq 0}$ with $\mathcal{F}_{t} \subseteq \mathcal{F}$ where each $t$ is a non-negative real number and 

> $t_{1} \leq t_{2} \Longrightarrow \mathcal{F}_{t_{1}} \subseteq \mathcal{F}_{t_{2}}$

* The exact range of the "times" $t$ will usually depend on context: the set of values for $t$ might be discrete or continuous, bounded or unbounded. For example,

> $t \in\{0,1, \ldots, N\}, \mathbb{N}_{0},[0, T]$ or $[0,+\infty)$

* **A σ-algebra defines the set of events that can be measured, which in a probability context is equivalent to events that can be discriminated, or "questions that can be answered at time t".** 

* **Therefore, a filtration is often used to represent the change in the set of events that can be measured, through gain or loss of information**. 

* A typical example is in mathematical finance, where a filtration represents the information available up to and including each time t, and is more and more precise (the set of measurable events is staying the same or increasing) as more information from the evolution of the stock price becomes available.

A Filtration is a growing sequence of sigma algebras

> $\mathcal{F}_{1} \subseteq \mathcal{F}_{2} \ldots \subseteq \mathcal{F}_{n}$

When talking of martingales we need to talk of conditional expectations, and in particular conditional expectations w.r.t σ algebra's. So whenever we write

> $E\left[Y_{n} \mid X_{1}, X_{2}, \ldots, X_{n}\right]$

which can be written as

> $E\left[Y_{n+1} \mid \mathcal{F}_{n}\right]$

where F𝑛 is a sigma algebra that makes random variables

> $X_{1}, \ldots, X_{n}$

measurable. Finally a flitration F1,…Fn is simply an increasing sequence of sigma algebras. That is **we are conditioning on growing amounts of information**.

Let (Ω,F,P) be a probability space and (Ft)0≤t≤T or (Ft)0≤t<∞ a filtration by sub- σ−algebras of F. An adapted sequence Xt of integrable random variables is defined to be a

* martingale if E(Xt+1|Ft) = Xt ∀t (=for all t).
* submartingale if E(Xt+1|Ft) ≥ Xt ∀t.
* supermartingale if E(Xt+1|Ft) ≤ Xt ∀t.

A measure space is a triple $\langle X, \mathcal{F}, \mu\rangle$ where $\langle X, \mathcal{F}\rangle$ is a measurable space and $\mu$ is a measure defined on it. If $\mu$ is in fact a probability measure we speak of a probability space and call its
underlying measurable space a sample space. The points of a sample space are called samples
and represent potential outcomes while the measurable sets (complexes) are called events and
represent properties of outcomes for which we wish to assign probabilities. (Many use the term
sample space simply for the underlying set of a probability space, particularly in the case where
every subset is an event.) Measure spaces and probability spaces play a foundational role in
measure theory and probability theory respectively.

## **Stochastische Prozesse**

**σ-Algebra & stochastische Prozesse**

**Measure-theoretic probability theory**

* The raison d'être of the measure-theoretic treatment of probability is that it unifies the discrete and the continuous cases, and makes the difference a question of which measure is used. Furthermore, it covers distributions that are neither discrete nor continuous nor mixtures of the two.

* Other distributions may not even be a mix, for example, the Cantor distribution has no positive probability for any single point, neither does it have a density. 

* The modern approach to probability theory solves these problems using measure theory to define the probability space:

Given any set $\Omega$ (also called sample space) and a $\sigma$ -algebra $\mathcal{F}$ on it, a measure $P$ defined on $\mathcal{F}$ is
called a probability measure if $P(\Omega)=1$

If $\mathcal{F}$ is the Borel $\sigma$ -algebra on the set of real numbers, then there is a unique probability measure on
$\mathcal{F}$ for any cdf, and vice versa. The measure corresponding to a cdf is said to be induced by the cdf.

This measure coincides with the pmf for discrete variables and pdf for continuous variables, making the measure-theoretic approach free of fallacies.

The probability of a set $E$ in the $\sigma$ -algebra $\mathcal{F}$ is defined as

$P(E)=\int_{\omega \in E} \mu_{F}(d \omega)$

where the integration is with respect to the measure $\mu_{F}$ induced by $F$

Along with providing better understanding and unification of discrete and continuous probabilities, measure-theoretic treatment also allows us to work on probabilities outside R<sup>n</sup>, as in the theory of stochastic processes. For example, to study Brownian motion, probability is defined on a space of functions.

When it's convenient to work with a dominating measure, the Radon-Nikodym theorem is used to define a density as the Radon-Nikodym derivative of the probability distribution of interest with respect to this dominating measure. 

* Discrete densities are usually defined as this derivative with respect to a counting measure over the set of all possible outcomes. 

* Densities for absolutely continuous distributions are usually defined as this derivative with respect to the Lebesgue measure. 

* If a theorem can be proved in this general setting, it holds for both discrete and continuous distributions as well as others; separate proofs are not required for discrete and continuous distributions.

https://en.m.wikipedia.org/wiki/Probability_theory

**σ-Algebra der τ-Vergangenheit**

* Die σ-Algebra der τ-Vergangenheit ist ein **Mengensystem**, sowie ein von der Stoppzeit abgeleitetes Konzept

* Die σ-Algebra der τ-Vergangenheit ist eine **spezielle σ-Algebra**, welche über die Filtrierung und die Stoppzeit definiert wird. Sie findet beispielsweise Anwendung bei der Definition der starken Markow-Eigenschaft und dem Optional Sampling Theorem.

* Sie entsteht durch Kombination einer Filtrierung mit einer Stoppzeit und findet meist Anwendung bei Aussagen über gestoppte Prozesse, also stochastische Prozesse, die an einem zufälligen Zeitpunkt angehalten werden. Zu diesen Aussagen gehören beispielsweise das Optional Stopping Theorem, das Optional Sampling Theorem und die Definition der starken Markow-Eigenschaft.

* Gegeben sei ein Wahrscheinlichkeitsraum $(\Omega, \mathcal{A}, P)$ sowie eine Filtrierung $\mathbb{F}=\left(\mathcal{F}_{t}\right)_{t \in T}$ bezüglich der Ober- $\sigma$ -Algebra $\mathcal{A}$ und eine Stoppzeit $\tau$ bezüglich $\mathbb{F}$. Dann heißt

$\mathcal{F}_{\tau}=\left\{A \in \mathcal{A} \mid A \cap\{\tau \leq t\} \in \mathcal{F}_{t} \text { für alle } t \in T\right\}$

die $\sigma$ -Algebra der $\tau$ -Vergangenheit.

https://de.m.wikipedia.org/wiki/Σ-Algebra_der_τ-Vergangenheit

**Wahrscheinlichkeitsraum**

* Es handelt sich um ein mathematisches Modell zur Beschreibung von Zufallsexperimenten. Hierbei werden die verschiedenen möglichen Ausgänge des Experiments zu einer Menge zusammengefasst. Teilmengen dieser Ergebnismenge können dann unter bestimmten Voraussetzungen Zahlen zwischen 0 und 1 zugeordnet werden, die als Wahrscheinlichkeiten interpretiert werden.

* Ein Wahrscheinlichkeitsraum ist ein Maßraum (Ω, Σ, P) dessen Maß P ein Wahrscheinlichkeitsmaß ist. Im Einzelnen bedeutet das: 

* Ω ist eine beliebige nichtleere Menge, genannt die Ergebnismenge. Ihre Elemente heißen Ergebnisse.

* Σ (Sigma) ist eine σ-Algebra über der Grundmenge Ω (Omega), also eine Menge bestehend aus Teilmengen von Ω, die Ω enthält und abgeschlossen gegenüber der Bildung von Komplementen und abzählbaren Vereinigungen ist. Die Elemente von Σ heißen Ereignisse. Die σ-Algebra Σ selbst wird auch Ereignissystem oder Ereignisalgebra genannt.

* P : Σ –> [0,1] ist ein Wahrscheinlichkeitsmaß, das heißt eine Mengenfunktion, die den Ereignissen Zahlen zuordnet, derart dass P(∅) = 0 ist, P (A1 ∪ A2 ∪ … ) = P(A1) + P(A2) + … für paarweise disjunkte (d. h. sich gegenseitig ausschließende) Ereignisse A1, A2, … gilt (3. Kolmogorow-Axiom) und P(Ω) = 1 ist (2. Kolmogorow-Axiom).

* Der Messraum (Ω, Σ) wird auch Ereignisraum genannt. Ein Wahrscheinlichkeitsraum ist also ein Ereignisraum, auf dem zusätzlich ein Wahrscheinlichkeitsmaß gegeben ist.

https://de.m.wikipedia.org/wiki/Wahrscheinlichkeitsraum

## **Adapted Process**

* for exmaple in Finance

* The share prices of assets in a multiperiod market depend on market scenarios, but evolve in such a way that their values at any time t, being observable at time t, do not depend on the unobservable post-t futures of the scenarios. 

* Thus, the price process St of a traded asset is **adapted to the natural filtration** (Ft)0≤t≤T defined by (1). 

* In general, a sequence Xt of random variables is said to be **adapted to a filtration** (Ft)0≤t≤T if, for each t, the random variable Xt is **Ft−measurable**, that is, if all events of the form {ω : Xt(ω) ∈ B}, where **B is a Borel** subset of the real numbers R, are members of the σ−algebra Ft.

## **Power Set (Potenzmenge)**

* Als Potenzmenge bezeichnet man in der Mengenlehre die **Menge aller Teilmengen einer gegebenen Grundmenge**. Man notiert die Potenzmenge einer Menge X meist als P(X).

* The power set of a set S is the set of all subsets of S. The power set contains S itself and the empty set because these are both subsets of S. For example, the power set of the set {1, 2, 3} is {{1, 2, 3}, {1, 2}, {1, 3}, {2, 3}, {1}, {2}, {3}, ∅}. The power set of a set S is usually written as P(S).

* **The power set of a finite set with n elements has 2<sup>n</sup> elements**. For example, the set {1, 2, 3} contains three elements, and the power set shown above contains 2<sup>3</sup> = 8 elements.

* The power set (or powerset) of any set S is the **set of all subsets of S, including the empty set and S itself**, variously denoted as P(S), 𝒫(S), ℘(S) (using the "Weierstrass p"), P(S), ℙ(S), or, identifying the powerset of S with the set of all functions from S to a given set of two elements, 2S.

* If S is the set {x, y, z}, then the subsets of S are: {} (also denoted ∅, the empty set or the null set), {x}, {y}, {z}, {x, y}, {x, z}, {y, z}, {x, y, z} and hence the power set of S is {{}, {x}, {y}, {z}, {x, y}, {x, z}, {y, z}, {x, y, z}}.

* The power set of an infinite (either countable or uncountable) set is always uncountable. 

* Moreover, the power set of a set is always strictly "bigger" than the original set in the sense that there is no way to pair every element of S with exactly one element of P(S). (There is never an onto map or [surjection](https://en.m.wikipedia.org/wiki/Surjective_function) from S onto P(S).)

**Mächtigkeit (Cardinality)**

* Die Mächtigkeit einer  Menge  M mit endlich vielen Elementen ist die Anzahl ihrer Elemente. Man schreibt für die Mächtigkeit einer Menge M entweder ∣M∣ oder #M.

* Die Mächtigkeit der Potenzmenge einer Menge A, ist: 𝒫(A)=2<sup>∣A∣</sup>. Ein Beispiel für eine Potenzmenge ist der Ereignisraum.

https://en.m.wikipedia.org/wiki/Cardinality

**Representing subsets as functions**

* In set theory, X<sup>Y</sup> is the set of all functions from Y to X. As "2" can be defined as {0,1} (see natural number), 2S (i.e., {0,1}S) is the set of all functions from S to {0,1}.

* By identifying a function in 2S with the corresponding preimage of 1, we see that there is a bijection between 2S and P(S), where each function is the characteristic function of the subset in P(S) with which it is identified.

* Hence 2S and P(S) could be considered identical set-theoretically. (Thus there are two distinct notational motivations for denoting the power set by 2S: the fact that this function-representation of subsets makes it a special case of the XY notation and the property, mentioned above, that |2S| = 2|S|.)

https://en.m.wikipedia.org/wiki/Power_set

https://en.m.wikipedia.org/wiki/Surjective_function

## **Universe (Grundmenge)**

* A universe is a collection that contains all the entities one wishes to consider in a given situation. 

* Eine Grundmenge (auch Universum) bezeichnet in der Mathematik eine Menge aus allen in einem bestimmten Zusammenhang betrachteten Objekten. Alle in diesem Zusammenhang betrachteten Mengen sind dann Teilmengen dieser Grundmenge. 

* **In einzelnen Fällen werden jedoch im Gegenzug nicht auch alle Teilmengen der Grundmenge betrachtet, so zum Beispiel im Fall einer σ-Algebra**. 

https://en.m.wikipedia.org/wiki/Universe_(mathematics)

**Solution Set (Lösungsmenge)**

Im Falle einer Gleichung wie beispielsweise x+5=3 handelt es sich um eine Aussageform, die an sich weder wahr noch falsch ist. Erst wenn man anstelle von x konkrete Zahlen einsetzt, wird aus der Aussageform eine Aussage, die entweder wahr oder falsch ist. Es interessiert beim Lösen einer Gleichung in der Regel jene Zahl, die aus der Gleichung eine wahre Aussage macht. Derjenige, der sich diese Gleichung ausgedacht hat, macht für den Löser dieser Gleichung jetzt außerdem noch eine weitere Vorschrift: Man soll nur innerhalb der natürlichen Zahlen N nach einem Objekt oder einer Zahl suchen dürfen, welches bzw. welche aus der Gleichung eine wahre Aussage macht. Anders formuliert: Die Grundmenge zur Gleichung wird in diesem Fall als N vorgeschrieben. Als Folge dieser Einschränkung wird man keine Zahl finden, welche die Gleichung erfüllt. Und deshalb ist die Lösungsmenge der Gleichung leer.

**Miscellaneous**

http://settheory.net/sets/time-in-set-theory