In [1]:
%%latex
$\newcommand{\RR}{\mathbb{R}}$
$\newcommand{\Var}{\mathrm{Var}}$
Sei $(X_i)_{i\in \mathbb{N}}$ eine Folge unabhängig, identisch verteilter Zufallsvariablen mit $\mathbb{E}|X_1|<\infty$. Dann gilt für alle $\epsilon>0$
\[
\mathbb{P}\left(\left|\frac{1}{N}\sum_{k=1}^NX_k-\mathbb{E}[X_1]\right|<\epsilon\right)\to 1\quad  \Leftrightarrow \quad \mathbb{P}\left(\left|\frac{1}{N}\sum_{k=1}^NX_k-\mathbb{E}[X_1]\right|>\epsilon\right)=:p(\epsilon, N)\to 0
\]
Unter der zusätzlichen Annahme $\Var(X_1)<\infty$ lässt sich dies mithilfe der Tschebycheff Ungleichung einsehen
\[
\mathbb{P}\left(\left|\frac{1}{N}\sum_{k=1}^NX_k-\mathbb{E}[X_1]\right|>\epsilon\right)\leq \frac{\Var(\frac{1}{N}\sum_{k=1}^NX_k)}{\epsilon^2}=\frac{\Var(X_1)}{N\epsilon^2}=:t(\epsilon, N)
\]
Wir wollen sehen, wie scharf die Tschebycheff Ungleichung ist, also simulieren wir die Größen $p(\epsilon, N)$ und $t(\epsilon, N)$ für ein fixes $\epsilon>0$ und verschiedene Werte von $N$.

<IPython.core.display.Latex object>

In [5]:
import matplotlib.pyplot as plt
from matplotlib.widgets import Slider
import seaborn as sns
import numpy as np
import scipy.stats as stats
from scipy.stats import norm
from ipywidgets import interact
import ipywidgets as widgets
from scipy.special import comb
from scipy.stats import binom

"""
Die folgende Funktion nimmt an als Parameter:
p = Erfolgswahrscheinlichkeit
N = log_10(Wie viele Zufallsvariablen wir summieren)
n= Parameter der Binomialverteilung
resolution = Für wie viele Werte von z wir uns die Verteilungsfunktion ansehen möchten
"""

def Simulationslauf(p=0.5, n=10, epsilon=0.01):
    return 1-(binom.cdf(int(epsilon*n+n*p), n, p)-binom.cdf(int(-epsilon*n+n*p), n, p))

def plotting(p=0.5, n=10, epsilon=0.01):
    #make sure the values for ns are all integers, otherwise we can't calculate binomial distribution for such n
    n=int(10**n)
    ns=np.linspace(1, n, 2000, dtype=int)
    err = np.array([Simulationslauf(p, n_i, epsilon) for n_i in ns])
    ones=np.zeros(len(ns))+1
    #We cut off at 1, since beyond one we have no gain of information. 
    tscheb = np.minimum(p * (1 - p) / (ns * epsilon**2), 1)
    plt.xlabel('n')
    plt.title('Exact calculation vs. Tschebycheff')
    plt.plot(ns, err, label='p(epsilon, N)')
    plt.plot(ns, tscheb, label='t(epsilon, N)')
    plt.legend()
    plt.show()

slider_n=widgets.FloatSlider(value=1, min=1, max=10, description='log_10(n)', description_width='auto', orientation='horizontal', layout=widgets.Layout(width='500px'), readout=True)
slider_p=widgets.FloatSlider(value=0.5, min=0.01, max=0.99, description='p', orientation='horizontal', layout=widgets.Layout(width='500px'), readout=True)


interact(plotting, p=slider_p, n=slider_n, epsilon=[0.1, 0.01, 0.001])


interactive(children=(FloatSlider(value=0.5, description='p', layout=Layout(width='500px'), max=0.99, min=0.01…

<function __main__.plotting(p=0.5, n=10, epsilon=0.01)>