<div style="font-size:18pt; padding-top:20px; text-align:center">СЕМИНАР. <b>Законы распределения и </b> <span style="font-weight:bold; color:green">NumPy/SciPy</span></div><hr>
<div style="text-align:right;">Папулин С.Ю. <span style="font-style: italic;font-weight: bold;">(papulin.study@yandex.ru)</span></div>

<a name="0"></a>
<div><span style="font-size:14pt; font-weight:bold">Содержание</span>
    <ol>
        <li><a href="#1">Комбинаторика</a></li>
        <li><a href="#2">Законы распределения</a>
            <ol style = "list-style-type:lower-alpha">
                <li><a href="#2a">Равномерное распределение</a></li>
                <li><a href="#2b">Нормальное распределение</a></li>
                <li><a href="#2c">Биномиальное распределение</a></li>
            </ol></li>
        <li><a href="#3">Источники</a>
        </li>
    </ol>
</div>

In [3]:
import numpy as np
from scipy import stats
import matplotlib.pyplot as plt
%matplotlib inline

<a name="1"></a>
<div style="display:table; width:100%; padding-top:10px; padding-bottom:10px; border-bottom:1px solid lightgrey">
    <div style="display:table-row">
        <div style="display:table-cell; width:80%; font-size:14pt; font-weight:bold">1. Комбинаторика</div>
    	<div style="display:table-cell; width:20%; text-align:center; background-color:whitesmoke; border:1px solid lightgrey"><a href="#0">К содержанию</a></div>
    </div>
</div>

In [21]:
from scipy.special import perm, comb, factorial

<p>Количество размещений из n элементов по k</p>

In [20]:
k = np.array(5)
n = np.array(11)
perm(n, k)

55440.0

<p>Число размещений с повторениями из n элементов по k</p>

In [23]:
k = np.array(5)
n = np.array(10)
n**k

100000

<p>Количество сочетаний из n элементов по k</p>

In [30]:
k = np.array(2)
n = np.array(16)
comb(n, k, exact=True, repetition=False)

120

<p>Число сочетаний с повторениями из n элементов по k</p>

In [31]:
k = np.array(5)
n = np.array(10)
comb(n, k, exact=True, repetition=True)

2002

<p>Количество перестановок из n элементов</p>

In [29]:
n = np.array(7)
factorial(n, exact=True)

5040

<a name="2"></a>
<div style="display:table; width:100%; padding-top:10px; padding-bottom:10px; border-bottom:1px solid lightgrey">
    <div style="display:table-row">
        <div style="display:table-cell; width:80%; font-size:14pt; font-weight:bold">2. Законы распределения</div>
    	<div style="display:table-cell; width:20%; text-align:center; background-color:whitesmoke; border:1px solid lightgrey"><a href="#0">К содержанию</a></div>
    </div>
</div>

<a name="2a"></a>
<div style="display:table; width:100%">
    <div style="display:table-row">
        <div style="display:table-cell; width:80%; font-style:italic; font-weight:bold; font-size:12pt">
            a. Равномерное распределение / <span style="font-style:normal; font-weight:normal"><a href="https://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D0%B2%D0%BD%D0%BE%D0%BC%D0%B5%D1%80%D0%BD%D0%BE%D0%B5_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5">wiki</a> <a href="http://docs.scipy.org/doc/scipy-0.16.0/reference/generated/scipy.stats.uniform.html#scipy.stats.uniform">scipy</a></span>
        </div>
        <div style="display:table-cell; border:1px solid lightgrey; width:20%">
            <div style="display:table-cell; width:10%; text-align:center; background-color:whitesmoke;">
                <a href="#2">Назад</a>
            </div>
            <div style="display:table-cell; width:10%; text-align:center;">
                <a href="#2b">Далее</a>
            </div>
        </div>
    </div>
</div>

<p>Непрерывная случайная величина $X$ имеет <b>равномерный закон распределения</b> на отрезке $[a,b]$, если её плотность вероятности $\varphi (x)$ постоянна на отрезке и равна нулю вне его, т.е.</p>
</p>$$\varphi(x) = 
  \begin{cases} 
   \frac {1}{b-a} & \text{при } a \leq x \leq b \\
   0       & \text{при } x<a, x>b
  \end{cases}$$</p>

<p>Математическое ожидание:</p>
<p>$$M(X)=\frac{a+b}{2}$$</p>

<p>Дисперсия:</p>
<p>$$D(X)=\frac{(a-b)^2}{12}$$</p>

<p><b>Равномерный закон средствами Python</b></p>

<p>Основные параметры распределения</p>

In [None]:
xstart = -4 # начальная точка - a
length = 12 # длина отрезка [a,b]

<p>Функция плотности вероятности (probability density function - pdf)</p>

In [None]:
#Стандартный Python
def fUniform(x, a, b):
    print(a,b)
    if a <= x <= b:
        return 1 / (b - a)
    else:
        return 0

x0 = 0
y_pdf0 = fUniform(0, xstart, xstart + length)
y_pdf0

In [None]:
#SciPy
x0 = 0
y_pdf0 = stats.uniform.pdf(0, loc=xstart, scale=length)
y_pdf0

<p>Функция распределения (cumulative distribution function - cdf)</p>

In [None]:
x0 = 0
y_cdf0 = stats.uniform.cdf(x0, loc=xstart, scale=length)
y_cdf0

<p>Квантиль (percent point function - ppf)</p>

In [None]:
q0 = 0.5
x0 = stats.uniform.ppf(q0, loc=xstart, scale=length)
x0

<p>Графики</p>

In [None]:
x = np.linspace(-10, 10, 100)
y_pdf = stats.uniform.pdf(x, loc=xstart, scale=length)
y_cdf = stats.uniform.cdf(x, loc=xstart, scale=length)

q = np.linspace(0, 1, 100)
y_ppf = stats.uniform.ppf(q, loc=xstart, scale=length)

In [None]:
plt.figure(1, figsize=[15,4])

plt.subplot(1,3,1)
plt.plot(x, y_pdf, lw=2)
plt.title("pdf")
plt.grid(True)

plt.subplot(1,3,2)
plt.plot(x, y_cdf, color="green", lw=2)
plt.title("cdf")
plt.grid(True)

plt.subplot(1,3,3)
plt.plot(q, y_ppf, color="orange", lw=2)
plt.title("ppf")
plt.grid(True)

plt.show()

In [None]:
plt.figure(1, figsize=[12,4])

plt.subplot(1,2,1)

plt.title("pdf vs cdf")
plt.yticks(color="blue")
plt.plot(x, y_pdf, color="blue", lw=2)
plt.grid(True, color="blue", linestyle="--")

plt.twinx()
plt.yticks(color="green")
plt.plot(x, y_cdf, color="green", lw=2)
plt.grid(True, color="green")

plt.subplot(1,2,2)

plt.title("pdf vs ppf")
plt.yticks(color="blue")
plt.plot(y_pdf, x, color="blue", lw=2)
plt.grid(True, color="blue")
plt.ylim([xstart, length+xstart])

plt.twinx()

plt.yticks(color="orange")
plt.plot(q, y_ppf, color="orange", lw=2)
plt.grid(True, color="orange")

In [None]:
mas = [-8, -4]
lengths = [4, 6, 8, 10]

In [None]:
plt.figure(1, figsize=[15,4])
for j in range(len(mas)):
    plt.subplot(1,3,j+1)
    plt.title("$a_"+str(j+1)+" = "+str(mas[j])+"$")
    for i in range(len(lengths)):
        plt.plot(x, stats.uniform.pdf(x, loc=mas[j], scale=lengths[i]))     
     
    strSt = ["$length_"]*len(lengths)
    strEnd = ["$"]*len(lengths)
    
    legs = [strSt[k]+str(k+1)+"="+str(lengths[k])+strEnd[k] for k in range(len(lengths))]

    plt.legend(legs, loc="upper right")
    plt.grid(True)

plt.show()

In [None]:
plt.figure(1, figsize=[15,4])
for j in range(len(mas)):
    plt.subplot(1,3,j+1)
    plt.title("$a_"+str(j+1)+" = "+str(mas[j])+"$")
    for i in range(len(lengths)):
        plt.plot(x, stats.uniform.cdf(x, loc=mas[j], scale=lengths[i]))     
     
    strSt = ["$length_"]*len(lengths)
    strEnd = ["$"]*len(lengths)
    
    legs = [strSt[k]+str(k+1)+"="+str(lengths[k])+strEnd[k] for k in range(len(lengths))]

    plt.legend(legs, loc="lower right")
    plt.grid(True)

plt.show()

<p>Математическое ожидание</p>

In [None]:
m = stats.uniform.mean(loc=xstart, scale=length)
m

<p>Дисперсия</p>

In [None]:
v = stats.uniform.var(loc=xstart, scale=length)
v

<p>Стандартное отклонение</p>

In [None]:
s = stats.uniform.std(loc=xstart, scale=length)
s

<p>Медиан</p>

In [None]:
med = stats.uniform.median(loc=xstart, scale=length)
med

<p>Группа характеристик</p>

In [None]:
mvsk = stats.uniform.stats(moments="mvsk", loc=xstart, scale=length) #m - mean, v - var, s - skew, k - kurtosis
mvsk

<p>Начальный момент $k$-го порядка</p>

In [None]:
k = 2
stats.uniform.moment(k, loc=xstart, scale=length)

<p>Другие возможности</p>

In [None]:
unf_model = stats.uniform(loc=xstart, scale=length)

In [None]:
unf_model.mean()

In [None]:
unf_model.var()

In [None]:
unf_model.std()

In [None]:
unf_model.median()

In [None]:
unf_model.moment(k)

In [None]:
unf_model.stats(moments="mvsk") #m - mean, v - var, s - skew, k - kurtosis

In [None]:
unf_model.stats(moments="mv")

<p><b>Генератор случайных значений с равномерным распределением</b></p>

In [None]:
xstart = -4 #начальная точка - a
length = 12 #длина отрезка [a,b]
numSample = 100

rud = stats.uniform.rvs(loc=xstart, scale=length, size=numSample)
rud

In [None]:
rm = rud.mean()
print("mean для равномерного закона:", m)
print("mean для сгенерированных значений:", rm)

In [None]:
rv = rud.var()
print("var для равномерного закона:", v)
print("var для сгенерированных значений (n=%i): %f" % (numSample, rv))

In [None]:
rv = rud.std()
print("std для равномерного закона:", s)
print("std для сгенерированных значений (n=%i): %f" % (numSample, rv))

In [None]:
plt.figure(1, figsize=[12,4])

plt.subplot(1,2,1)
#plt.vlines(rud, 0, 0.05, lw=2, color="orange")
plt.plot(rud, np.zeros(len(rud)), "o", color="orange")
plt.vlines(rud, -1, 1, lw=2, color="yellow")
plt.ylim([-1, 1])
plt.xlim([-6, 10])
plt.grid(True)

plt.subplot(1,2,2)
plt.hist(rud, 50, density=False, color="green")

plt.vlines(rud, -0.5, 0.5, lw=2, color="yellow")
plt.plot(rud, np.zeros(len(rud)), "o", color="orange")

plt.grid(True)
plt.show()

In [None]:
plt.figure(1, figsize=[15,4])

plt.subplot(1,3,1)
plt.hist(rud, 50, density=False, color="green")

plt.vlines(rud, -0.5, 0.5, lw=2, color="yellow")
plt.plot(rud, np.zeros(len(rud)), "o", color="orange")
plt.grid(True)

plt.subplot(1,3,2)
plt.hist(rud, 50, density=True, color="green")

plt.vlines(rud, -0.02, 0.02, lw=2, color="yellow")
plt.plot(rud, np.zeros(len(rud)), "o", color="orange")
plt.grid(True)

plt.subplot(1,3,3)
plt.hist(rud, 50, density=True, color="green")

plt.vlines(rud, -0.02, 0.02, lw=2, color="yellow")
plt.plot(rud, np.zeros(len(rud)), "o", color="orange")

plt.plot(x, y_pdf, color="blue", lw=2)
plt.xlim([xstart, xstart+length])
plt.grid(True)

plt.show()

In [None]:
def plotGr_UD(ud, num):
    plt.subplot(2,2,num)
    plt.title("Samples: $10^{" + str(num)+"}$")
    count, bins, ignored = plt.hist(ud, 50, color="green", density=True)   
    plt.plot(x, y_pdf, color="blue", lw=2)
    plt.grid(True)
    
uds = [stats.uniform.rvs(loc=xstart, scale=length, size=10**i) for i in range(1,5)]

plt.figure(1, figsize=[12,10])
[plotGr_UD(uds[i-1], i) for i in range(1, 5)]
plt.show()

In [None]:
rud_cdf = np.array(range(1, len(rud) + 1)) / len(rud)
rud_cdf

In [None]:
plt.plot(sorted(rud), rud_cdf, "-", lw=2)
plt.vlines(sorted(rud), [0], rud_cdf, color="lightblue")
plt.plot(x, y_cdf, lw=2)
plt.grid(True)
plt.legend(["cdf for random values","cdf"], loc="upper left")
plt.show()

<p>Подбор параметров loc и space для множества значений</p>

In [None]:
loc, space = stats.uniform.fit(rud)
print("a = ", loc)
print("(b - a) =", space)

<a name="2b"></a>
<div style="display:table; width:100%">
    <div style="display:table-row">
        <div style="display:table-cell; width:80%; font-style:italic; font-weight:bold; font-size:12pt">
            b. Нормальное распределение / <span style="font-style:normal; font-weight:normal"><a href="https://ru.wikipedia.org/wiki/%D0%9D%D0%BE%D1%80%D0%BC%D0%B0%D0%BB%D1%8C%D0%BD%D0%BE%D0%B5_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5">wiki</a> <a href="http://docs.scipy.org/doc/scipy-0.16.0/reference/generated/scipy.stats.norm.html#scipy.stats.norm">scipy</a></span>
        </div>
        <div style="display:table-cell; border:1px solid lightgrey; width:20%">
            <div style="display:table-cell; width:10%; text-align:center; background-color:whitesmoke;">
                <a href="#2a">Назад</a>
            </div>
            <div style="display:table-cell; width:10%; text-align:center;">
                <a href="#2c">Далее</a>
            </div>
        </div>
    </div>
</div>

<p>Непрерывная случайная величина $X$ имеет <b>нормальный закон распределения</b> с параметрами $\mu$ и $\sigma$, если её плотность вероятности имеет вид:</p>
<p>$$\varphi(x)= \frac{1}{\sqrt{2 \pi  \sigma ^2}} e^{- \frac{(x-\mu )^2 }{2 \sigma^2 } }$$</p>

<p>Математическое ожидание:</p>
<p>$$M(X)=\mu$$</p>

<p>Дисперсия:</p>
<p>$$D(X)=\sigma^2$$</p>

<p><b>Нормальный закон средствами Python</b></p>

<p>Основные параметры распределения</p>

In [None]:
mu = 3.5
sigma = 2.0

In [None]:
#NumPy
def p(x, mu, sigma):
    return 1/(sigma * np.sqrt(2*np.pi)) * np.exp(-(x-mu)**2 / (2*sigma**2))

x0 = 0
y_pdf0 = p(x0, mu, sigma)
y_pdf0

<p>Функция плотности вероятности (probability density function - pdf)</p>

In [None]:
#SciPy
x0 = 0
y_pdf0 = stats.norm.pdf(x0, loc=mu, scale=sigma)
y_pdf0

<p>Функция распределения (cumulative distribution function - cdf)</p>

In [None]:
x0 = 0
y_cdf0 = stats.norm.cdf(x0, loc=mu, scale=sigma)
y_cdf0

<p>Квантиль (percent point function - ppf)</p>

In [None]:
q0 = 0.5
x0 = stats.norm.ppf(q0, loc=mu, scale=sigma)
x0

<p>Графики</p>

In [None]:
x = np.linspace(-10, 10, 100)
y_pdf = stats.norm.pdf(x, loc=mu, scale=sigma)
y_cdf = stats.norm.cdf(x, loc=mu, scale=sigma)

q = np.linspace(0, 1, 100)
y_ppf = stats.norm.ppf(q, loc=mu, scale=sigma)

In [None]:
plt.figure(1, figsize=[15,4])

plt.subplot(1,3,1)
plt.plot(x, y_pdf, lw=2)
plt.title("pdf")
plt.grid(True)

plt.subplot(1,3,2)
plt.plot(x, y_cdf, color="green", lw=2)
plt.title("cdf")
plt.grid(True)

plt.subplot(1,3,3)
plt.plot(q, y_ppf, color="orange", lw=2)
plt.title("ppf")
plt.grid(True)

plt.show()

In [None]:
plt.figure(1, figsize=[12,4])

plt.subplot(1,2,1)

plt.title("pdf vs cdf")
plt.yticks(color="blue")
plt.plot(x, y_pdf, color="blue", lw=2)
plt.grid(True, color="blue")

plt.twinx()
plt.yticks(color="green")
plt.plot(x, y_cdf, color="green", lw=2)
plt.grid(True, color="green")

plt.subplot(1,2,2)

plt.title("pdf vs ppf")
plt.yticks(color="blue")
plt.plot(y_pdf, x, color="blue", lw=2)
plt.grid(True, color="blue")
plt.ylim([-3*sigma + mu, 3*sigma + mu])

plt.twinx()

plt.yticks(color="orange")
plt.plot(q, y_ppf, color="orange", lw=2)
plt.ylim([-3*sigma + mu, 3*sigma + mu])
plt.grid(True, color="orange")

In [None]:
mus = [0, -2, 2]
sigmas = [1, 2, 3, 4]

In [None]:
plt.figure(1, figsize=[15,4])
for j in range(len(mus)):
    plt.subplot(1,3,j+1)
    plt.title("$\mu_"+str(j+1)+" = "+str(mus[j])+"$")
    for i in range(len(sigmas)):
        plt.plot(x, stats.norm.pdf(x, loc=mus[j], scale=sigmas[i]))     
     
    strSt = ["$\sigma_"]*len(sigmas)
    strEnd = ["$"]*len(sigmas)
    
    legs = [strSt[k]+str(k+1)+"="+str(sigmas[k])+strEnd[k] for k in range(len(sigmas))]

    plt.legend(legs, loc="upper right")
    plt.grid(True)

plt.show()

In [None]:
plt.figure(1, figsize=[15,4])
for j in range(len(mus)):
    plt.subplot(1,3,j+1)
    plt.title("$\mu_"+str(j+1)+" = "+str(mus[j])+"$")
    for i in range(len(sigmas)):
        plt.plot(x, stats.norm.cdf(x, loc=mus[j], scale=sigmas[i]))      
     
    strSt = ["$\sigma_"]*len(sigmas)
    strEnd = ["$"]*len(sigmas)
    
    legs = [strSt[k]+str(k+1)+"="+str(sigmas[k])+strEnd[k] for k in range(len(sigmas))]

    plt.legend(legs, loc="upper right")
    plt.grid(True)

plt.show()

<p>Математическое ожидание</p>

In [None]:
m = stats.norm.mean(loc=mu, scale=sigma)
m

<p>Дисперсия</p>

In [None]:
v = stats.norm.var(loc=mu, scale=sigma)
v

<p>Стандартное отклонение</p>

In [None]:
s = stats.norm.std(loc=mu, scale=sigma)
s

<p>Медиан</p>

In [None]:
med = stats.norm.median(loc=mu, scale=sigma)
med

<p>Группа характеристик</p>

In [None]:
mvsk = stats.norm.stats(moments="mvsk", loc=mu, scale=sigma) #m - mean, v - var, s - skew, k - kurtosis
mvsk

<p>Начальный момент $k$-го порядка</p>

In [None]:
k = 2
stats.norm.moment(k, loc=mu, scale=sigma)

<p>Другие возможности</p>

In [None]:
nf_model = stats.norm(loc=mu, scale=sigma)

In [None]:
nf_model.mean()

In [None]:
nf_model.var()

In [None]:
nf_model.std()

In [None]:
nf_model.median()

In [None]:
nf_model.moment(k)

In [None]:
nf_model.stats(moments="mvsk") #m - mean, v - var, s - skew, k - kurtosis

In [None]:
nf_model.stats(moments="mv")

<p><b>Генератор случайных значений с нормальным распределением</b></p>

In [None]:
#NumPy
np.random.randn(10) #mu=0, sigma=1

In [None]:
#NumPy
np.random.seed(1234) #для постоянства значений (псевдослучайные числа)
sigma*np.random.randn(10) + mu

In [None]:
#NumPy
np.random.seed(1234) 
np.random.normal(loc=mu, scale=sigma, size=10)

In [None]:
#SciPy
mu = 3.5
sigma = 2.0
numSample = 100
rnd = stats.norm.rvs(loc=mu, scale=sigma, size=numSample, random_state=1234) #random_state - для постоянства значений (seed)
rnd

In [None]:
rm = rnd.mean()
print("mean для равномерного закона:", m)
print("mean для сгенерированных значений:", rm)

In [None]:
rv = rnd.var()
print("var для равномерного закона:", v)
print("var для сгенерированных значений (n=%i): %f" % (numSample, rv))

In [None]:
rv = rnd.std()
print("std для равномерного закона:", s)
print("std для сгенерированных значений (n=%i): %f" % (numSample, rv))

In [None]:
plt.figure(1, figsize=[12,4])

plt.subplot(1,2,1)
#plt.vlines(rud, 0, 0.05, lw=2, color="orange")
plt.plot(rnd, np.zeros(len(rnd)), "o", color="orange")
plt.vlines(rnd, -1, 1, lw=2, color="yellow")
plt.ylim([-1, 1])
plt.xlim([-6, 10])
plt.grid(True)

plt.subplot(1,2,2)
plt.hist(rnd, 30, density=False, color="green")

plt.vlines(rnd, -0.5, 0.5, lw=2, color="yellow")
plt.plot(rnd, np.zeros(len(rnd)), "o", color="orange")

plt.grid(True)
plt.show()

In [None]:
plt.figure(1, figsize=[15,4])

plt.subplot(1,3,1)
plt.title("Histogram")
plt.hist(rnd, 30, density=False, color="green")

plt.vlines(rnd, -0.5, 0.5, lw=2, color="yellow")
plt.plot(rnd, np.zeros(len(rnd)), "o", color="orange")
plt.grid(True)

plt.subplot(1,3,2)
plt.title("Normalized Histogram")
plt.hist(rnd, 30, density=True, color="green")

plt.vlines(rnd, -0.02, 0.02, lw=2, color="yellow")
plt.plot(rnd, np.zeros(len(rnd)), "o", color="orange")
plt.grid(True)

plt.subplot(1,3,3)
plt.title("Normalized Histogram vs pdf")
plt.hist(rnd, 30, density=True, color="green")

plt.vlines(rnd, -0.02, 0.02, lw=2, color="yellow")
plt.plot(rnd, np.zeros(len(rnd)), "o", color="orange")

plt.plot(x, y_pdf, color="blue", lw=2)
plt.xlim([-3*sigma + mu, 3*sigma + mu])
plt.grid(True)

plt.show()

In [None]:
def plotGr_ND(nd, num):
    plt.subplot(2,2,num)
    plt.title("Samples: $10^{" + str(num)+"}$")
    count, bins, ignored = plt.hist(nd, 30, color="green", density=True)   
    plt.plot(x, y_pdf, color="blue", lw=2)
    plt.xlim([-3*sigma + mu, 3*sigma + mu])
    plt.grid(True)
    
nds = [stats.norm.rvs(loc=mu, scale=sigma, size=10**i) for i in range(1,5)]

plt.figure(1, figsize=[12,10])
[plotGr_ND(nds[i-1], i) for i in range(1, 5)]
plt.show()

In [None]:
rnd_cdf = np.array(range(1, len(rnd) + 1)) / len(rnd)
rnd_cdf

In [None]:
plt.plot(sorted(rnd), rnd_cdf, "-", lw=2)
plt.vlines(sorted(rnd), [0], rnd_cdf, color="lightblue")
plt.plot(x, y_cdf, lw=2)
plt.grid(True)
plt.legend(["cdf for random values","cdf"], loc="upper left")
plt.show()

<p>Подбор параметров loc и space для множества значений</p>

In [None]:
loc, space = stats.norm.fit(rnd)
print("mu = ", loc)
print("sigma =", space)

<a name="2c"></a>
<div style="display:table; width:100%">
    <div style="display:table-row">
        <div style="display:table-cell; width:80%; font-style:italic; font-weight:bold; font-size:12pt">
            c. Биномиальное распределение / <span style="font-style:normal; font-weight:normal"><a href="https://ru.wikipedia.org/wiki/%D0%91%D0%B8%D0%BD%D0%BE%D0%BC%D0%B8%D0%B0%D0%BB%D1%8C%D0%BD%D0%BE%D0%B5_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5">wiki</a> <a href="http://docs.scipy.org/doc/scipy-0.16.0/reference/generated/scipy.stats.binom.html#scipy.stats.binom">scipy</a></span>
        </div>
        <div style="display:table-cell; border:1px solid lightgrey; width:20%">
            <div style="display:table-cell; width:10%; text-align:center; background-color:whitesmoke;">
                <a href="#2b">Назад</a>
            </div>
            <div style="display:table-cell; width:10%; text-align:center;">
                <a href="#2d">Далее</a>
            </div>
        </div>
    </div>
</div>

<p>Дискретная случайная величина $X$ имеет <b>биномиальный закон распределения</b> с параметрами $n$ и $p$, если она принимает значения $0, 1, 2, \ldots, m, \ldots, n$ с вероятностями:</p>
<p>$$P(X=m)=C^m_n p^m q^{n-m},$$</p>
<p>где $0<p<1$, $q=1-p$.</p>

<p>Математическое ожидание:</p>
<p>$$M(X)=np$$</p>

<p>Дисперсия:</p>
<p>$$D(X)=npq$$</p>

<p><b>Биномиальный закон средствами Python</b></p>

<p>Основные параметры распределения</p>

In [None]:
n = 20
p = 0.1

<p>Функция вероятности (probability mass function - pmf)</p>

In [None]:
#SciPy
x0 = 2
y_pmf0 = stats.binom.pmf(x0, n, p)
y_pmf0

<p>Функция распределения (cumulative distribution function - cdf)</p>

In [None]:
x0 = 2
y_cdf0 = stats.binom.cdf(x0, n, p)
y_cdf0

<p>Квантиль (percent point function - ppf)</p>

In [None]:
q0 = 0.5
x0 = stats.binom.ppf(q0, n, p)
x0

<p>Графики</p>

In [None]:
x = np.arange(0, n+1)
y_pmf = stats.binom.pmf(x, n, p)
y_cdf = stats.binom.cdf(x, n, p)

q = np.linspace(0, 1, 100)
y_ppf = stats.binom.ppf(q, n, p)

In [None]:
plt.figure(1, figsize=[15,4])

plt.subplot(1,3,1)
plt.plot(x, y_pmf, lw=2)
plt.title("pmf")
plt.grid(True)

plt.subplot(1,3,2)
plt.plot(x, y_cdf, color="green", lw=2)
plt.title("cdf")
plt.ylim([0,1.1])
plt.xlim([0,20])
plt.grid(True)

plt.subplot(1,3,3)
plt.plot(q, y_ppf, color="orange", lw=2)
plt.title("ppf")
plt.grid(True)

plt.show()

In [None]:
plt.figure(1, figsize=[12,4])

plt.subplot(1,2,1)

plt.title("pmf vs cdf")
plt.yticks(color="blue")
plt.plot(x, y_pmf, color="blue", lw=2)
plt.grid(True, color="blue")

plt.twinx()
plt.yticks(color="green")
plt.ylim([0,1.1])
plt.plot(x, y_cdf, color="green", lw=2)
plt.grid(True, color="green")

plt.subplot(1,2,2)

plt.title("pmf vs ppf")
plt.yticks(color="blue")
plt.plot(y_pmf, x, color="blue", lw=2)
plt.grid(True, color="blue")

plt.twinx()

plt.yticks(color="orange")
plt.plot(q, y_ppf, color="orange", lw=2)
plt.ylim([0,20])
plt.grid(True, color="orange")

In [None]:
ns = [10, 20, 50]
ps = [0.1, 0.2, 0.4]

In [None]:
plt.figure(1, figsize=[15,4])
for j in range(len(ns)):
    plt.subplot(1,3,j+1)
    plt.title("$n_"+str(j+1)+" = "+str(ns[j])+"$")
    xs = np.arange(0, ns[j]+1)
    for i in range(len(ps)):
        xs = np.arange(0, ns[j]+1)
        plt.plot(xs,stats.binom.pmf(xs, ns[j], ps[i]),"o-")  
     
    strSt = ["$p_"]*len(ns)
    strEnd = ["$"]*len(ns)
    
    legs = [strSt[k]+str(k+1)+"="+str(ps[k])+strEnd[k] for k in range(len(ps))]

    plt.legend(legs, loc="upper right")
    plt.grid(True)

plt.show()

In [None]:
plt.figure(1, figsize=[15,4])
for j in range(len(ns)):
    plt.subplot(1,3,j+1)
    plt.title("$n_"+str(j+1)+" = "+str(ns[j])+"$")
    xs = np.arange(0, ns[j]+1)
    for i in range(len(ps)):
        xs = np.arange(0, ns[j]+1)
        plt.plot(xs,stats.binom.cdf(xs, ns[j], ps[i]),"o-")  
     
    strSt = ["$p_"]*len(ns)
    strEnd = ["$"]*len(ns)
    
    legs = [strSt[k]+str(k+1)+"="+str(ps[k])+strEnd[k] for k in range(len(ps))]

    plt.legend(legs, loc="upper right")
    plt.grid(True)

plt.show()

<p>Математическое ожидание</p>

In [None]:
m = stats.binom.mean(n, p)
m

<p>Дисперсия</p>

In [None]:
v = stats.binom.var(n, p)
v

<p>Стандартное отклонение</p>

In [None]:
s = stats.binom.std(n, p)
s

<p>Медиан</p>

In [None]:
med = stats.binom.median(n, p)
med

<p>Группа характеристик</p>

In [None]:
mvsk = stats.binom.stats(moments="mvsk", n=n, p=p) #m - mean, v - var, s - skew, k - kurtosis
mvsk

<p>Начальный момент $k$-го порядка</p>

In [None]:
k = 2
stats.binom.moment(k, n, p)

<p>Другие возможности</p>

In [None]:
nf_model = stats.binom(n, p)

In [None]:
nf_model.mean()

In [None]:
nf_model.var()

In [None]:
nf_model.std()

In [None]:
nf_model.median()

In [None]:
nf_model.moment(k)

In [None]:
nf_model.stats(moments="mvsk") #m - mean, v - var, s - skew, k - kurtosis

In [None]:
nf_model.stats(moments="mv")

<p><b>Генератор случайных значений с биномиальным распределением</b></p>

In [None]:
n = 20
p = 0.1

In [None]:
#SciPy
numSample = 100
rbd = stats.binom.rvs(n, p, size=numSample, random_state=1234) #random_state - для постоянства значений (seed)
rbd

In [None]:
rm = rbd.mean()
print("mean для равномерного закона:", m)
print("mean для сгенерированных значений:", rm)

In [None]:
rv = rbd.var()
print("var для равномерного закона:", v)
print("var для сгенерированных значений (n=%i): %f" % (numSample, rv))

In [None]:
rv = rbd.std()
print("std для равномерного закона:", s)
print("std для сгенерированных значений (n=%i): %f" % (numSample, rv))

In [None]:
plt.figure(1, figsize=[12,4])

plt.subplot(1,2,1)

plt.plot(rbd, np.zeros(len(rbd)), "o", color="orange")
plt.vlines(rbd, -1, 1, lw=2, color="yellow")
plt.ylim([-1, 1])
plt.xlim([-6, 10])
plt.grid(True)

plt.subplot(1,2,2)
plt.hist(rbd-0.25, 30, density=False, color="green", width=0.5)

plt.vlines(rbd, -2, 2, lw=2, color="yellow")
plt.plot(rbd, np.zeros(len(rbd)), "o", color="orange")

plt.grid(True)
plt.show()

In [None]:
yy_cdf = np.array(np.bincount(rbd)) / len(rbd)
xx = np.nonzero(yy_cdf)[0] - 0.25

In [None]:
plt.bar(xx, yy_cdf, width=0.5, color="orange")

plt.plot(x,stats.binom.pmf(x, n, p),"go-")
plt.xlim([0, 10])
plt.grid(True)

plt.show()

In [None]:
plt.figure(1, figsize=[15,4])

plt.subplot(1,3,1)
plt.title("Histogram")
plt.hist(rbd-0.25, 30, density=False, color="green", width=0.5)

plt.vlines(rbd, -0.5, 0.5, lw=2, color="yellow")
plt.plot(rbd, np.zeros(len(rbd)), "o", color="orange")
plt.grid(True)

plt.subplot(1,3,2)
plt.title("Normalized bars")
plt.bar(xx, yy_cdf, width=0.5, color="orange")
plt.xlim([-1, 8])
plt.grid(True)

plt.vlines(rbd, -0.02, 0.02, lw=2, color="yellow")
plt.plot(rbd, np.zeros(len(rbd)), "o", color="orange")
plt.grid(True)

plt.subplot(1,3,3)
plt.title("Normalized bars vs pmf")
plt.bar(xx, yy_cdf, width=0.5, color="orange")
plt.plot(x,stats.binom.pmf(x, n, p),"go-")
plt.xlim([-1, 8])

plt.vlines(rbd, -0.02, 0.02, lw=2, color="yellow")
plt.plot(rbd, np.zeros(len(rbd)), "o", color="orange")

plt.grid(True)

plt.show()

In [None]:
def plotGr_BD(bd, num, x):
    yy = np.array(np.bincount(bd)) / len(bd)
    xx = np.nonzero(yy)[0] - 0.25
    
    plt.subplot(2,2,num)
    
    plt.title("Samples: $10^{" + str(num+1)+"}$")
    
    plt.bar(xx, yy, width=0.5, color="orange")
    plt.plot(x, stats.binom.pmf(x, n, p),"go-")
    plt.grid(True)

bds = [stats.binom.rvs(n=n, p=p, loc=0, size=10**i, random_state=1234) for i in range(2,6)]

plt.figure(1, figsize=[12,10])
[plotGr_BD(bds[i-1], i, x) for i in range(1, 5)]
plt.show()

In [None]:
rbd_cdf = np.array(range(1, len(rbd) + 1)) / len(rbd)
rbd_cdf

<a name="3"></a>
<div style="display:table; width:100%; padding-top:10px; padding-bottom:10px; border-bottom:1px solid lightgrey">
    <div style="display:table-row">
        <div style="display:table-cell; width:80%; font-size:14pt; font-weight:bold">3. Источники</div>
    	<div style="display:table-cell; width:20%; text-align:center; background-color:whitesmoke; border:1px solid lightgrey"><a href="#0">К содержанию</a></div>
    </div>
</div>

<a href="http://docs.scipy.org/doc/scipy-0.16.0/reference/stats.html">Statistical functions (scipy.stats)</a><br>
<a href="http://docs.scipy.org/doc/scipy/reference/tutorial/stats.html">Statistics (scipy.stats)</a>
<p>Кремер Н.Ш. Теория вероятностей и математическая статистика</p>