<a href="https://colab.research.google.com/github/Vladislav-maker/Fundamentals-of-statistics/blob/main/%D0%97%D0%B0%D0%B4%D0%B0%D1%87%D0%B0_7.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Исходные данные

In [None]:
import numpy as np
from scipy.stats import binom, norm
import pandas as pd
pd.set_option("display.precision", 10)


# Количество испытаний
n_values = [100, 1000, 10000]
# Вероятность успешного события
p_values = [0.001, 0.01, 0.1, 0.25, 0.5]

Введем переменные результата

In [None]:
# точные результаты
exact_probabilities = {'Количество испытаний': [],
                       'Вероятность успеха' : [],
                       'Вероятность в заданном интервале': [],
                        'Вероятность при Sn <= 5': [],
                        'Максимальная вероятность при k успешных событий': []}

# приближенные результаты
approx_probabilities = {'Количество испытаний': [],
                       'Вероятность успеха' : [],
                       'Вероятность в заданном интервале': [],
                        'Вероятность при Sn <= 5': [],
                        'Максимальная вероятность при k успешных событий': []}

In [None]:

for n in n_values:
    for p in p_values:

        # Вероятность провала
        q = 1 - p

        # Нижняя граница интервала
        low = n / 2 - np.sqrt(n * p * q)
        # Верхняя граница интервала
        high = n / 2 + np.sqrt(n * p * q)

        # Округление значений
        low = int(np.floor(low))
        high = int(np.floor(high))


        ## Вычисление точных значений вероятности

        # Вероятность события в заданном интервале
        probability_interval = binom.cdf(high, n, p) - binom.cdf(low - 1, n, p)

        # Вероятность события при Sn ≤ 5
        probability_5 = binom.cdf(5, n, p)

        # Вычисление максимальной вероятости при P(Sn = k)

        # Формируем выборку количества k успешных событий
        k_values = np.arange(0, n + 1)

        # Вычисляем для каждого события вероятность
        probabilities = binom.pmf(k_values, n, p)

        # Находим максимальную вероятность при k успехах
        max_k = np.argmax(probabilities)
        max_prob = probabilities[max_k]

        # Записываем точные результаты
        exact_probabilities['Количество испытаний'].append(n)
        exact_probabilities['Вероятность успеха'].append(p)
        exact_probabilities['Вероятность в заданном интервале'].append(probability_interval)
        exact_probabilities['Вероятность при Sn <= 5'].append(probability_5)
        exact_probabilities['Максимальная вероятность при k успешных событий'].append((max_k, max_prob))

        ## Вычисление приближенных значений через центральную предельную теорему
        mu = n * p
        sigma = np.sqrt(n * p * q)

        # Приближенная вероятность в заданном интервале интервале
        prob_interval_approx = norm.cdf(high, mu, sigma) - norm.cdf(low, mu, sigma)

        # Приближенная вероятность S_n ≤ 5
        probability_5_approx = norm.cdf(5, mu, sigma)

        # Вычисляем для каждого события вероятность
        probabilities_approx = binom.pmf(k_values, mu, sigma)

        # Находим максимальную вероятность при k успехах
        max_k_approx = np.argmax(probabilities)
        max_prob_approx = probabilities[max_k]

        approx_probabilities['Количество испытаний'].append(n)
        approx_probabilities['Вероятность успеха'].append(p)
        approx_probabilities['Вероятность в заданном интервале'].append(prob_interval_approx)
        approx_probabilities['Вероятность при Sn <= 5'].append(probability_5_approx)
        approx_probabilities['Максимальная вероятность при k успешных событий'].append((max_k_approx, max_prob_approx))


Составим таблицу точных значений вероятности с различными значениями количества испытаний и вероятности успеха

In [None]:
exact_df = pd.DataFrame(exact_probabilities)
exact_df

Unnamed: 0,Количество испытаний,Вероятность успеха,Вероятность в заданном интервале,Вероятность при Sn <= 5,Максимальная вероятность при k успешных событий
0,100,0.001,0.0,0.9999999989,"(0, 0.9047921471137091)"
1,100,0.01,0.0,0.99946546554,"(1, 0.36972963764972666)"
2,100,0.1,0.0,0.057576886487,"(10, 0.13186534682448794)"
3,100,0.25,1.09213e-05,1.1700149154e-07,"(25, 0.0917996917668368)"
4,100,0.5,0.7287469759,6.2616225627e-23,"(50, 0.07958923738717875)"
5,1000,0.001,0.0,0.9994119299,"(1, 0.36806348825922347)"
6,1000,0.01,0.0,0.066139511607,"(10, 0.1257402111262075)"
7,1000,0.1,0.0,2.5565456931e-38,"(100, 0.04201679086108606)"
8,1000,0.25,0.0,3.9691404523000005e-115,"(250, 0.02912410588370507)"
9,1000,0.5,0.6881869834,7.7385053063e-289,"(500, 0.025225018178360824)"


Составим таблицу приближенных значений вероятности с аналогичными исходными даными

In [None]:
print('Точные значения вероятности')

for i in range(len(n_values)*len(p_values)):

    print(exact_probabilities['Количество испытаний'][i],
          exact_probabilities['Вероятность успеха'][i],
          exact_probabilities['Вероятность в заданном интервале'][i],
          exact_probabilities['Вероятность при Sn <= 5'][i],
          *exact_probabilities['Максимальная вероятность при k успешных событий'][i], sep = '; ')

Точные значения вероятности
100; 0.001; 0.0; 0.9999999989001895; 0; 0.9047921471137091
100; 0.01; 0.0; 0.999465465536007; 1; 0.36972963764972666
100; 0.1; 0.0; 0.05757688648703396; 10; 0.13186534682448794
100; 0.25; 1.0921290707677223e-05; 1.170014915408914e-07; 25; 0.0917996917668368
100; 0.5; 0.7287469759261647; 6.26162256269268e-23; 50; 0.07958923738717875
1000; 0.001; 0.0; 0.999411929898237; 1; 0.36806348825922347
1000; 0.01; 0.0; 0.0661395116072514; 10; 0.1257402111262075
1000; 0.1; 0.0; 2.5565456930600536e-38; 100; 0.04201679086108606
1000; 0.25; 0.0; 3.9691404522735886e-115; 250; 0.02912410588370507
1000; 0.5; 0.6881869833975623; 7.738505306294352e-289; 500; 0.025225018178360824
10000; 0.001; 0.0; 0.06699137339752664; 10; 0.12517263665023912
10000; 0.01; 0.0; 2.070048551692478e-36; 100; 0.04006180577491359
10000; 0.1; 0.0; 0.0; 1000; 0.013296955574586395
10000; 0.25; 0.0; 0.0; 2500; 0.0092128446271744
10000; 0.5; 0.6875047904893197; 0.0; 5000; 0.007978646139382158


In [None]:
approx_df = pd.DataFrame(approx_probabilities)
approx_df

Unnamed: 0,Количество испытаний,Вероятность успеха,Вероятность в заданном интервале,Вероятность при Sn <= 5,Максимальная вероятность при k успешных событий
0,100,0.001,0.0,1.0,"(0, 0.9047921471137091)"
1,100,0.01,0.0,0.99997091961,"(1, 0.36972963764972666)"
2,100,0.1,0.0,0.047790352273,"(10, 0.13186534682448794)"
3,100,0.25,1.9298e-06,1.9298082185e-06,"(25, 0.0917996917668368)"
4,100,0.5,0.6826894921,1.128588406e-19,"(50, 0.07958923738717875)"
5,1000,0.001,0.0,0.99996859555,"(1, 0.36806348825922347)"
6,1000,0.01,0.0,0.056018421843,"(10, 0.1257402111262075)"
7,1000,0.1,0.0,6.6227297916e-24,"(100, 0.04201679086108606)"
8,1000,0.25,0.0,6.773737722500001e-72,"(250, 0.02912410588370507)"
9,1000,0.5,0.6728231078,1.9002993804000003e-215,"(500, 0.025225018178360824)"


In [None]:
print('Приближенные значения вероятности')

for i in range(len(n_values)*len(p_values)):


    print(approx_probabilities['Количество испытаний'][i],
          approx_probabilities['Вероятность успеха'][i],
          approx_probabilities['Вероятность в заданном интервале'][i],
          approx_probabilities['Вероятность при Sn <= 5'][i],
          *approx_probabilities['Максимальная вероятность при k успешных событий'][i], sep='; ')

Приближенные значения вероятности
100; 0.001; 0.0; 1.0; 0; 0.9047921471137091
100; 0.01; 0.0; 0.9999709196067917; 1; 0.36972963764972666
100; 0.1; 0.0; 0.0477903522728147; 10; 0.13186534682448794
100; 0.25; 1.929797600497274e-06; 1.929808218464226e-06; 25; 0.0917996917668368
100; 0.5; 0.6826894921370859; 1.1285884059538324e-19; 50; 0.07958923738717875
1000; 0.001; 0.0; 0.9999685955499594; 1; 0.36806348825922347
1000; 0.01; 0.0; 0.056018421842781885; 10; 0.1257402111262075
1000; 0.1; 0.0; 6.622729791637835e-24; 100; 0.04201679086108606
1000; 0.25; 0.0; 6.77373772250581e-72; 250; 0.02912410588370507
1000; 0.5; 0.67282310776884; 1.9002993803644997e-215; 500; 0.025225018178360824
10000; 0.001; 0.0; 0.056832776525984036; 10; 0.12517263665023912
10000; 0.01; 0.0; 6.620193805206593e-22; 100; 0.04006180577491359
10000; 0.1; 0.0; 1.6286111930430652e-241; 1000; 0.013296955574586395
10000; 0.25; 0.0; 0.0; 2500; 0.0092128446271744
10000; 0.5; 0.6826894921370859; 0.0; 5000; 0.007978646139382158


В результате сравнения полученных результатов вычисления точных и приближенных значений вероятности, можно заметить, что при увеличении количества испытаний, значения вероятностей становятся практически одинаковыми. Однако, в случае когда значение вероятности близко к 0 или 1, точные результаты могут значительно отличаться от приближенных, в виду того что распределение становится скошенным.
Точные значения вероятностей могут быть получены только для определенных случаев.
