# Постановка задачи
Пусть есть n шариков и m урн.

Выбор урны для каждого шарика - с одинаковой вероятностью, независимо от других шариков.

Для произвольных чисел k, l >= 0, k + l <= m, найти вероятность, что ровно k урн будут пустыми, l - содержать ровно по одному шарику, m-k-l - 2 и больше шариков.

In [1]:
import numpy as np

from analitica import calculate_k_probs, calculate_l_probs
from monte_carlo import monte_carlo_simulation

In [2]:
URNS_NUMBER = 10
BALLS_NUMBER = 5

NUM_TRIALS = 10_000

# Аналитическое решение
Пусть $P_k$ - вероятность того, что урна будет пустой и

$P_l$ - вероятность того, что в урне будет 1 шарик.

Тогда в соответствии с формулой на листике Андрея:

$P_k = P_k(k,n,m)$

$P_l = P_l(k,l,n,m) = P_k(k,n,m) * P(l,n-(m-k),m-k)$

Если $P_k=\frac{C^k_m*C^n_{m-k}}{m^n}$, то тогда $P_l=\frac{C^k_m*C^n_{m-k}}{m^n}*\frac{C^l_{m-k}*C^{n-(m-k)}_{m-k-l}}{(m-k)^{n-(m-k)}}$

Для каждого вычисления нам дано колчисество урн и количество шариков. При этом, как видно из формул, вероятности также зависят от переменных k и l. Они нам неизвестны. Для решения этой проблемы, мы перебираем все возможные варианты этих переменных. Для каждого k мы вычисляем своём значение $P_{ki}$, после чего находим математеческое ожиданием всех $P_{ki}$ и получаем $P_k$. Далее для $P_l$ нужно для каждого l найти $P_{kli}$, где k - фиксировано. После вычисления математического ожидания для всех $P_{kli}$ мы получаем $P_{ki}$. Далее находим мат.ожидание всех $P_{ki}$ и получаем, наконец, результирующую вероятность $P_{l}$

# Аналитический расчёт

In [3]:
probs_k = calculate_k_probs(URNS_NUMBER, BALLS_NUMBER) # Вероятности того, что урна будет пуста
probs_l = calculate_l_probs(URNS_NUMBER, BALLS_NUMBER) # Вероятности того, что в урне будет 1 шарик
probs_l = [np.mean(pkli) for pkli in probs_l]
print('Вероятности, рассчитаные методом комбинаторики.')
print(f'- Урна пустая: {np.mean(probs_k):.6f}')
print(f' - В урне ровно 1 шарик: {np.mean(probs_l):.6f}')

Вероятности, рассчитаные методом комбинаторики.
- Урна пустая: 0.007380
 - В урне ровно 1 шарик: 0.011642


# Валидация методом Монте-Карло

In [4]:
results = monte_carlo_simulation(NUM_TRIALS, BALLS_NUMBER, URNS_NUMBER)
print('Вероятности, рассчитаные методом Монте-Карло.')
print(f" - Урна пустая: {results[3]:.6f}")
print(f" - В урне ровно 1 шарик: {results[4]:.6f}")
print(f" - В урне 2 и более шарика: {results[5]:.6f}")

Вероятности, рассчитаные методом Монте-Карло.
 - Урна пустая: 0.590320
 - В урне ровно 1 шарик: 0.328580
 - В урне 2 и более шарика: 0.081100


# Вопросы

1) Почему $P_l = P_l(k,l,n,m) = P_k(k,n,m) * P(l,n-(m-k),m-k)$?
Особенно непонятно, почему для $P_l$ количество шариков не n, а n-(m-k). Во-первых, количество шариков осталось неизменным (так как первую вероятность мы считали для пустых урн), во-вторых, n - это количество шариков, а (m-k) - это количество непустых урн, то есть мы из мух вычитаем котлеты.

2) Правильная ли формула для комбинаторного вычисления $P_k$ и $P_l$? Рассуждения по их получению есть в фотографиях.

3) Правильна ли логика по получению значений вероятности с помощью математического ожидания?