# Библиотеки

In [3]:
from scipy.stats import *
import numpy as np

# 1

В первой корзине имеется $11$ шаров, при этом количество белых шаров
равно либо $3$, либо $10$. Оба варианта равновероятны. Во второй корзине
имеется $25$ шаров, а количество белых шаров равно $2$, $23$ или $25$. Эти три
варианта также равновероятны. Из обеих корзин все шары переклады-
ваются в третью корзину.
1) Какова вероятность $\mathbb P(A)$, что случайно вынутый из третьей корзины шар окажется белым (событие A)?
2) Найдите условную вероятность $\mathbb P(H|A)$, того, что случайно вынутый из третьей корзины шар первоначально находился в первой корзине (событие $H$)
при условии, что он белый (событие $A$)?

## Аналитика

S - колво белых шаров в третьей корзине

<table class="iksweb">
	<tbody>
		<tr>
			<td>S</td>
			<td>5</td>
			<td>12</td>
			<td>26</td>
			<td>28</td>
			<td>33 </td>
			<td>35</td>
		</tr>
		<tr>
			<td>P</td>
			<td>1/6</td>
			<td>1/6</td>
			<td>1/6</td>
			<td>1/6</td>
			<td>1/6</td>
			<td>1/6</td>
		</tr>
	</tbody>
</table>

Всего шаров в третьей корзине - 36.

Пусть $H_1, H_2, \ldots H_6 $ - гипотезы, такие, что в третьей корзине $5, 12, 26, 28, 33, 35 $ белых шаров соответсвенно

Тогда найдем вероятность, что случайно вытянутый шар будет белым $P(A)$

По формуле полной вероятности:
$ P(A) = P(A|H_1) \cdot P(H_1) + P(A|H_2) \cdot P(H_2) + \ldots + P(A|H_6) \cdot P(H_6) = \frac{1}{6} \left(\frac{5 + 12 + 26 + 28 + 33 + 35}{36} \right) = \frac{139}{216} \approx 0.6435$

По формуле Байеса:
$ P(H_k|A) = \frac{P(H_k) \cdot P(A|H_k)}{P(A)}$

$P(H_1 | A) = \frac{216 \cdot 5}{139 \cdot 6 \cdot 36} $  

$P(H_2 | A) = \frac{216 \cdot 12}{139 \cdot 6 \cdot 36} $ 

$P(H_3 | A) = \frac{216 \cdot 26}{139 \cdot 6 \cdot 36} $

$P(H_4 | A) = \frac{216 \cdot 28}{139 \cdot 6 \cdot 36} $

$P(H_5 | A) = \frac{216 \cdot 33}{139 \cdot 6 \cdot 36} $ 

$P(H_6 | A) = \frac{216 \cdot 35}{139 \cdot 6 \cdot 36} $       

Найдем вероятность того, что вытянутый белый шар из 1 партии      
$P(H_1 | A) \cdot \frac{3}{5} $     
$P(H_2 | A) \cdot \frac{10}{12} $      
$P(H_3 | A) \cdot \frac{3}{26} $        
$P(H_4 | A) \cdot \frac{3}{28} $     
$P(H_5 | A) \cdot \frac{10}{33} $      
$P(H_6 | A) \cdot \frac{10}{35} $     

Посчитаем на питоне вероятность этих величин:  
Получим$  P(H|A) = 0.28057 $

In [13]:
ps = [3/5, 10/12, 3/26, 3/28, 10/33, 10/35]
hs = [(216 * i) / (139 * 6 * 36) for i in (5, 12, 26, 28, 33, 35)]

In [14]:
summa = 0
for p, h in zip(ps, hs):
    summa += p * h
    
summa

0.28057553956834536

# 2

## Стохастически

In [15]:
fbasket = ['W'] * 9 + ['B'] * 13
sbasket = ['W'] * 19 + ['B'] * 20

In [16]:
import numpy as np
from tqdm.notebook import tqdm

In [18]:
N = 100_000
counts = []

for n in tqdm(np.arange(1, N + 1)):
    fsample = np.random.choice(fbasket, size=7)
    ssample = np.random.choice(sbasket, size=8)
    a = fsample[fsample == 'W'].size + ssample[ssample == 'W'].size 
    counts.append(a / 15)

np.array(counts).mean()

  0%|          | 0/100000 [00:00<?, ?it/s]

0.45054466666666676

# 3

Банк выдал кредиты двум группам заемщиков: $180$ заемщиков в первой
группе и $70$ – во второй. Известно, что заемщики из первой группы воз-
вращают кредит с вероятностью $0,93$, а заемщики из второй группы – с
вероятностью $0,92$. Пусть $X$ – суммарное количество возвращенных кре-
дитов для обеих групп. Предполагая независимость заемщиков, найдите:
1) стандартное отклонение $X$; 
2) асимметрию $X$. 

Указание: используйте
присущее третьему центральному моменту свойство аддитивности.

## Аналитика

$A \sim Bin(180, 0,93); B \sim Bin(70, 0,92)$  
$X = A + B$ тк события независимы:   
$Var(X) = Var(A + B) = Var(A) + Var(B)$  
$Var(A) = 180 \cdot 0,93 \cdot (1 - 0,93) = 11,718$  
$Var(B) = 70 \cdot 0,92 \cdot (1 - 0,92) =  5,152$   
$\sigma(X) = \sqrt{Var(X)} = \sqrt{11,718 + 5,152} \approx 4,11$

$As(X) = \frac{\mu_3(X)}{\sigma^3(X)}$  
$\mu_3(X) = \mu_3(A) + \mu_3(B)$  
$\mu_3(A) = n \cdot p \cdot (1 - p) \cdot (1 - 2p)$   
$\mu_3(A) = 180 \cdot 0,93 \cdot 0,07 \cdot (1 - 2 \cdot 0,93) \approx -10,08$  
$\mu_3(B) = 70 \cdot 0,92 \cdot 0,08 \cdot (1 - 2 \cdot 0,93) \approx -4,43$

$As(X) = \frac{-10,08 -4,43 }{4,11 ^ 3} = -0,209$

In [5]:
A = rv_discrete(values=[(0,1), [0.07, 0.93]])
B = rv_discrete(values=[(0,1), [0.08, 0.92]])
N = 100_000

In [10]:
A_ = np.array([A.rvs(size=N) for _ in range(180)])
A_credits = np.sum(A_, axis=0)

B_ = np.array([B.rvs(size=N) for _ in range(70)])
B_credits = np.sum(B_, axis=0)

In [12]:
X = A_credits + B_credits
skew(X)

-0.21988021582370215

# 4

Монеты в количестве $20$ штук подбрасываются до тех пор, пока $19$ раз не
выпадет $12$ гербов. Пусть $X$ – число бросков до первого появления $12$ гербов, а $Y$ – число бросков до последнего появления $12$ гербов ($Y$ = общее число бросков). Найдите:
1) $\mathbb E(X)$;
2) $\sigma(X)$;
3) коэффициент корреляции между $X$ и $Y$;
4) математическое ожидание $XY$ .

# Аналитика

Пусть X - число бросков до появления 12 гербов при подбрасывании 20 монет. (д.с.в)

$X \sim Geom \left (p = C^{20}_{12} \cdot 0.5^{12} \cdot 0.5^{8} = C^{12}_{20} \cdot 0.5^{20} \right)$

$\mathbb{E}[X] = 8.324 $

$ Var(X) = 60.965$

$ \sigma(X) = 7.808$



Пусть Y - общее число бросков до 19 выпадений 12 гербов .           
$Y = X_1 + X_2 + \ldots + X_{19} $

$Var(Y) = 19 \cdot Var(X) = 1158.335$

$ Var(X+Y) = Var(2X_1 + X_2 + X_3 + \ldots X_{19}) = 4Var(X_1) + 18 Var(X_1) = 22 Var(X_1) $

$ 2 Cov(X, Y) = Var(X+Y) - Var(X) - Var(Y) = 22 Var(X_1) - 20 Var(X_1) = 2 Var(X_1)$

$ Cov(X, Y) = Var(X_1) = 60.965$

$\sigma(Y) = \sqrt{19 \cdot Var(X_1)}$       
$ \sigma(X) = \sqrt{Var(X_1)}$



$ \rho(X, Y) = \frac{Var(X_1)}{\sqrt{19 Var(X_1)} \cdot \sqrt{Var(X_1)}} = \frac{1}{\sqrt{19}} = 0.2294$

$ \mathbb{E}[XY] = Cov(X, Y) + \mathbb{E}[X] \cdot \mathbb{E}[Y] $

$\mathbb{E}[Y] = 19 \cdot \mathbb{E}[X] $

$ \mathbb{E}[XY] = 60.965 + 19 \cdot 8.324^2 = 1377.46$

## Стохастически

In [22]:
import math
X = geom(math.comb(20, 12) * (1/2) ** 12 * (1/2) ** 8)
X.expect(), X.std()

(8.324013654000284, 7.808020854139451)

In [28]:
N = 100_000
X_values = X.rvs(size=N)
Y_values = np.sum([X.rvs(size=N) for _ in range(19)], axis=0)

np.corrcoef(X_values, Y_values)

array([[1.        , 0.00502655],
       [0.00502655, 1.        ]])

# 5

Корзина содержит $35$ шаров, среди которых $17$ - красных и $5$ - синих.
Из корзины, случайным образом, без возвращения извлекаются $19$ шаров. Пусть $X$ и $Y$ обозначают количество красных и синих шаров среди извлеченных, соответственно. Найдите ковариацию $Cov(X, Y)$.

## Кодом

In [29]:
x = hypergeom(35, 17, 19)
x.var()

2.233469387755102

In [30]:
y = hypergeom(35, 5, 19)
y.var()

1.0948379351740696

In [31]:
xy = hypergeom(35, 22, 19)
xy.var()

2.0874909963985595

In [32]:
(xy.var() - x.var() - y.var()) / 2

-0.6204081632653061

# 6

Несимметричная игральная кость подбрасывается до тех пор, пока не вы-
падут цифры $1$ и $2$. Пусть $X$ – число сделанных при этом бросков. Даны
вероятности появления цифр в одном броске: $\mathbb P(1) = 0,13$ и $\mathbb P(2) = 0,17$.
Требуется найти: 
1) $\mathbb E(X)$;
2) $Var(X)$, если известно, что из 1 и 2 сна-
чала выпала цифра 2.

## Аналитика

Пусть $X = X_1 + X_2$, где $X$ - выпадение $1$ и $2$, а $X_1$ - выпадение любой цифры, $X_2$ - выпадение остальной цифры. ТО

$\mathbb E(X) = \mathbb E(X_1 + X_2) = \mathbb E(X_1) + \mathbb E(X_2)$  
$\mathbb E(X_1) = \frac{1}{\mathbb P(1) + \mathbb P(2)}= \frac{1}{0,13+0,17} \approx 3,33$, так как $X_1 \sim Geom(p = \mathbb P(1) + \mathbb P(2))$  
$\mathbb E(X_2) = \sum_{k=1}^{2} \mathbb E(X_2 | H_k) \cdot \mathbb P(H_k)$,   
$H_1$ - гипотеза, что первая - "1", $H_2$ - гипотеза, что первая - "2"  

$\mathbb P(H_1) = k \cdot \mathbb P(1)$  
$\mathbb P(H_2) = k \cdot \mathbb P(2)$  
$\mathbb P(H_1) + \mathbb P(H_2) = 1$, $k = \frac{1}{\mathbb P(H_1) + \mathbb P(H_2)}$

$\mathbb E(X_2 | H_1) = \frac{1}{\mathbb P(2)}$  
$\mathbb E(X_2 | H_2) = \frac{1}{\mathbb P(1)}$  

$\mathbb E(X_2) = \frac{1}{\mathbb P(1)} + \frac{1}{\mathbb P(2)} - \frac{2}{\mathbb P(1) + \mathbb P(2)}$

$\mathbb E(X) = \frac{1}{\mathbb P(1)} + \frac{1}{\mathbb P(2)} - \frac{1}{\mathbb P(1) + \mathbb P(2)} = \frac{1}{0,13} + \frac{1}{0,17} - \frac{1}{0,13 + 0,17} \approx 10,24$

# 8

В прямоугольной области, заданной ограничениями $|x| \leqslant 20$ и $|y| \leqslant 8$, случайным образом выбираются две точки: $(x_1, y_1)$ и $(x_2, y_2)$. Пусть $A$ и $B$ – события, состоящие в том, что: $A$ – расстояние между выбранными точками меньше $11$; $B$ – модуль разности $|x_1 − x_2|$ меньше 14. Найдите приближенно, методом Монте-Карло: 1) вероятность $\mathbb P(A)$;
2) условную вероятность $P(A|B)$.

Указание: получите в заданной прямоугольной области 100000 пар
точек и, используя все эти точки, найдите ответы, округляя их до одного
знака после запятой.

## Стохастически

In [37]:
X = uniform(loc=-20, scale=40)
Y = uniform(loc=-8, scale=16)

In [43]:
points = [(X.rvs(size=1)[0], Y.rvs(size=1)[0]) for _ in range(100_000)]
points

[(7.384083611588714, 4.5589673231171055),
 (-1.250977687656544, 6.233106390936486),
 (4.106626401515115, 6.254775571793484),
 (11.90113859215911, -5.535881609571252),
 (-19.770493499760544, -1.6892752194236333),
 (2.2381056629673814, -5.5816256139852065),
 (-13.138048269023358, -6.869910894461231),
 (17.484081467195736, -7.030426795524114),
 (-9.347398966836366, 4.70608402411716),
 (7.7381065517034, -1.9071969688860673),
 (-2.244316205338471, 0.48832466058358825),
 (-17.529979234444877, -2.9567576837119027),
 (2.168659406677584, -6.272916170594151),
 (9.247976721711698, -0.13777254428706698),
 (-16.17687417099647, 0.07330958050189018),
 (16.863209644534592, 5.073910300243421),
 (-10.594530438018124, -7.621709314070753),
 (-8.775613747354111, 0.9683690851462128),
 (-0.37061879147388055, 2.0139429430930473),
 (-19.04770456911595, 5.274602425476873),
 (-10.710490813866338, -5.075568659277389),
 (-1.5289224713905654, -6.762561993002992),
 (-0.30031783031432724, 3.0307385193528766),
 (0.917

In [47]:
points = np.array(points)

In [53]:
p = points[np.random.randint(points.shape[0], size=2), :]

In [54]:
a, b = p
a

array([-1.01627541,  4.81405113])

In [57]:
probs = 0

for n in range(100_000):
    a, b = points[np.random.randint(points.shape[0], size=2), :]
    x1, x2 = a[0], b[0]
    y1, y2 = a[1], b[1]

    probs += 1 if ((x1 - x2) ** 2 + (y1 - y2) ** 2) ** 0.5 < 11 else 0

probs / 100_000

0.3692

In [60]:
probs = 0

for n in range(100_000):
    a, b = points[np.random.randint(points.shape[0], size=2), :]
    x1, x2 = a[0], b[0]
    y1, y2 = a[1], b[1]

    if ((x1 - x2) ** 2 + (y1 - y2) ** 2) ** 0.5 < 11:
        probs += 1 if abs(x2 - x1) < 14 else 0

probs / 100_000

0.36632