## Задача 1

Даны значения величины заработной платы заемщиков банка (zp) и значения их поведенческого кредитного скоринга (ks):

zp = [35, 45, 190, 200, 40, 70, 54, 150, 120, 110],

ks = [401, 574, 874, 919, 459, 739, 653, 902, 746, 832].

Найдите ковариацию этих двух величин с помощью элементарных действий, а затем с помощью функции cov из numpy. Полученные значения должны быть равны.

Найдите коэффициент корреляции Пирсона с помощью ковариации и среднеквадратичных отклонений двух признаков, а затем с использованием функций из библиотек numpy и pandas.

### Решение

Ковариацию можно вычислить по формуле:

$$\mbox{cov}_{XY}=M(XY)-M(X)M(Y)$$

Коэффициент корреляции Пирсона можно вычислить по формуле:

$$r_{XY}=\frac{\mbox{cov}_{XY}}{\sigma_x\sigma_y}$$

In [None]:
import numpy as np
import pandas as pd

zp = np.array([35, 45, 190, 200, 40, 70, 54, 150, 120, 110])
ks = np.array([401, 574, 874, 919, 459, 739, 653, 902, 746, 832])

cov = np.mean(zp*ks) - np.mean(zp)*np.mean(ks)
corrcoef = cov / (np.std(zp)*np.std(ks))
print('Calculated cov:', cov)
print('Calculated corrcoef:', corrcoef)

df = pd.DataFrame(data=np.column_stack((zp,ks)), columns=['zp', 'ks'])
print('Pandas cov:', df.cov(ddof=0)['zp'][1])
print('Pandas corrcoef:', df.corr()['zp'][1])

print('Numpy cov:', np.cov(zp, ks, ddof=0)[0][1])
print('Numpy corrcoef:', np.corrcoef(zp, ks)[0][1])

Calculated cov: 9157.839999999997
Calculated corrcoef: 0.8874900920739158
Pandas cov: 9157.84
Pandas corrcoef: 0.8874900920739162
Numpy cov: 9157.84
Numpy corrcoef: 0.8874900920739162


## Задача 2

Измерены значения IQ выборки студентов, обучающихся в местных технических вузах:
131, 125, 115, 122, 131, 115, 107, 99, 125, 111.
Известно, что в генеральной совокупности IQ распределен нормально.
Найдите доверительный интервал для математического ожидания с надежностью 0.95.

### Решение

Используем распределение Стьюдента.

$$M\pm t_{\alpha/2}\cdot\frac{\sigma}{\sqrt{n}}$$ - границы доверительного интервала

$t_{\alpha/2}=t_{0.025}=2.262$

$M=118.1$

$\sigma=10.5457$

$M - t_{\alpha/2}\cdot\frac{\sigma}{\sqrt{n}}=118.1-2.262\cdot10.5457/\sqrt{10}\approx 110.557$

$M + t_{\alpha/2}\cdot\frac{\sigma}{\sqrt{n}}=118.1+2.262\cdot10.5457/\sqrt{10}\approx 125.643$

Ответ: $[110.557, \, 125.643]$

In [None]:
import numpy as np
from scipy import stats

x = np.array([131, 125, 115, 122, 131, 115, 107, 99, 125, 111])
print(f'mean={np.mean(x)}, std={np.std(x, ddof=1)}')

stats.t.interval(0.95, len(x)-1, loc=np.mean(x), scale=stats.sem(x))

mean=118.1, std=10.54566788359614


(110.55608365158724, 125.64391634841274)

## Задача 3

Известно, что рост футболистов в сборной распределен нормально с дисперсией генеральной совокупности, равной 25 кв.см. Объем выборки равен 27,
среднее выборочное составляет 174.2. Найдите доверительный интервал для математического ожидания с надежностью 0.95.

### Решение

Используем нормальное распределение.

$$M\pm Z_{\alpha/2}\cdot\frac{\sigma}{\sqrt{n}}$$ - границы доверительного интервала

$Z_{\alpha/2}=Z_{0.025}=-1.96$

$M + Z_{\alpha/2}\cdot\frac{\sigma}{\sqrt{n}}=174.2-1.96\cdot5/\sqrt{27}\approx 172.314$

$M - Z_{\alpha/2}\cdot\frac{\sigma}{\sqrt{n}}=174.2+1.96\cdot5/\sqrt{27}\approx 176.086$

Ответ: $[172.314,\, 176.086]$

In [None]:
import numpy as np
from scipy import stats

mean = 174.2
variance = 25
n = 27
stats.norm.interval(0.95, loc=mean, scale=np.sqrt(variance)/np.sqrt(n))

(172.3140237765397, 176.08597622346028)