# Харьковцов А.В. Теория вероятностей и математическая статистика ДЗ_6

In [54]:
import numpy as np
import scipy.stats
from scipy.stats import t
from scipy.stats import norm
from math import factorial

# Формула числа сочетаний`
def combinations(n, k):
    return int(factorial(n) / (factorial(k) * factorial(n - k)))

# Формула Бернулли
def bernulli(n, k, p):
    q = 1 - p
    return (combinations(n, k) * p**k * q**(n - k) * 100)

# формула Пуассона
def pouasson(m, n, p):
    lambda_ = n * p
    return (lambda_**m / (factorial(m)) * np.exp(-lambda_)) * 100


# Задача 1

Даны значения величины заработной платы заемщиков банка (zp) и значения их поведенческого кредитного скоринга (ks):
zp = [35, 45, 190, 200, 40, 70, 54, 150, 120, 110],
ks = [401, 574, 874, 919, 459, 739, 653, 902, 746, 832].
Найдите ковариацию этих двух величин с помощью элементарных действий, а затем с помощью функции cov из numpy
Полученные значения должны быть равны.
Найдите коэффициент корреляции Пирсона с помощью ковариации и среднеквадратичных отклонений двух признаков,
а затем с использованием функций из библиотек numpy и pandas.


$Решение:$

$$cov_{XY} = M[(X - M(X))(Y - M(Y))] = M(XY) - M(X)M(Y)=\overline{X \cdot Y} - \overline{X} \cdot \overline{Y}$$

$cov_{zp,ks} = \overline{X \cdot Y} - \overline{X} \cdot \overline{Y}$

$коэффициент$  $корреляции$  $Пирсона:$

$$r_{XY} = \frac{cov_{XY}}{\sigma_{X}\sigma_{Y}}$$


In [27]:
# Решение:
zp=np.array([35, 45, 190, 200, 40, 70, 54, 150, 120, 110])
ks=np.array([401, 574, 874, 919, 459, 739, 653, 902, 746, 832])
xy = zp * ks

n=len(zp)

mx = zp.sum()/n
my = ks.sum()/n
mxy = xy.sum()/n

mmxy = mx * my

print (f"Среднее по произведению = {mxy:.2f}; Среднее по zp = {mx:.2f}, Среднее по ks = {my:.2f}")
print (f"Ковариация = {mxy - mmxy:.2f}")
print (f"Ковариация с помощью функц  cov:\n {np.cov(zp,ks,ddof=0)}\n")

sx = (((zp-mx)**2).sum()/n)**.5
sy = (((ks-my)**2).sum()/n)**.5
rxy = (mxy-mmxy)/(sx*sy)
print (f"Коэффициент корреляции Пирсона = {rxy:.4f}")
print (f"Ковариация с помощью функц  cov:\n {np.corrcoef(zp,ks)}")

Среднее по произведению = 81141.70; Среднее по zp = 101.40, Среднее по ks = 709.90
Ковариация = 9157.84
Ковариация с помощью функц  cov:
 [[ 3494.64  9157.84]
 [ 9157.84 30468.89]]

Коэффициент корреляции Пирсона = 0.8875
Ковариация с помощью функц  cov:
 [[1.         0.88749009]
 [0.88749009 1.        ]]


# Задача 2

Измерены значения IQ выборки студентов,
обучающихся в местных технических вузах:
131, 125, 115, 122, 131, 115, 107, 99, 125, 111.
Известно, что в генеральной совокупности IQ распределен нормально.
Найдите доверительный интервал для математического ожидания с надежностью 0.95.

$Решение: $

$$T_{1,2} = \overline{X} \pm t_{v,\alpha/2} \cdot\frac{\sigma}{\sqrt{n}} $$






In [52]:
# Решение:
iq=np.array([131, 125, 115, 122, 131, 115, 107, 99, 125, 111])
p=(1-0.95)/2
n=len(iq)
v=n-1
m = np.mean(iq)

print (f"Среднее выборочное: {m:.2f}")

s=np.std(iq)
print (f"Среднее квадратичное отклонение: {s:.2f}")
print (f"Доверительный интервал с вероятностью 95%: [{m+t.ppf(p, v)*s/n**0.5:.2f}, {m-t.ppf(p, v)*s/n**0.5:.2f}]")


Среднее выборочное: 118.10
Среднее квадратичное отклонение: 10.00
Доверительный интервал с вероятностью 95%: [110.94, 125.26]


# Задача 3

Известно, что рост футболистов в сборной распределен нормально
с дисперсией генеральной совокупности, равной 25 кв.см. Объем выборки равен 27,
среднее выборочное составляет 174.2. Найдите доверительный интервал для математического
ожидания с надежностью 0.95

$Решение: $

$$M \pm Z_{\alpha/2} \cdot\frac{\sigma}{\sqrt{n}} $$

$174.2\pm Z_{(1-0.95)/2} \cdot\frac{\sqrt{25}}{\sqrt{27}} $


$[172.31; 167.43] $

In [56]:
# Решение:
p=(1-0.95)/2
n=27
m = 174.2
d = 25
s = d**0.5
print (f"Среднее квадратичное отклонение: {s:.2f}")
print (f"Доверительный интервал с вероятностью 95%: [{m+norm.ppf(p)*s/n**0.5:.2f}, {m-norm.ppf(p)*s/n**0.5:.2f}]")


Среднее квадратичное отклонение: 5.00
Доверительный интервал с вероятностью 95%: [172.31, 176.09]
