# Счастливые случайности

В этом задании мы будем работать с искусственно-сгенерированными данными. Для этого нам понадобится модуль random (в начале программы нужно импортировать модуль: import random). Для генерации очередного случайного числа достаточно вызвать функцию random.random(), которая вернёт случайное число от  до .

Задачи в этом проекте будут связаны с подсчётом некоторых показателей в наборе случайно сгенерированных данных.

Эти задачи очень часто встречаются в реальной жизни, если вы анализируете данные. Например, если вы проводите какой-то эксперимент, вам часто нужно не только посчитать значение какого-то параметра, но и оценить статистическую значимость результата. Дело в том, что когда вы имеете дело со случайными процессами, результат никогда не бывает точным — можно лишь говорить о вероятности каких-то событий.

# ПРИМЕР 1

Если вы исследуете заболеваемость во время эпидемии, каждый день заболевает случайное количество людей. То, что в какой-то день заболело, скажем, в пять раз больше людей, чем обычно, само по себе ещё ни о чём не говорит. Однако, если вы проанализируете данные за месяц, то можете сделать выводы о трендах и о статистической значимости данных.

## ПРИМЕР 2

Пусть вы привили  людей новой вакциной.  людям вы дали старую вакцину (или дали плацебо). Через месяц в группе с новой вакциной было  тяжёлого течения болезни, а в контрольной группе — . Какой вывод вы можете сделать об эффективности вакцины? На самом деле всё зависит от . Если , то это может быть совпадением. Если же , то, наиболее вероятно, это значимый результат.

# Задание 1

А начнём мы с генерации данных. Функция `random.random()` возвращает нам число от `0` до `1`. Что произойдет, если мы просуммируем  `1000` таких чисел и посчитаем их среднее арифметическое? Интуиция подсказывает нам, что мы должны получить `0.5` — середину между `0.0` и `1.0`. Давайте это проверим!

Напишите функцию, которая вычисляет и возвращает среднее арифметическое  случайных чисел. Функция должна называться `avg_of_random_numbers`, у неё должен быть единственный аргумент `n` — количество равномерно-распределённых случайных чисел, которые необходимо усреднить.

In [1]:
import random

def avg_of_random_numbers(n):
  lst = []
  i = 1
  
  while i <= 10:
      num = random.random()
      lst.append(num)
      i +=1
      
  return sum(lst) / len(lst)
  
avg_of_random_numbers(1000)

0.6099389930966223

# Задание 2

В математической статистике удобно работать со случайными величинами, у которых среднее значение (математическое ожидание) равно `0`, а разброс (дисперсия) равен `1`.

Давайте приведём случайную величину, полученную в предыдущей задаче, к нужным значениям математического ожидания и дисперсии. Для этого достаточно вычесть математическое ожидание (в нашем случае `0.5` из полученного в прошлом задании результата и разделить его на корень из дисперсии (в нашем случае `1/sqrt(12 * n)`).

Назовите функцию `get_normal_random`. Она должна принимать единственный аргумент `n` — количество повторений для усреднения. Аргумент  должен передаваться в функцию из предыдущей задачи (`avg_of_random_numbers`).

In [2]:
import random
import math

def get_normal_random(n):
    return (0.5 / math.sqrt(12 * n))
    
get_normal_random(0.5)


0.20412414523193154

# Задание 3

Теперь мы хотим оценить основные характеристики полученной случайной величины: математическое ожидание и дисперсию. Мы конструировали `get_normal_random()` так, чтобы матожидание было равным `0`, а дисперсия — `1`. Давайте убедимся в этом.

Напишите две функции, вычисляющие математическое ожидание и дисперсию полученной случайной величины соответственно. Первую функцию назовите `calc_mean`, вторую — `calc_var`. Они должны принимать два аргумента — целые числа `n` и `m`.

`n` — количество повторений для усреднения (этот аргумент должен передаваться в `get_normal_random`).
`m` — сколько раз вызывать предыдущую функцию, чтобы оценить математическое ожидание и дисперсию.

In [3]:
from math import sqrt
from random import random
from numpy import mean,var



def get_normal_random(n):
     return (mean([random() for i in range(n)]) - 0.5)/(1/sqrt(12*n))

def calc_mean(n,m):
     s=0
     for i in range(m):
         s=s+get_normal_random(n)
     return s/m

def calc_var(n,m):
    s=0
    s1=0
    for i in range(m):
        s=s+get_normal_random(n)
        s1=s1+(get_normal_random(n))**2
    return s1/m  - (( s/m)**2)

# Задание 4

Вероятно, вы слышали про правило трёх сигм (сигма — это квадратный корень из дисперсии). Правило утверждает, что нормально распределённая случайная величина может выходить за пределы трёх сигм только в `0.28%` случаев. Например, если мы возьмём  `10000` реализаций случайной величины из задания №2, то примерно `28` из них будут по абсолютному значению больше `3`.

В этом задаче вам предлагается это проверить.

Напишите функцию `estimate_outliers`, которая принимает два числа `n` и `m`.

`n` — количество повторений для усреднения (этот аргумент должен передаваться в `get_normal_random`).
`m` — количество экспериментов, которые мы хотим провести.
В результате функция должна вернуть количество случаев, когда случайная величина была вне пределов от `-3` до `3`.

In [4]:
import random
import math

def avg_of_random_numbers(n):
    sum = 0
    for i in range(n):
        sum += random.random()
    return sum / n

def get_normal_random(n):
    result = (avg_of_random_numbers(n) - 0.5) / (1 / math.sqrt(12 * n))
    return result

def estimate_outliers(n,m):
    count = 0
    for i in range(m):
        x = get_normal_random(n)
        if x > 3 or x < -3:
            count +=1
    return count

# Задание 5

**В задании №2** мы получили стандартную нормальную величину(т. е., *такую, которая имеет матожидание 0 и дисперсию 1*). Давайте теперь получим нормальную случайную величину с заданным матожиданием `m` и дисперсией `d`.

Сначала разберёмся с дисперсией. Для того, чтобы получить случайную величину с дисперсией `d`, нужно стандартную нормальную величину умножить на `sqrt(d)`. Теперь давайте поменяем математическое ожидание (сделаем  `m` вместо `0`). Это сделать тоже просто - нужно к случайной величине, полученной на предыдущем шаге, прибавить `m`.

В итоге у вас должна получиться функция `get_normal_random_md(avg_reps, m, d)` , которая принимает следующие параметры:

*   `avg_reps`: сколько раз усреднять равномерно-распределённую случайную величину;
*   `m`: желаемое матожидание;
*   `d`: желаемая дисперсия.
— и возвращает случайную величину.

In [5]:
import random
import math
from numpy import mean


def get_normal_random(n):
  return (mean([random() for i in range(n)]) - 0.5) / (1 / sqrt(12 * n * d))

def get_normal_random_md(avg_reps, m, d):
    s,n = 0.0, 0
    
    for i in range(avg_reps):
        
        s+=random.random()
        n+=1
    return (s/n - 0.5) * math.sqrt(12*n*d)+m