В предыдущих модулях мы познакомились с основами разведывательного анализа данных (`EDA`) и изучили базовую математическую статистику в контексте EDA — научились рассчитывать `среднее`, `медиану` и `моду`. В этом модуле мы научимся делать выводы об этих величинах, если известны данные не обо всех объектах, а только о части из них.

> Представим, что перед полноценным запуском рекомендательной системы в онлайн-магазине мы протестировали её на части покупателей и увидели, что средний чек заказа вырос. Означает ли это, что мы увидим такой же результат и на других заказах? Можно ли запускать рекомендательную систему для всех покупателей?

Отвечать на подобные вопросы позволяет аппарат `статистических тестов`.

`Статистические тесты` — один из наиболее важных инструментов в Data Science, который позволяет проверять гипотезы и принимать решения на основе данных. Благодаря статистическим тестам можно провести анализ и сделать вывод о том, являются ли различия между двумя выборками данных случайными или обусловленными каким-то влиянием.

Вам будут встречаться разнообразные бизнес-задачи, и статистические тесты позволят избегать ошибочных решений. В примере выше благодаря статистическим тестам удастся сэкономить ресурсы компании, если окажется, что запуск рекомендательной системы на самом деле неэффективен.

> Важно отметить, что статистические тесты не являются абсолютно надёжными и не всегда дают точные результаты. Чтобы правильно их использовать, требуются определённые знания, в том числе в области математической статистики. Кроме того, результаты статистических тестов могут зависеть от выбора метода и параметров, которые использовались при их проведении. Поэтому важно правильно выбирать тесты и использовать их в сочетании с другими методами анализа данных.

В этом модуле мы узнаем, как проводить статистические тесты, выбирать подходящий тест и оценивать результаты исследования.

Модуль можно условно разделить на две части:

- Первая посвящена теории: мы изучим основные определения и понятия, связанные со статистическими тестами.
- Во второй части мы перейдём к практическим примерам и задачам и решим их на `Python`.

В МОДУЛЕ МЫ РАЗБЕРЁМ:

- что такое статистическая гипотеза;
- какие бывают статистические тесты;
- что такое значимость, уровень значимости, ошибки первого и второго рода.

ВЫ НАУЧИТЕСЬ:

- различать типы гипотез;
- выдвигать собственные гипотезы;
- самостоятельно выбирать статистический критерий и пошагово выполнять алгоритм статистической проверки;
- проводить различные статистические тесты на языке Python.

### Необходимость в статистических тестах

> Несмотря на то что статистические тесты часто используют для принятия бизнес-решений, всё же бывают ситуации, когда обращаться к ним необязательно. О таких ситуациях мы поговорим отдельно в конце модуля.

В этом и последующих юнитах мы рассмотрим случаи, когда без статистических тестов не обойтись. Для начала введём понятия **«генеральной совокупности»** и **«выборки»** — они пригодятся нам в дальнейших рассуждениях.

>**Генеральной совокупностью** называется всё множество интересующих нас объектов, а **выборкой** — случайное подмножество этого множества.

Часто множество объектов генеральной совокупности настолько большое, что мы не можем посчитать все объекты. Например, все заказы в онлайн-магазине — это генеральная совокупность, а часть заказов — выборка. Мы не можем посчитать все заказы как минимум потому, что часть из них ещё не совершена.

<img src='img/DST_EDA_4_2_1.png'>

Мы уже знаем, что на основе выборки (части наблюдений) можно измерить следующие показатели:

- выборочное среднее (центральная мера распределения);
- выборочное стандартное отклонение (мера разброса);
- выборочная пропорция.

Однако на самом деле нас всегда интересуют параметры генеральной совокупности:

- истинное среднее — математическое ожидание ($\mu$, «мю»);
- истинное стандартное отклонение ($\sigma$, «сигма»);
- истинная пропорция ($p$).

Например, если речь идёт о среднем чеке заказов в онлайн-магазине, то нам важно узнать его не на выборке, а на всех заказах, то есть на генеральной совокупности.

> Важно помнить о разнице между выборочными статистиками и параметрами генеральной совокупности.
- `Выборочная статистика` — это случайная величина, так как рассчитана на случайной выборке. Например, значение среднего на двух разных выборках будет разным.
- `Параметр генеральной совокупности` — это константа, конкретное число, которое, как правило, нам неизвестно и никогда не станет известным.
- Однако благодаря `статистическим тестам` мы можем делать выводы о параметрах всей генеральной совокупности, имея только выборку наблюдений.

Как это можно сделать? Давайте разбираться.

>Допустим, мы хотим увеличить средний чек заказа в онлайн-магазине, внедрив новую рекомендательную систему. Команда Data Science должна оценить, насколько эффективно будет работать эта система. Запускать её для всех покупателей и после этого анализировать эффективность рискованно, так как требует вложения средств. Система может оказаться неэффективной, и её массовое внедрение может привести к репутационным издержкам.

Как тогда поступить?

Выходом будет:

1. Показать рекомендации только части покупателей (выборке).
2. Замерить средний чек на полученной выборке (пусть он получится равным $N$ рублей).
3. Провести статистическое тестирование, чтобы проверить значимость полученного результата для всей генеральной совокупности. То есть мы должны понять, есть ли разница в средних чеках по всем заказам (математических ожиданиях) до и после внедрения рекомендательной системы.
4. Сделать вывод, запускать ли рекомендательную систему на весь магазин.

<img src='img/DST_EDA_4_2_2.png'>

Почему нельзя просто сделать вывод, что если средний чек в выборке равен $N$ рублей, то он также будет равен $N$ рублей на всех заказах? Потому что, возможно, значения, полученные на выборке, не отражают значения на генеральной совокупности. Например, на рисунке ниже средний чек заказов в выборке меньше, чем средний чек по всем заказам.

<img src='img/DST_EDA_4_2_3.png'>

- Если бы мы запустили рекомендательную систему сразу на всех покупателей онлайн-магазина, то узнали бы, эффективна ли она, без статистических тестов, так как измерили бы все объекты в генеральной совокупности. Однако в случае неэффективности системы было бы уже поздно что-то менять, так как ресурсы компании уже потрачены на её внедрение.

- Если бы мы запустили рекомендательную систему только для части покупателей, но не провели статистические тесты, полученные выводы нельзя было бы распространить на все заказы.

Резюмируем:

- Статистические тесты позволяют сделать выводы о всей генеральной совокупности по выборке.
- Статистические тесты нужны в случаях, когда мы не можем измерить все объекты в генеральной совокупности.
- Без статистических тестов выводы, полученные на выборке, нельзя распространить на всю генеральную совокупность.



- Для более глубокого погружения в статистику, необходимую специалисту по Data Science, обратитесь к книге [«Практическая статистика для специалистов Data Science»](https://www.litres.ru/piter-brus-32090127/prakticheskaya-statistika-dlya-specialistov-d-67725521/).
- Менее формально на статистику позволит посмотреть книга В. Савельева [«Статистика и котики»](https://www.litres.ru/book/vladimir-savelev-10569666/statistika-i-kotiki-28731109/chitat-onlayn/).