# Исследование поведения пользователей мобильного приложения

**Цель исследования**:

Целью данной работы является анализ поведения пользователей, которые пользуются мобильным приложением компании-заказчика по продаже продуктов питания. Для этого составим воронку действий пользователей и исследуем результаты А/А/В-теста по изменению визуального дизайна приложения.

**Ход исследования**:

Для исследования был предоставлен датасет `logs_exp.csv`, который содержит данные о событиях и действиях пользователей, а так же отметку о принадлежности к группе тестирования. Само исследование пройдет в следующие несколько этапов:

1. Первичный обзор и предобработка данных

Произведем первичный обзор данных из датасета. При обзоре будет совершена проверка на возможные ошибки, которые могут помешать исследованию. После обзора данных проведем предобработку с целью исправления ошибок и пропущенных значений, при необходимости будут изменены типы данных.

2. Исследовательский анализ данных

Определим количество событий и пользователей в логе данных, среднее количество событий на пользователя, временной промежуток и полноту предоставленных данных.

3. Событийная аналитика и воронка действий пользователей

Оценим частоту совершения пользователями событий, возможный порядок событий для пользователя и составим воронку конверсии пользователей между шагами, чтобы выявить наиболее проблемные действия и долю пользователей, которая доходит до оплаты товара.

4. Анализ результатов А/А/В-тестирования

Рассчитаем количество пользователей каждой из групп, проверим контрольные группы А/А на наличие между ними статистически значимой разницы, проверим корректность разбивок на группы, а затем проверим наличие статистической значимости различий между контрольными и экспериментальной группой.

5. Общие выводы и рекомендации

Соберем промежуточные выводы предыдущих этапов и на их основе составим возможные рекомендации для компании-заказчика.

## Первичный обзор и предобработка данных

In [None]:
# импортируем библиотеки для работы с данными

import os
import pandas as pd
import numpy as np
from scipy import stats as st
import math as mth
from datetime import datetime, timedelta
import seaborn as sns
from matplotlib import pyplot as plt
from plotly import graph_objects as go
import plotly.express as px
import plotly.io as pio

In [None]:
# обьявим параметры для работы:

pd.options.display.float_format = '{:,.2f}'.format
pd.options.mode.chained_assignment = None
sns.set_style('darkgrid')
sns.set(font_scale = 2)
plt.rcParams.update({'axes.labelsize': 15,'axes.titlesize': 25})

os.chdir('C:\\Users\\79771\\Documents\\GitHub\\yandex_practicum_projects\\datasets')

In [None]:
# загрузим датасет через конструкцию try-except
# для работы в локальном режиме и переименуем столбцы:

try:
    logs = (pd
    .read_csv('logs_exp.csv', sep='\t')
    .rename(columns={'EventName':'event_type', 
                     'DeviceIDHash':'user_id', 
                     'EventTimestamp':'event_time', 
                     'ExpId':'test_group'})
)

except:
    logs = (pd
    .read_csv('/datasets/logs_exp.csv', sep='\t')
    .rename(columns={'EventName':'event_type', 
                     'DeviceIDHash':'user_id', 
                     'EventTimestamp':'event_time', 
                     'ExpId':'test_group'})
)

In [None]:
# напишем функцию для обзора таблиц

def overview(df):
    
    print('Общая информация:\n')
    df.info() # общая информация о таблице
    print()
    print('Описательная статистика:\n')
    display(df.describe(include='all', datetime_is_numeric=True))
    print()
    print('Пять случайных строк датасета:\n')
    display(df.sample(5)) # 5 случайных строк
    print()
    print('Проверка на дубликаты и пропуски:\n')
    
    # проверка явных дубликатов
    
    if df.duplicated().sum() > 0: 
        print(f'- В таблице содержатся дубликаты, {df.duplicated().sum()} строк.')
    else:
        print('- Дубликатов не обнаружено')
    print()
    
    # проверка пропусков
    
    if df.isna().sum().sum() > 0: 
        print(f'- В таблице содержатся пропуски, {df.duplicated().sum()} строк.')
    else:
        print('- Пропусков не обнаружено')  

# функция для визуализации пропусков в отдельных столбцах таблицы

def pass_value_barh(data):
    try:
        (
            (data.isna().mean()*100)
            .to_frame()
            .rename(columns = {0:'space'})
            .query('space > 0')
            .sort_values(by = 'space', ascending = True)
            .plot(kind = 'barh', figsize = (19,6), rot = -5, legend = False, fontsize = 16)
            .set_title('NaN Percentage' + "\n", fontsize = 22, color = 'SteelBlue')    
        );    
    except:
        print('Пропусков не осталось')


In [None]:
# рассмотрим через функцию весь датасет

overview(logs)

Каждая запись в логе — это действие или событие, связанное с пользователем. В процессе загрузки датасета мы поменяли названия столбцов на варианты формата 'snake_case' для оптимизации работы, теперь столбцы датасета выглядят следующим образом:

- `event_type` (ранее - `EventName`) — название события;
- `user_id` (`DeviceIDHash`) — уникальный идентификатор пользователя;
- `event_time` (`EventTimestamp`) — время события;
- `test_group` (`ExpId`) — номер эксперимента: 246 и 247 — контрольные группы, а 248 — экспериментальная.

Пропусков в данных не обнаружено, но присутствуют явные дубликаты строк - прежде чем разобраться с причинами возникновения дубликатов, рассмотрим каждый из столбцов отдельно. Начнем со столбца `event_time` - даты события:

In [None]:
# перед предобработкой на всякий случай сохраним сырой датасет

logs_raw = logs.copy()

# преобразуем дату

logs['event_time'] = pd.to_datetime(logs['event_time'], unit='s')

# выделяем дату в отдельный столбец для возможного когортного анализа

logs['event_date'] = (
    logs['event_time']
    .dt.date
    .astype('datetime64[ns]')
)

# выведем описательную статистику

logs['event_date'].describe(datetime_is_numeric=True)

- Данные содержат события с 25-07-2019 по 07-08-2019 - т.е., рассматриваемый временной промежуток составляет примерно две недели.

In [None]:
# столбец с событиями 
# выведем описательную статистику и посчитаем уникальные события

logs['event_type'].describe()
logs['event_type'].value_counts()

Всего в данных столбца содержится пять уникальных пользовательских событий:

- `MainScreenAppear` - отображение главного экрана
- `OffersScreenAppear` - отображение экрана с предложением
- `CartScreenAppear` - отображение экрана с корзиной товаров
- `PaymentScreenSuccessful` - экран с сообщением об успешной оплате
- `Tutorial` - обучение

In [None]:
# для экономии памяти преобразуем данные в категорию и перейдём к следующему столбцу:

logs['event_type'] = logs['event_type'].astype('category')

In [None]:
# столбец с уникальным идентификатором пользователя
# посчитаем количество уникальных значений столбца пользователей
# и используем предыдущий столбец для подсчёта среднего количества событий и покупок

unique_users = logs['user_id'].unique().size
events_total = logs['event_type'].size
mean_events = round(logs['event_type'].count()/unique_users)
mean_purhases = round(
    logs[
        logs['event_type'] == 'PaymentScreenSuccessful'
    ]['event_type']
    .count()/unique_users)

print(f'''- Исходная таблица содержит данные {unique_users} уникальных пользователей и {events_total} событий,
  на каждого пользователя в среднем приходится {mean_events} события, в том числе {mean_purhases} покупок.''')

In [None]:
# столбец с номером группы в A/A/B тестировании
# согласно документации в данных должно быть только три группы

logs['test_group'].value_counts()

Число групп в данных совпадает с числом групп в документации. Для удобства чтения заменим номер группы на соответствущее буквенное обозначение:

In [None]:
# контрольные группы назовём 'A_1' и 'A_2'
# а эксперементальную -'B'

logs['test_group'] = (
    logs['test_group']
    .replace({246:'A_1', 247:'A_2', 248:'B'})
    .astype('category')
)
logs['test_group'].value_counts()

In [None]:
# напишем функцию для проверки совпадений 
# идентификаторов пользователей разных групп

def inter_check(group_1, group_2):
    
    inter = np.intersect1d(
        logs[logs['test_group'] == group_1]['user_id'].unique(),
        logs[logs['test_group'] == group_2]['user_id'].unique()
    )
    return inter.size

inter = sum(
    [inter_check('A_1', 'A_2'),
     inter_check('A_1', 'B'),
     inter_check('A_2', 'B')]
)
            
print(f' Уникальных пользователей, попавших в две группы одновременно - {inter}')

In [None]:
dup_sum = logs.duplicated().sum()
dup_share = round(dup_sum/len(logs), 4)

print(f'Данные содержат {dup_sum} задублированных строк, их доля составляет {dup_share}.')

In [None]:
logs[logs.duplicated()].sort_values(by='user_id').head(20)

- Поверхностный осмотр строк-дубликатов датасета показал, что некоторые строки дублируются полностью, а другие дублируются во всем кроме даты. Наиболее вероятно, что причиной возникновения строк-дубликатов в датасете являются технические сбои работы программы или ошибки при выгрузке данных. Так как количество строк-дубликатов составляет заметно менее 1% от общего числа данных, что не является статистически значимым показателем - принято решение оставить данные как есть.

### Выводы - Первичный осмотр и предобработка данных

In [None]:
overview(logs)

- В процессе загрузки датасета мы поменяли названия столбцов на варианты формата 'snake_case' для оптимизации работы, добавили дополнительный столбец с датой в формате `datetime` для когортного анализа и заменили типы данных столбцов для экономии памяти.


- Таблица содержит данные 7551 уникальных пользователей  и 243329 событий - на каждого пользователя в среднем приходится 32 события, в том числе 5 покупок.


- Всего в данных столбца содержится пять уникальных пользовательских событий:

 - `MainScreenAppear` - отображение главного экрана
 - `OffersScreenAppear` - отображение экрана с предложением
 - `CartScreenAppear` - отображение экрана с корзиной товаров
 - `PaymentScreenSuccessful` - экран с сообщением об успешной оплате
 - `Tutorial` - обучение


- Поверхностный осмотр строк-дубликатов датасета показал, что некоторые строки дублируются полностью, а другие дублируются во всем кроме даты. Наиболее вероятно, что причиной возникновения строк-дубликатов в датасете являются технические сбои работы программы или ошибки при выгрузке данных. Так как количество строк-дубликатов составляет заметно менее 1% от общего числа данных, что не является статистически значимым показателем - принято решение оставить данные как есть.

## Исследовательский анализ данных

Основные задачи данного этапа исследования - это определить количество событий и пользователей в логе данных, среднее количество событий на пользователя, временной промежуток и полноту предоставленных данных.

Для начала посчитаем количество уникальных пользователей за каждый день (метрика DAU) и количество событий:

In [None]:
# сделаем копию датасета для eda

eda = logs.copy()

# считаем dau и количество событий

dau_events = (
    eda
    .pivot_table(index='event_date', 
                 values=('user_id', 'event_type'),
                 aggfunc={'user_id':'nunique', 'event_type':'count'}
                )
    .reset_index()
    .rename(columns={'event_date':'date',
                     'event_type':'events',
                     'user_id':'unique_users'
                    })
)

# визуализируем результат

dates = (
    dau_events['date']
    .dt.strftime('%d-%m')
)

def barp(par, ax):
    
    sns.barplot(data=dau_events,
                x=par, y='date', 
                ax=ax, palette='dark:salmon')

    
fig, (ax1, ax2) = plt.subplots(1, 2, figsize= (20, 10), sharey=True)

barp('unique_users', ax1)
barp('events', ax2)


ax1.set_yticklabels(dates)
ax1.set_ylabel(None)
ax1.set_xlabel('Количество уникальных пользователей', fontsize=20)

ax2.set_ylabel(None)
ax2.set_xlabel('Количество событий', fontsize=20)


plt.suptitle('Количество уникальных пользователей и событий', fontsize=25)
plt.tight_layout()

plt.show()

display(dau_events.T)

- На графиках количества уникальных пользователей и событий можно отметить минимальную активность до 31-07-2019, затем идет резкий подьем значений. Не исключена вероятность, что сравнительно малое количество данных в июле является следствием относительно недавнего основания компании-заказчика или технической ошибкой при сборе/выгрузке данных. Большинство уникальных пользователей и событий за день зафиксировано после 31 июля 2019 года, так что мы возьмем эту дату как отправную точку полноценной активности.

In [None]:
# фильтруем данные

eda = eda.query('20190731 <= event_time')

Теперь заново расчитаем основные параметры - количество уникальных событий и пользователей, среднее количество событий, распределение пользователей по группа эксперемента:

In [None]:
eda_unique_users = eda['user_id'].unique().size
eda_events_cnt = eda['event_type'].count()
eda_mean_events = round(eda['event_type'].count()/unique_users)
eda_mean_purhases = round(
    eda[
        eda['event_type'] == 'PaymentScreenSuccessful'
    ]['event_type']
    .count()/unique_users)

print(f'''- Обработанная таблица содержит данные {eda_unique_users} уникальных пользователей и {eda_events_cnt} событий,
  на каждого пользователя в среднем приходится {eda_mean_events} события,
  в том числе {eda_mean_purhases} покупок. Было удалено {round(len(eda)/len(logs), 2)}% оригинального датасета.
  Разница в количестве уникальных пользователей составляет {unique_users-eda_unique_users}.'''
     )

Сократив исследуемый период вдвое, мы потеряли лишь 1% данных и 9 уникальных пользователей - но среднее число событий и покупок осталось без изменений. Последний шаг - проверим соотношение распределения пользователей по эксперементальным группам:

In [None]:
# посчитаем уникальных пользователей оригинального датафрейма
# и добавим данные обработанной таблицы

test_groups = (
    logs['test_group']
    .value_counts()
    .reset_index()
    .rename(columns={
        'index':'group',
        'test_group':'original_users'})
    .merge(eda['test_group']
           .value_counts()
           .reset_index(), 
           right_on='index',
           left_on='group')
    .drop('index', axis=1)
    .rename(columns={'test_group':'actual_users'})
    .set_index('group')
)

# посчитаем оригинальное соотношение

test_groups['original_ratio'] = round(
    test_groups['original_users']/
    test_groups['original_users'].sum(), 2
)

# соотношение обработанной таблицы

test_groups['actual_ratio'] = round(
    test_groups['actual_users']/
    test_groups['actual_users'].sum(), 2
)

test_groups

Соотношение распределения пользователей по эксперементальным группам также не изменилось, что лишний раз подтверждает корректность установленного актуального периода исследования.

In [None]:
# обновляем датафрейм

logs = eda.copy()

# смотрим минимальное и максимальное время в обновлённых данных

display(logs['event_time'].min())
logs['event_time'].max()

### Выводы - Исследовательский анализ данных

- На графиках количества уникальных пользователей и событий можно отметить минимальную активность до 31-07-2019, затем идет резкий подьем значений. Не исключена вероятность, что сравнительно малое количество данных в июле является следствием относительно недавнего основания компании-заказчика или технической ошибкой при сборе/выгрузке данных. Большинство уникальных пользователей и событий за день зафиксировано после 31 июля 2019 года, так что мы возьмем эту дату как отправную точку полноценной активности.


- Выбранный актуальный период исследования - с 2019-07-31 01:11:46 по 2019-08-07 21:15:17.


- Обработанная таблица содержит данные 7542 уникальных пользователей, на каждого в среднем приходится 32 события, в том числе 5 покупок. Было удалено 1.0% оригинального датасета. Разница в количестве уникальных пользователей составляет 9. Сократив исследуемый период вдвое, мы потеряли лишь 1% данных и 9 уникальных пользователей - но среднее число событий и покупок осталось без изменений. 


- Соотношение распределения пользователей по эксперементальным группам также не изменилось, что лишний раз подтверждает корректность установленного актуального периода исследования.

## Событийная аналитика и воронка действий пользователей

Для построения воронки действий пользователей рассмотрим события пользователей и частоту их появления:

In [None]:
event_count = (
    logs.groupby('event_type')
        .agg({'user_id':'count'})
        .reset_index()
        .rename(columns = {'user_id':'event_count'})
        .sort_values('event_count', ascending = False)
)
event_count

- Всего в данных столбца содержится пять уникальных пользовательских событий:

 - `MainScreenAppear` - отображение главного экрана, самое распространенное событие
 - `OffersScreenAppear` - отображение экрана с предложением
 - `CartScreenAppear` - отображение экрана с корзиной товаров
 - `PaymentScreenSuccessful` - экран с сообщением об успешной оплате
 - `Tutorial` - обучение, самое редкое событие в данных

Далее визуализируем распределение типов событий для каждого дня рассматриваемого временного промежутка:

In [None]:
# группируем данные

events = (
    logs
    .pivot_table(index=('event_date','event_type'), 
                 values='user_id',
                 aggfunc=('count','nunique')
                )
    .reset_index()
    .rename(columns=dict(
        count = 'events',
        nunique='unique_users'))
    .sort_values('events', ascending=False)
)

# визуализируем количество событий по типам

labels = dict(
    event_date = 'День',
    event_type = 'Событие',
    events = 'Количество событий'
)

fig = px.bar(
    events, x='event_date', 
    y='events', color='event_type', 
    labels=labels,  pattern_shape="event_type"
)

fig.update_layout(title = 'Количество событий на каждый день исследуемого периода', title_x= .2)
fig.show()

- Тип события `Tutorial` выделяется на фоне остальных малочисленностью - вероятнее всего это событие не является обязательным для взаимодействия с интернет-магазином и пользователи его пропускают. В таком случае включать его в воронку событий будет нецелесообразно. Количество других событий же может говорить об их прямой последовательности, несмотря на то, что экран с предложением (`OffersScreenAppear`) может обозначать как товарное предложение для пользователя, так и акционное предложение.

Построим воронку событий пользователей:

In [None]:
# сгруппируем данные, уберём экран обучения из воронки

events = (
    logs
    .groupby('event_type')
    .agg(dict(user_id='nunique'))
    .drop(labels='Tutorial', axis=0)
    .reset_index()
    .append(
        dict(event_type='UsersTotalCount',
             user_id=eda_unique_users), ignore_index=True)
    .sort_values('user_id', ascending=False)
    .reset_index(drop=True)
    .rename(columns=dict(
        count = 'events',
        user_id='unique_users'))
)

In [None]:
# строим воронку

fig = go.Figure(go.Funnel(
    y = events['event_type'],
    x = events['unique_users'],
    textposition = "inside",
    textinfo = "value+percent initial",
    opacity = 0.6,marker = {"color": ["darkblue", "blue", "royalblue", "skyblue", "lightblue"],
    "line": {"width": [4, 2, 2, 3, 1, 1], "color": ["wheat", "wheat", "wheat", "wheat", "wheat"]}},
    connector = {"line": {"color": "wheat", "dash": "dot", "width": 3}})
    )


fig.update_layout(title = 'Воронка событий по количеству уникальных пользователей', title_x= .3)
fig.show()

- Воронка событий показывает очень хорошие показатели конверсии пользователей: за период наблюдения 47% от общего числа уникальных пользователей совершили покупку, а конверсия в шаг превышает 80% для всех этапов - за исключением этапа предложения (`OffersScreenAppear`, 62%)


- Разница между общим количеством пользователей и пользователями, которые взаимодействовали с главной страницей интернет-магазина (первый шаг воронки) составляет около 1.5%. Вполне вероятно, что данные пользователи могли пропустить главную страницу и перейти сразу к этапу предложения по внешней ссылке.


- Сравнивая показатели конверсии между шагами, переход между главным экраном и экраном товарного предложения (`MainScreenAppear` и `OffersScreenAppear`, соответственно) имеет самые низкие показатели (62% против 80% и более у остальных шагов). Вероятно, что это является особенностью маркетинга интернет-магазинов в целом и потенциальные покупатели чаще переходят по ссылкам с интересующим товаром напрямую, чем через главную страницу.

### Выводы - Событийная аналитика и воронка действий пользователей

- Всего в данных столбца содержится пять уникальных пользовательских событий:

 - `MainScreenAppear` - отображение главного экрана, самое распространенное событие
 - `OffersScreenAppear` - отображение экрана с предложением
 - `CartScreenAppear` - отображение экрана с корзиной товаров
 - `PaymentScreenSuccessful` - экран с сообщением об успешной оплате
 - `Tutorial` - обучение, самое редкое событие в данных
 
 
- Тип события `Tutorial` выделяется на фоне остальных малочисленностью - вероятнее всего это событие не является обязательным для взаимодействия с интернет-магазином и пользователи его пропускают. В таком случае включать его в воронку событий будет нецелесообразно. Количество других событий же может говорить об их прямой последовательности, несмотря на то, что экран с предложением (`OffersScreenAppear`) может обозначать как товарное предложение для пользователя, так и акционное предложение.


- Воронка событий показывает очень хорошие показатели конверсии пользователей: за период наблюдения 47% от общего числа уникальных пользователей совершили покупку, а конверсия в шаг превышает 80% для всех этапов - за исключением этапа предложения (`OffersScreenAppear`, 62%)


- Разница между общим количеством пользователей и пользователями, которые взаимодействовали с главной страницей интернет-магазина (первый шаг воронки) составляет около 1.5%. Вполне вероятно, что данные пользователи могли пропустить главную страницу и перейти сразу к этапу предложения по внешней ссылке.


- Сравнивая показатели конверсии между шагами, переход между главным экраном и экраном товарного предложения (`MainScreenAppear` и `OffersScreenAppear`, соответственно) имеет самые низкие показатели (62% против 80% и более у остальных шагов). Вероятно, что это является особенностью маркетинга интернет-магазинов в целом и потенциальные покупатели чаще переходят по ссылкам с интересующим товаром напрямую, чем через главную страницу.

##  Анализ результатов А/А/В-тестирования

Начнем анализ результатов с построения воронки событий в разрезе групп эксперимента:

In [None]:
# посчитаем общий размер групп и количество событий

def uniq_gr(group):
    unq = (
        logs[logs['test_group'] == group]['user_id']
        .unique()
        .size
    )
    return pd.Series(
        ['всего пользователей', group, unq],
        index=['event_type', 'test_group', 'unique_users']
    )

groups = [uniq_gr('A_1'), uniq_gr('A_2'), uniq_gr('B')]

# группируем данные, добавим итоги в таблицу

events_grouped = (
    logs
    .pivot_table(index=('event_type','test_group'), 
                 values='user_id',
                 aggfunc='nunique',
                )
    .rename(columns=dict(
        user_id='unique_users'))
    .reset_index()
    .append(groups, ignore_index=True)
    .sort_values('unique_users', ascending=False)
    .reset_index(drop=True)

)

In [None]:
# строим воронку

funn_df = events_grouped.query('event_type != "обучение"')

def funn(group):

    fig.add_trace(go.Funnel(
        name = 'Группа ' + group,
        y = funn_df[funn_df['test_group'] == group]['event_type'],
        x = funn_df[funn_df['test_group'] == group]['unique_users'],
        textinfo = "value+percent initial"))

fig = go.Figure()
   
for groups in ['A_1', 'A_2', 'B']:
    funn(groups) 

fig.update_layout(title = 'Воронка событий по количеству уникальных пользователей', title_x= .3)
fig.show()

Доля конверсии в шаг воронки с разбивкой по группам не отличается от общей воронки - но различие показателей контрольных групп на некоторых шагах составляет более 1%, что может быть плохим знаком. Потому при анализе результатов экспериментальной группы необходимо расчитать статистическую значимость различий конверсий контрольных групп.

Сформулируем общие гипотезы для всех групп:

- **H0** - нет статистической разницы между группами: доли пользователей, совершивших событие, в сравниваемых группах одинаковы.


- **H1** - есть статистическая разница между группами: доли пользователей, совершивших событие, в сравниваемых группах различны.

Так как данные для расчёта статистической значимости являются долями, оптимальным инструментом станет Z-критерий Фишера:

In [None]:
# напишем функцию для проверки гипотез

def stat_check(successes_1, successes_2, trials_1, trials_2, alpha=.05):
    
    p1 = successes_1/trials_1
    p2 = successes_2/trials_2
    p_combined = (successes_1 + successes_2) / (trials_1 + trials_2)

    difference = p1 - p2
    z_value = (
        difference / mth.sqrt(
            p_combined * (1 - p_combined) * (
                1/trials_1 + 1/trials_2))
    )

    distr = st.norm(0, 1) 
    alpha = alpha

    p_value = (1 - distr.cdf(abs(z_value))) * 2

    print('p-значение: ', p_value)

    if (p_value < alpha):
        print("Отвергаем нулевую гипотезу - есть основания полагать, что данные отличаются {}")
    else:
        print("Не получилось отвергнуть нулевую гипотезу - данные выборки не имеют статистически значимой разницы ")  

In [None]:
# создадим необходимые для проверки переменные

# количество пользователей каждой группы

total = (
    events_grouped
    .query('event_type == "всего пользователей"')
    .sort_values('test_group')
    .reset_index(drop=True)
)

a_1_total = total.loc[0]['unique_users']
a_2_total = total.loc[1]['unique_users']
b_total = total.loc[2]['unique_users']

# список событий

events_list = (
    events_grouped['event_type']
    .unique()
    .tolist()
)
del events_list[0]

events_grouped

In [None]:
# функция для получения значения группы для события

def get_val(group):
    val = int(
        events_grouped.query(
            'event_type == @event and test_group == @group')
        ['unique_users'])
    return val

# запускаем цикл проверки всех событий контрольных групп

run_count = 0 # счётчик количества проверок

for event in events_list:
    
    a_1 = get_val('A_1')
    a_2 = get_val('A_2')
    
    print(f'- Проверка групп A_1 и A_2 в событии "{event}"')
    print()
    stat_check(a_1, a_2, a_1_total, a_2_total)
    run_count += 1
    print()

 - Несмотря на разницу абсолютных значений, которую показала воронка событий, не получилось отвергнуть нулевую гипотезу при А/А-тесте контрольных групп - статистическая значимость разницы конверсий контрольных групп не наблюдается. 

Теперь сравним результаты эксперементальной группы по очереди с каждой из контрольных:

In [None]:
# запускаем цикл проверки событий для эксперементальной и первой контрольной группы

print('Сравниваем первую контрольную группу с эксперементальной')
print('\n')

for event in events_list:
    
    a_1 = get_val('A_1')
    b = get_val('B')
    
    print(f'- Проверка групп A_1 и B в событии "{event}"')
    print()
    stat_check(a_1, b, a_1_total, b_total)
    run_count += 1

    print()

print('\n')
print('Сравниваем вторую контрольную группу с эксперементальной')
print('\n')
    
# запускаем цикл проверки событий для эксперементальной и второй контрольной группы

for event in events_list:
    
    a_2 = get_val('A_2')
    b = get_val('B')
    
    print(f'- Проверка групп A_2 и B в событии "{event}"')
    print()
    stat_check(a_2, b, a_2_total, b_total)
    run_count += 1

    print()

- Не получилось отвергнуть нулевую гипотезу по проверкам результатов А/В-тестирования обоих контрольных групп - данные выборки не показывает статистически значимой разницы конверсии в событие.

Попробуем объединить контрольные группы и провести ещё одну проверку:

In [None]:
# запускаем цикл проверки событий для эксперементальной и обеих контрольных групп

print('Сравниваем обе контрольные группы с эксперементальной')
print('\n')

for event in events_list:
    
    a = get_val('A_1') + get_val('A_2')
    b = get_val('B')
    
    print(f'- Проверка групп A_1, А_2 и B в событии "{event}"')
    print()
    stat_check(a, b, a_1_total + a_2_total, b_total)
    run_count += 1

    print()

- На данный момент результаты всех проверок не указывают на наличие статистической значимой разницы групп в конверсии пользовательских событий при уровне значимости в 0.05.

## Общие выводы и рекомендации

#### Рекомендации:

- Результаты анализа А/А/В-теста шрифта текста мобильного приложения не показывают статистически значимых изменений метрик. Если цель эксперемента была в том, чтобы убедится, что нововведения не ухудшат показетели - его можно считать успешным. Но если целью новведения было улучшение показателей - проведение подобного эксперемента, учитывая потенциальные трудовые и материальные затраты, было нецелесообразно. В таком случае необходима более тщательная работа по приоритизации гипотез для проверки A/B тестом.


- Принять меры для более тщательного отбора пользователей для формирования контрольных групп - несмотря на отсутствие статистически значимой разницы с поправкой на множественное сравнение, абсолютные значения конверсии групп в большинстве событий имеет разницу, превышающую 1%. Без коррекции порога значимости включение данных первой контрольной группы гарантирует наличие статистически значимых различий, что в данном контексте негативно характеризует её репрезентативность.


#### Общие выводы:


**Первичный обзор и предобработка данных**


- В процессе загрузки датасета мы поменяли названия столбцов на варианты формата 'snake_case' для оптимизации работы, добавили дополнительный столбец с датой в формате `datetime` для когортного анализа и заменили типы данных столбцов для экономии памяти.


- Таблица содержит данные 7551 уникальных пользователей  и 243329 событий - на каждого пользователя в среднем приходится 32 события, в том числе 5 покупок.


- Поверхностный осмотр строк-дубликатов датасета показал, что некоторые строки дублируются полностью, а другие дублируются во всем кроме даты. Наиболее вероятно, что причиной возникновения строк-дубликатов в датасете являются технические сбои работы программы или ошибки при выгрузке данных. Так как количество строк-дубликатов составляет заметно менее 1% от общего числа данных, что не является статистически значимым показателем - принято решение оставить данные как есть.


**Исследовательский анализ данных**


- На графиках количества уникальных пользователей и событий можно отметить минимальную активность до 31-07-2019, затем идет резкий подьем значений. Не исключена вероятность, что сравнительно малое количество данных в июле является следствием относительно недавнего основания компании-заказчика или технической ошибкой при сборе/выгрузке данных. Большинство уникальных пользователей и событий за день зафиксировано после 31 июля 2019 года, так что мы возьмем эту дату как отправную точку полноценной активности.


- Выбранный актуальный период исследования - с 2019-07-31 01:11:46 по 2019-08-07 21:15:17.


- Обработанная таблица содержит данные 7542 уникальных пользователей, на каждого в среднем приходится 32 события, в том числе 5 покупок. Было удалено 1.0% оригинального датасета. Разница в количестве уникальных пользователей составляет 9. Сократив исследуемый период вдвое, мы потеряли лишь 1% данных и 9 уникальных пользователей - но среднее число событий и покупок осталось без изменений. 


- Соотношение распределения пользователей по эксперементальным группам также не изменилось, что лишний раз подтверждает корректность установленного актуального периода исследования.


**Событийная аналитика и воронка событий**

- Всего в данных столбца `event_type` содержится пять уникальных пользовательских событий:

 - `MainScreenAppear` - отображение главного экрана, самое распространенное событие
 - `OffersScreenAppear` - отображение экрана с предложением
 - `CartScreenAppear` - отображение экрана с корзиной товаров
 - `PaymentScreenSuccessful` - экран с сообщением об успешной оплате
 - `Tutorial` - обучение, самое редкое событие в данных
 
 
- Тип события `Tutorial` выделяется на фоне остальных малочисленностью - вероятнее всего это событие не является обязательным для взаимодействия с интернет-магазином и пользователи его пропускают. В таком случае включать его в воронку событий будет нецелесообразно. Количество других событий же может говорить об их прямой последовательности, несмотря на то, что экран с предложением (`OffersScreenAppear`) может обозначать как товарное предложение для пользователя, так и акционное предложение.


- Воронка событий показывает очень хорошие показатели конверсии пользователей: за период наблюдения 47% от общего числа уникальных пользователей совершили покупку, а конверсия в шаг превышает 80% для всех этапов - за исключением этапа предложения (`OffersScreenAppear`, 62%)


- Разница между общим количеством пользователей и пользователями, которые взаимодействовали с главной страницей интернет-магазина (первый шаг воронки) составляет около 1.5%. Вполне вероятно, что данные пользователи могли пропустить главную страницу и перейти сразу к этапу предложения по внешней ссылке.


- Сравнивая показатели конверсии между шагами, переход между главным экраном и экраном товарного предложения (`MainScreenAppear` и `OffersScreenAppear`, соответственно) имеет самые низкие показатели (62% против 80% и более у остальных шагов). Вероятно, что это является особенностью маркетинга интернет-магазинов в целом и потенциальные покупатели чаще переходят по ссылкам с интересующим товаром напрямую, чем через главную страницу.


**Анализ результатов А/А/В-тестирования**


- Доля конверсии в шаг воронки с разбивкой по группам не отличается от общей воронки - но различие показателей контрольных групп на некоторых шагах составляет более 1%, что может быть плохим знаком. Потому при анализе результатов экспериментальной группы необходимо расчитать статистическую значимость различий конверсий контрольных групп.


 - Несмотря на разницу абсолютных значений, которую показала воронка событий, не получилось отвергнуть нулевую гипотезу при А/А-тесте контрольных групп при пороге значимости в 0.05 - статистическая значимость разницы конверсий контрольных групп не наблюдается. 
 
- Не получилось отвергнуть нулевую гипотезу по проверкам результатов А/В-тестирования обоих контрольных групп при пороге значимости в 0.05 - данные выборки не показывает статистически значимой разницы конверсии в событие.


- На данный момент результаты всех проверок не указывают на наличие статистической значимой разницы групп в конверсии пользовательских событий.