# 0. Импортируем все необходимые пакеты

In [1]:
# расскоментировать и скачать, если нет этих библиотек
# !pip install sqlalchemy
# !pip install plotly

# packages
import pandas as pd
from sqlalchemy import create_engine, text
import plotly.graph_objects as go

## 1. Установка соединения с базой данных

In [2]:
engine = create_engine('postgresql://student:JvLda93aA@158.160.52.106:5432/postgres')

## 2. Делаем запрос к базе и вытаскиваем все необходимые данные

In [3]:
# Напишем запрос
query = ''' 

select date_trunc('week', visit_dttm) as dt,
    count(distinct c.client_rk) as amount_visit,
    count(distinct ac.client_rk) as amount_reg,
    count(distinct ap.account_rk) as amount_app,
    count(distinct ap.account_rk) filter(where game_flg = 1) as amount_game
from
msu_analytics.Client c
left join
msu_analytics.Account ac
using(client_rk)
left join
msu_analytics.Application ap
using(account_rk)
left join
msu_analytics.Game g
using(game_rk)
group by dt
order by dt

        '''

df = pd.read_sql_query(sql=text(query), con=engine.connect()) # подгружаем данные и записываем их в переменную df

In [4]:
df.head() # посмотрим на первые записи в нашей таблице

Unnamed: 0,dt,amount_visit,amount_reg,amount_app,amount_game
0,2022-08-29,111,32,7,5
1,2022-09-05,184,31,6,5
2,2022-09-12,167,43,16,8
3,2022-09-19,181,45,12,11
4,2022-09-26,195,59,17,17


## 3. Визуализируем наши данные

Итак, давайте визуализируем сначала количество клиентов, которые посетили сайт/зарегистрировались на сайте/оставили заявку на игру/посетили игру в динамике по неделям. Затем аналогичным образом уже посмотрим на визуализацию долей, чтобы лучше пронаблюдать воронку в динамике.

Строим оба графика, ведь важно следить за обеими метриками - количеством клиентов и долей клиентов.

Сначала строим график для количества:

In [5]:
x=df.dt

# Шаг 0. В это окошке будем строить графики
fig = go.Figure()

# Шаг 1.1. Строим линейный график, где визуализируем в динамике количество людей, посетивших сайт
fig.add_trace(go.Scatter(
    x=x, y=df.amount_visit,
    fill='tozeroy',
    name='Посетили сайт'
))

# Шаг 1.2. Строим линейный график, где визуализируем в динамике количество людей, зарегистрировавшихся на сайте
fig.add_trace(go.Scatter(
    x=x, y=df.amount_reg,
    fill='tozeroy',
    name='Зарегистрировались на сайте'
))

# Шаг 1.3. Строим линейный график, где визуализируем в динамике количество людей, оставивших заявку на игру
fig.add_trace(go.Scatter(
    x=x, y=df.amount_app,
    fill='tozeroy',
    name='Оставили заявку на игру'
))

# Шаг 1.4. Строим линейный график, где визуализируем в динамике количество людей, посетивших игру
fig.add_trace(go.Scatter(
    x=x, y=df.amount_game,
    fill='tozeroy',
    name='Посетили игру'
))

# Шаг 2.1. Определяем диапазон значений оси oY
fig.update_layout(yaxis_range=(0, 250))

# Шаг 2.2. Даем название нашему графику, а также даем названием обеим осям oX и oY
fig.update_layout(title='Динамика количества клиентов в разбивке по неделям', 
                  xaxis_title='Неделя', yaxis_title='Количество клиентов')

Аналогично строим график для долей:

In [6]:
x=df.dt

# Шаг 0. В это окошке будем строить графики
fig = go.Figure()

# Шаг 1.1. Строим линейный график, где визуализируем в динамике долю людей, посетивших сайт
fig.add_trace(go.Scatter(
    x=x, y=df.amount_visit / df.amount_visit,
    fill='tozeroy',
    name='Посетили сайт'
))

# Шаг 1.2. Строим линейный график, где визуализируем в динамике долю людей, зарегистрировавшихся на сайте
fig.add_trace(go.Scatter(
    x=x, y=df.amount_reg / df.amount_visit,
    fill='tozeroy',
    name='Зарегистрировались на сайте'
))

# Шаг 1.3. Строим линейный график, где визуализируем в динамике долю людей, оставивших заявку на игру
fig.add_trace(go.Scatter(
    x=x, y=df.amount_app / df.amount_visit,
    fill='tozeroy',
    name='Оставили заявку на игру'
))

# Шаг 1.4. Строим линейный график, где визуализируем в динамике долю людей, посетивших игру
fig.add_trace(go.Scatter(
    x=x, y=df.amount_game / df.amount_visit,
    fill='tozeroy',
    name='Посетили игру'
))

# Шаг 2.1. Определяем диапазон значений оси oY
fig.update_layout(yaxis_range=(0, 1))

# Шаг 2.2. Даем название нашему графику, а также даем названием обеим осям oX и oY
fig.update_layout(title='Динамика доли клиентов в разбивке по неделям', 
                  xaxis_title='Неделя', yaxis_title='Доля клиентов')

Отметим все наблюдения:
1. Очень хорошо видно, что у доли клиентов, пришедших на игру, есть тренд на спад. (при этом остальные доли не падают!)
2. Остальное, в целом, все равномерно, не считая пары выбросов.

Что можно сделать?

Например, посмотреть, что было на неделях с началом 5 декабря 2022 года и с началом 12 декабря 2022 года. Ведь именно в тот момент начался спад доли клиентов, пришедших на игру.