# Анализ метрик эффективности рассылок компании, оказывающей профессиональные услуги

Данные за 2,5 года с августа 2018 по текущий момент, декабрь 2020. 

Расчитаны средние метрики и метрики в разрезе тем рассылок: 
- Открываемость (open rate)
- Кликабельность (click-through rate)
- Переходы по отношению к открытиям (click-to-open rate)
- Процент отписок (unsubscribe rate)
- Процент возвратов (bounce rate)

Метрики расчитаны по [формулам](https://www.carrotquest.io/blog/email-marketing-metrics/) 

Для сравнения использованы средние, согласно [US Email Marketing Benchmarks (2020)](https://www.campaignmonitor.com/resources/guides/us-email-marketing-benchmarks-2020-by-day-and-industry/), 
показатели метрик для финансовых услуг:
- Открываемость (open rate): 16%
- Кликабельность (click-through rate): 2.5%
- Переходы по отношению к открытиям (click-to-open rate): 15.6%
- Процент отписок (unsubscribe rate): 0.2%
- Процент возвратов (bounce rate): 1.3%

## Рекомендации

Рассылки имеют высокие показатели метрик: click-through rate и click-to-open rate (они взаимосвязаны).

Хорший показатель открываемости (open rate): 14%, однако он незначительно ниже, чем в среднем по отрасли (16%).

Самая большая проблема с процентом возвратов (bounce rate), он составляет 12%, и этот показатель в 10 раз превышает средний по рынку (1.3%). Так как unsubscribe rate низкий, полагаю, что дело в метрвых адресах.


### Открываемость (open rate) чуть ниже, чем по отрасли
- Тема письма очень важна! 
- Валидация email адресов, чистка базы
- Выбор времени отправки: согласно [US Email Marketing Benchmarks (2020)](https://www.campaignmonitor.com/resources/guides/us-email-marketing-benchmarks-2020-by-day-and-industry/) оптимальное время для финансовых услуг: понедельник и среда

### Процент возвратов (bounce rate) значительно выше, чем в среднем по отрасли
- Валидация email адресов, чистка базы, удаление несуществующих адресов

### Невозможно расчитать конверсию (сколько подписчиков выполнили целевое действие)
- Интегрировать систему рассылок с системой аналитики и отслеживать источники переходов при помощи utm-меток
- Назначить целевое действие: форма запроса

In [2]:
import pandas as pd
import numpy as np
from scipy import stats as st
import math as mth
import matplotlib.pyplot as plt 

from plotly import graph_objects as go
import plotly.express as px

import warnings
warnings.simplefilter('ignore')

In [3]:
mail = pd.read_excel('')

In [4]:
mail.to_csv('mail.csv', encoding='utf-8', index=False)

In [5]:
mail.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 85 entries, 0 to 84
Data columns (total 17 columns):
 #   Column            Non-Null Count  Dtype         
---  ------            --------------  -----         
 0   Campaign name     85 non-null     object        
 1   Address book      85 non-null     object        
 2   Tag               85 non-null     object        
 3   Sent date         85 non-null     datetime64[ns]
 4   Sent              85 non-null     float64       
 5   Delivered         85 non-null     float64       
 6   Opened            85 non-null     int64         
 7   Redirect          85 non-null     float64       
 8   Errors            85 non-null     float64       
 9   Unsubscribed      85 non-null     float64       
 10  Marked as spam    85 non-null     int64         
 11  Delivered %       85 non-null     float64       
 12  Opened %          85 non-null     float64       
 13  Redirect %        85 non-null     float64       
 14  Errors %          85 non-nul

In [7]:
mail.head()

Преобразование даты в формат datetime и выделение из нее месяца и года в отдельные колонки

In [None]:
mail['Date'] = pd.to_datetime(mail['Sent date'], format='%d.%m.%Y %H:%M:%S',infer_datetime_format=True)

In [None]:
mail['Month'] = mail['Date'].dt.month
mail['Year'] = mail['Date'].dt.year

### Сколько рассылок в год? 

In [None]:
mail.groupby(by ='Year')['Campaign name'].count()

### Количество рассылок по темам

In [None]:
pivot_table_by_tag = mail.pivot_table(index=['Tag'], aggfunc={'Campaign name': 'count'}).reset_index()
pivot_table_by_tag

### Среднее количество рассылок в месяц

In [None]:
pivot_table_by_month_total['Количество рассылок'].mean()

### Метрики эффективности email-рассылок
- Открываемость (open rate)
- Кликабельность (click-through rate)
- Переходы по отношению к открытиям (click-to-open rate)
- Процент отписок (unsubscribe rate)
- Процент возвратов (bounce rate)

In [None]:
mail['open_rate'] = (mail['Opened']/mail['Delivered'])*100

In [None]:
mail['click_through_rate'] = (mail['Redirect']/mail['Delivered'])*100

In [None]:
mail['click_open_rate'] = (mail['Redirect']/mail['Opened'])*100

In [None]:
mail['bounce_rate'] = (mail['Errors']/mail['Sent'])*100

In [None]:
mail['unsubscribe_rate'] = (mail['Unsubscribed']/mail['Delivered'])*100

In [None]:
mail.sample(3)

### Воронка отправки, доставки, октрытий, переходов

In [None]:
mail_mean_m = mail.mean()
mail_mean_m.round(2)

In [None]:
fig = go.Figure(go.Funnel(
    y = ['Sent', 'Delivered','Opened', 'Redirect'],
    x = [572.05, 497.28, 59.38, 17.57],
    textinfo = "value+percent previous"))

fig.show()


### Средние по метрикам в разрезе года

In [None]:
mail_mean = mail.pivot_table(index=['Year']).reset_index()
colums_t = ['Year','open_rate', 'click_open_rate', 'click_through_rate', 'bounce_rate', 'unsubscribe_rate'] 
mail_mean[colums_t].round(2).style.background_gradient(cmap='Greens')

### Количество рассылок в год, помесячно

In [None]:
pivot_table_by_month_total = mail.pivot_table(index=['Month', 'Year'], aggfunc={'Campaign name': 'count'}).reset_index()
pivot_table_by_month_total.columns=['Месяц', 'Год', 'Количество рассылок']
fig = px.bar(pivot_table_by_month_total, x="Год", y="Количество рассылок", color = 'Месяц', title="Количество рассылок в год, помесячно")
fig.show()

### Количество рассылок в год в разрезе темы: Обзор законодательства, новости МСФО, РСБУ, новости компании и рассылка, связанная с Covid 

In [None]:
pivot_table_by_tag = mail.pivot_table(index=['Tag', 'Year'], aggfunc={'Campaign name': 'count'}).reset_index()
fig = px.bar(pivot_table_by_tag, 
             x="Year", y="Campaign name", color = 'Tag',
             title="Количество рассылок в год, по теме рассылки")
fig.show()

### Метрики по теме рассылки 

In [None]:
columns_rates = ['Tag','open_rate', 'click_open_rate', 'click_through_rate', 'bounce_rate', 'unsubscribe_rate']

mail_mean_rates_tag = pd.DataFrame(mail, columns=columns_rates)

In [None]:
mail_mean_rates_tag_pivot = mail_mean_rates_tag.pivot_table(index=['Tag']).reset_index()

mail_mean_rates_tag_pivot.round(2).sort_values(by = 'open_rate', ascending = False).round(2).style.background_gradient(cmap='Greens')

### Топ-5 рассылок по open rate

In [None]:
opened_top = mail.sort_values(by = 'open_rate', ascending = False)
colums = ['Year','Campaign name', 'Tag', 'open_rate']
opened_top[colums].head(5)

### 3 рассылки с самым низким  open rate

In [None]:
opened_top[colums].tail(3)

### Топ-5 рассылок по кликабельности (click-through rate)

In [None]:
redirect_top = mail.sort_values(by = 'click_through_rate', ascending = False)
colums_r = ['Year','Campaign name', 'Tag', 'click_through_rate']
redirect_top[colums_r].head(5)

### 3 рассылки с самым низким click-through rate

In [None]:
redirect_top[colums_r].tail(3)

### 3 рассылки с самым высоким процентом описок

In [None]:
unsubscribed_top = mail.sort_values(by = 'unsubscribe_rate', ascending = False)
colums_u = ['Year','Campaign name', 'Tag', 'unsubscribe_rate']
unsubscribed_top[colums_u].head(3)