Оценка потенциального экономического эффекта от внедрения полученного решения

Постройте простую экономическую модель для оценки эффекта от внедрения полученного решения на практике.

Например, введите следующие параметры:

 * сколько денег в среднем приносит один пользователь в месяц;
 * сколько денег в среднем вы будете вкладывать в удержание одного пользователя;
 * с какой вероятностью пользователь примет ваше предложение;
 * сколько пользователей (например, топ 1% или топ 25% согласно ранжированию по вашей модели) будет участвовать в кампании.

Определимся с начальными данными. Предположим что:

 * Пользователь в месяц приносит 1000 у.е.
 * Расхода на удержание пользователя составлт 2000 у.е
 * Пользователь принимает предложение с вероятностью 40%
 * Точность нашей модели составляет 80%

In [1]:
import pandas as pd
import numpy as np

1\. Введите еще несколько параметров и на их основе постройте простую экономическую модель: формулу по которой в зависимости от значения исходных параметров вы сможете рассчитать экономический эффект от проведения кампании (= сколько денег вы получили (или наоборот потеряли) от проведения кампании по удержанию) с использование вашей модели.

Простая экономическая модель на основе вышеописсаных данных.

Рассчета дохода компании:  
$(M * N * A * 1000 * P) + (M * N * (1 - A) * 1000) - (N * 2000)$

Где:
 * M - количество месяцев дял которых происходит расчет
 * N - количество пользователей которым было сделано предложение
 * A - точность нашей модели
 * P - вероятность того что пользователь примет наше предложение
 
Рассчитываем:
 * $M * N * A * 1000 * P$ - рассчет прибыли для пользователей которые хотели прекратить пользоваться услугами компании
 * $M * N * A * 1000 * P$ - рассчет прибыли для пользователей которые были ошибочно отнесены к оттоку
 * $N * 2000$ - расчет рассходов которые были понесены компанией на удержание пользователей


Рассчет упущеной выгоды:  
$(M * N * (2 - A - P) * 1000) + (N * (2 - A - P) * 2000)$

Рассчитываем:
 * $M * N * (2 - A - P) * 1000$ - сумма которая не была получена из-за того что пользователи ушли
 * $N * (2 - A - P) * 2000$ - сумма которая была потрачена на "удержание" пользователей которые не собиралиcь покидать компанию и тех которые не приняли наше предложение

Пример рассчета для N=100 и M=12

In [2]:
print('Доход %d' % ((12 * 100 * 0.8 * 1000 * 0.4) + (12 * 100 * 0.2 * 1000) - (100 * 2000)))
print('Упущеная выгода %d' % ((12 * 100 * (2 - 0.8 - 0.4) * 1000) + (100 * (2 - 0.8 - 0.4) * 2000)))

Доход 424000
Упущеная выгода 1120000


2\. Исходя из введенных параметров проанализируйте, какой топ пользователей, склонных к оттоку согласно модели, оптимально выбрать для проведения кампании по удержанию для таким образом, чтобы экономический эффект был наибольшим?

In [3]:
top = pd.Series()

for N in range(50, 501, 50):
    income = (12 * N * 0.8 * 1000 * 0.4) + (12 * N * (1 - 0.8) * 1000) - (N * 2000)
    top[str(N)] = income
    
print('Доход')
print(top.sort_values(ascending=False).head())

Доход
500    2120000.0
450    1908000.0
400    1696000.0
350    1484000.0
300    1272000.0
dtype: float64


Как можно заметить что при таких параметрах чем больше предложений пользователям мы сделаем тем выгоднее получается для компании.

3\. Попробуйте усложнить экономическую модель. Добавьте еще несколько параметров и поиграйте с ними (например, измените стоимость удержания и вероятность, с которой пользователь принимает предложение), проанализируйте как меняется оптимальный размер топа?

In [4]:
top = pd.Series()

for cost in range(1000, 11000, 1000):
    temp = pd.Series()
    for N in range(50, 501, 50):
        income = (12 * N * 0.8 * 1000 * 0.4) + (12 * N * (1 - 0.8) * 1000) - (N * cost)
        temp[str(N)] = income
        
    temp = temp.sort_values(ascending=False)
    top[str(cost)] = (temp.index[0], temp[0])

In [5]:
top

1000     (500, 2620000.0)
2000     (500, 2120000.0)
3000     (500, 1620000.0)
4000     (500, 1120000.0)
5000      (500, 620000.0)
6000      (500, 120000.0)
7000       (50, -38000.0)
8000       (50, -88000.0)
9000      (50, -138000.0)
10000     (50, -188000.0)
dtype: object

В случае изменения стоимости удержания пользователей можно заметить что нам так же остается выгодно удерживать всех потенциально уходяцих пользователей до тех пор пока стоимость удержания не привышает 6000, после этого при расчете на 12 месяцев удержание пользователей становится не выгодням.

In [6]:
top = pd.Series()

for prob in np.arange(0.1, 1.1, 0.1):
    temp = pd.Series()
    for N in range(50, 501, 50):
        income = (12 * N * 0.8 * 1000 * prob) + (12 * N * (1 - 0.8) * 1000) - (N * 2000)
        temp[str(N)] = income
        
    temp = temp.sort_values(ascending=False)
    top[str(prob)] = (temp.index[0], temp[0])

In [7]:
top

0.1     (500, 680000.0)
0.2    (500, 1160000.0)
0.3    (500, 1640000.0)
0.4    (500, 2120000.0)
0.5    (500, 2600000.0)
0.6    (500, 3080000.0)
0.7    (500, 3560000.0)
0.8    (500, 4040000.0)
0.9    (500, 4520000.0)
1.0    (500, 5000000.0)
dtype: object

Как и ожидалось когда растет вероятность того что пользователь принимает наше предложение так же растет и сумма потенциального дохода ра рассчитываемый период.

4\. Всегда ли применение модели экономически оправданно? Приведите пример набора значений параметров, при которых применение модели перестает быть оправданным.

Не всегда использование модели является экономически оправданным, на пример в случае есть пользователи принимают наше предложение с очень маленькой вероятностью или есть стоимость удержания пользователя превышает сумму потенциального дохода, результаты получаются отрицательные.

5\. Оцените изменение экономического эффекта от проведения кампании по удержанию при увеличении качества модели на 1%? На 3%? При ответе на вопрос укажите, по какой метрике вы оцениваете качество.

In [8]:
top = pd.Series()

for acc in np.arange(0.8, 0.9, 0.01):
    N = 500
    income = (12 * N * acc * 1000 * 0.4) + (12 * N * (1 - acc) * 1000) - (N * 2000)
    top[str(acc)] = income
    
print('Доходы')
print(top)
print()

top = pd.Series()

for acc in np.arange(0.8, 0.9, 0.01):
    N = 500
    missed_income = (12 * N * (2 - acc - 0.4) * 1000) + (N * (2 - acc - 0.4) * 2000)
    top[str(acc)] = missed_income
    
print('Упещенная выгода')
print(top)

Доходы
0.8     2120000.0
0.81    2084000.0
0.82    2048000.0
0.83    2012000.0
0.84    1976000.0
0.85    1940000.0
0.86    1904000.0
0.87    1868000.0
0.88    1832000.0
0.89    1796000.0
dtype: float64

Упещенная выгода
0.8     5600000.0
0.81    5530000.0
0.82    5460000.0
0.83    5390000.0
0.84    5320000.0
0.85    5250000.0
0.86    5180000.0
0.87    5110000.0
0.88    5040000.0
0.89    4970000.0
dtype: float64


Если посмотреть на цифры то можно заметить что при увеличении точности модели сумма дохода "уменьшается". Однако это объясняется тем что с увеличением точности больше пользователей перемещаются и части $(12 * N * acc * 1000 * 0.4)$ в часть $(12 * N * (1 - acc) * 1000)$, т.е. предложение делается тем кто действительно хочет прекратить пользоваться услугами компании, а как было сказано ранее предложение принимается в 40% случаев. Однако в случае есть пользователь принял предложение он начинает приносить стабильный доход (рассчеты не приведены). Так же стоит отметить что при увеличении точности модели сумма упущеной выгоды начинает падать.

6\. Как вы думаете, является ли экономически оправданным вложение средств в улучшение качества модели? На сколько нужно улучшить модель, чтобы это качественно сказалось на экономическом эффекте от удержания?

Давайте введем стоимость улучшения модели, предположим что она складывается из константы 5000 у.е. и коэффициента 2000 домноженого на достигнутое качество. Тогда стоимость улучшения модели с 0.8 до 0.9 будет равна:
  
<center>$\sum_{i=0.8}^{0.9} 5000 + 2000 * i$</center>

In [9]:
top = pd.Series()

for acc in np.arange(0.8, 1.01, 0.01):
    N = 500
    income = (12 * N * acc * 1000 * 0.4) + (12 * N * (1 - acc) * 1000) - (N * 2000) - sum([5000 + 2000 * ac for ac in  np.arange(0.8, acc, 0.01)])
    top[str(acc)] = income
    
print('Доходы')
print(top)
print()

top = pd.Series()

for acc in np.arange(0.8, 1.01, 0.01):
    N = 500
    missed_income = (12 * N * (2 - acc - 0.4) * 1000) + (N * (2 - acc - 0.4) * 2000) + sum([5000 + 2000 * ac for ac in  np.arange(0.8, acc, 0.01)])
    top[str(acc)] = missed_income
    
print('Упещенная выгода')
print(top)

Доходы
0.8     2120000.0
0.81    2070780.0
0.82    2028140.0
0.83    1985480.0
0.84    1942800.0
0.85    1900100.0
0.86    1857380.0
0.87    1814640.0
0.88    1771880.0
0.89    1729100.0
0.9     1686300.0
0.91    1643480.0
0.92    1600640.0
0.93    1557780.0
0.94    1514900.0
0.95    1472000.0
0.96    1429080.0
0.97    1386140.0
0.98    1343180.0
0.99    1300200.0
1.0     1257200.0
dtype: float64

Упещенная выгода
0.8     5600000.0
0.81    5543220.0
0.82    5479860.0
0.83    5416520.0
0.84    5353200.0
0.85    5289900.0
0.86    5226620.0
0.87    5163360.0
0.88    5100120.0
0.89    5036900.0
0.9     4973700.0
0.91    4910520.0
0.92    4847360.0
0.93    4784220.0
0.94    4721100.0
0.95    4658000.0
0.96    4594920.0
0.97    4531860.0
0.98    4468820.0
0.99    4405800.0
1.0     4342800.0
dtype: float64


Как видно из получиных данные в улучшении модели есть экономический смысл.