Мы работаем в компании X6. Наша задача — прогноз товарооборота бытовой техники: нужно понять, сколько каждого товара привезти на ту или иную точку для продажи. Допустим, поставки осуществляются раз в 3 месяца. Если привезем слишком мало, то весь товар скупят, новые клиенты не смогут купить нужную им технику. Из-за чего мы потеряем потенциальную прибыль (missed profit), так как не смогли покрыть спрос. Если привозим слишком много (а зачастую бытовая техника – крупногабаритный товар), то это ведёт к переполнению склада, что затрудняет ввоз более новых моделей техники.

Что в данной ситуации предпочтительнее: привезти на склад больше чем нужно или меньше?

Вам необходимо придумать функцию потерь, которая была бы адекватная для данной бизнес-задачи:

In [None]:
import numpy as np

def turnover_error(y_true: np.array, y_pred: np.array) -> float:  
     error = ((y_true - y_pred)/ y_pred)**2
     return np.mean(error)

or rmsle

In [None]:
import numpy as np


def turnover_error_iconic(y_true: np.ndarray, y_pred: np.ndarray) -> float:
    """Turnover error function

    Args:
        y_true (np.ndarray): True values
        y_pred (np.ndarray): Pred values

    Returns:
        float: Turnover error
    """
    return np.sum((np.log1p(y_true) - np.log1p(y_pred)) ** 2) ** 0.5


Оценка Lifetime Value
Мы B2B финтех стартап — предоставляем депозиты/кредиты, куплю/продажу ценных бумаг и другие финансовые инструменты. У нас небольшое число очень крупных клиентов. Мы заключаем контракты минимум на 1 год. Для принятия решения о сотрудничестве мы разрабатываем модель, которая для потенциального клиента прогнозирует LTV (LifeTime Value, сколько денег нам принесёт клиент за всё время, что будет пользоваться нашим сервисом).

Подумайте, что предпочтительнее: недооценить или переоценить стоимость потенциального клиента?

Вам необходимо выбрать или разработать функцию, отражающую ошибку для оценки модели прогноза LTV.

In [5]:
import numpy as np

def ltv_error(y_true: np.array, y_pred: np.array) -> float:
    """LTVTurnover error function

    Args:
        y_true (np.ndarray): True values
        y_pred (np.ndarray): Pred values

    Returns:
        float: Turnover error
    """
    y_true = np.array(y_true)
    y_pred = np.array(y_pred)
    squared_true = y_true ** 2
    squared_pred = y_pred ** 2
    error = np.sqrt(np.sum(np.abs(squared_true - squared_pred)))
    print(np.abs(squared_true - squared_pred))
    return error

In [9]:
ltv_error([20], [30])

[500]


np.float64(22.360679774997898)