# Товары новинки
Вы решаете задачу прогнозирования спроса в быстро развивающемся стартапе KarpovExpress, где количество новых товаров увеличивается на десятки штук каждый месяц.

Прогноз продаж надо делать каждую неделю в рублях или товарах, а на товары-новинки нет данных и истории продаж. 

Модель прогнозирования спроса не выдает ничего адекватного и не умеет работать с NaN пропусками. Но есть идея — **пропуски для товаров-новинок можно заполнить среднем значением продаж по категориям этого товара!**

Прогнозирование для новых товаров - очень важная вещь, которая поможет новым пользователям чаще видеть релевантные товары в рекомендациях или бизнесу предсказывать поведения пользователей.

Вы решили дописать функцию fillna_with_mean, которая заполняет пропуски в колонке target ее средними значениями по группам. Группировка происходит по колонке group. 

Ваша функция не привязана к определенному формату датасета, ниже дан пример для задачи прогнозирования спроса. Также Вы можете использовать этот подход для других задач
Например:

- Оценка конверсии товаров - нужно заполнить пропуски для товаров-новинок.
- Предсказание ежедневных посещений сайта пользователями - нужно заполнить пропуски для новых пользователей.

In [9]:
import pandas as pd
import numpy as np

data = {
    "monday": ["2020-01-05"] * 10,
    "product_id": [6, 0, 4, 8, 2, 1, 5, 9, 7, 3],
    "category": [3, 0, 2, 0, 2, 5, 4, 0, 5, 5],
    "sales": [35.0, np.nan, 67.0, 4.0, np.nan, np.nan, 32.0, 86.0, 72.0, 5.0]
}

def fillna_with_mean(
    df: pd.DataFrame, target: str, group: str
) -> pd.DataFrame:
    """Fill the null data"""
    df = df.copy()
    df[target] = np.floor(df[target].fillna(df.groupby(group)[target].transform('mean')))
    return df

print(fillna_with_mean(pd.DataFrame(data), 'sales', 'category'))

       monday  product_id  category  sales
0  2020-01-05           6         3   35.0
1  2020-01-05           0         0   45.0
2  2020-01-05           4         2   67.0
3  2020-01-05           8         0    4.0
4  2020-01-05           2         2   67.0
5  2020-01-05           1         5   38.0
6  2020-01-05           5         4   32.0
7  2020-01-05           9         0   86.0
8  2020-01-05           7         5   72.0
9  2020-01-05           3         5    5.0


# Эталонное решение

In [None]:
import numpy as np
import pandas as pd


def fillna_with_mean(df: pd.DataFrame, target: str, group: str) -> pd.DataFrame:
    """Fill nans with mean

    Parameters
    ----------
    df : pd.DataFrame
        Dataframe
    target : str
        Target
    group : str
        Group

    Returns
    -------
    pd.DataFrame
        result
    """
    df = df.copy()
    fillna_values = df.groupby(by=group)
    fillna_values = fillna_values[target].transform("mean")
    fillna_values = np.floor(fillna_values)
    df.loc[df[target].isna(), target] = fillna_values
    return df