# *Задание**

Руководитель отдела сопровождения клиентов хочет получить информацию о том, насколько хорошо сотрудники его отдела (аккаунт-менеджеры) справляются с одной из своих основных задач – пролонгацией договоров с клиентами. От аналитика он хочет получить отчет о пролонгациях сотрудников за 2023 год. 

В компание используется коэффициент пролонгации:

Для проектов пролонгированных в первый месяц – отношении суммы отгрузки проектов пролонгированных в первый месяц после завершения к сумме отгрузки последнего месяца реализации всех завершившихся в прошлом месяце проектов.

То есть, если нам нужно понять, насколько хорошо менеджер пролонгировал в мае, необходимо посчитать:

Сумму отгрузки проектов, завершившихся в апреле (за апрель) и сумму отгрузки тех проектов завершившихся в апреле, у которых есть отгрузка в мае (за май). Коэффициент – отношение второй суммы к первой. 

### Имеются два набора данных:

`prolongations.csv`
- id – id проекта
- month – последний месяц реализации проекта
- AM – ФИО ответственного аккаунт-менеджера (данные первичны по отношению к financial_data)

`financial_data.csv:`
- id – id проекта
- Причина дубля – причина, почему строки с одним и тем же id встречаются несколько раз
- Колонки с названием месяца – сумма отгрузки проекта в данный месяц
- Account – ФИО ответственного аккаунт-менеджера

### Необходимо: 
Рассчитать коэффициенты пролонгации для каждого менеджера и для всего отдела в целом
- за каждый месяц
- за год





In [305]:
import pandas as pd
import numpy as np

In [307]:
financial_data = pd.read_csv('financial_data.csv')
prolongations = pd.read_csv('prolongations.csv')

In [309]:
financial_data.head()

Unnamed: 0,id,Причина дубля,Ноябрь 2022,Декабрь 2022,Январь 2023,Февраль 2023,Март 2023,Апрель 2023,Май 2023,Июнь 2023,Июль 2023,Август 2023,Сентябрь 2023,Октябрь 2023,Ноябрь 2023,Декабрь 2023,Январь 2024,Февраль 2024,Account
0,42,,"36 220,00",,,,,,,,,,,,,,,,Васильев Артем Александрович
1,657,первая часть оплаты,стоп,,,,,,,,,,,,,,,,Васильев Артем Александрович
2,657,вторая часть оплаты,стоп,,,,,,,,,,,,,,,,Васильев Артем Александрович
3,594,,стоп,,,,,,,,,,,,,,,,Васильев Артем Александрович
4,665,,"10 000,00",,,,,,,,,,,,,,,,Васильев Артем Александрович


In [312]:
prolongations.head(50)

Unnamed: 0,id,month,AM
0,42,ноябрь 2022,Васильев Артем Александрович
1,453,ноябрь 2022,Васильев Артем Александрович
2,548,ноябрь 2022,Михайлов Андрей Сергеевич
3,87,ноябрь 2022,Соколова Анастасия Викторовна
4,429,ноябрь 2022,Соколова Анастасия Викторовна
5,600,ноябрь 2022,Васильев Артем Александрович
6,657,ноябрь 2022,Васильев Артем Александрович
7,594,ноябрь 2022,Васильев Артем Александрович
8,665,ноябрь 2022,Васильев Артем Александрович
9,586,ноябрь 2022,Иванова Мария Сергеевна


# Обработаем financial_data

In [315]:
# Переведем названия колонок в нижний регистр
financial_data.columns = map(str.lower, financial_data.columns)

In [316]:
# Проверим пропуски в данных - пропусков нет
financial_data.isna().sum()

id                 0
причина дубля    150
ноябрь 2022      295
декабрь 2022     292
январь 2023      312
февраль 2023     306
март 2023        283
апрель 2023      277
май 2023         261
июнь 2023        261
июль 2023        256
август 2023      252
сентябрь 2023    265
октябрь 2023     269
ноябрь 2023      280
декабрь 2023     305
январь 2024      356
февраль 2024     350
account            0
dtype: int64

In [317]:
# Тип данных
financial_data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 451 entries, 0 to 450
Data columns (total 19 columns):
 #   Column         Non-Null Count  Dtype 
---  ------         --------------  ----- 
 0   id             451 non-null    int64 
 1   причина дубля  301 non-null    object
 2   ноябрь 2022    156 non-null    object
 3   декабрь 2022   159 non-null    object
 4   январь 2023    139 non-null    object
 5   февраль 2023   145 non-null    object
 6   март 2023      168 non-null    object
 7   апрель 2023    174 non-null    object
 8   май 2023       190 non-null    object
 9   июнь 2023      190 non-null    object
 10  июль 2023      195 non-null    object
 11  август 2023    199 non-null    object
 12  сентябрь 2023  186 non-null    object
 13  октябрь 2023   182 non-null    object
 14  ноябрь 2023    171 non-null    object
 15  декабрь 2023   146 non-null    object
 16  январь 2024    95 non-null     object
 17  февраль 2024   101 non-null    object
 18  account        451 non-null   

In [318]:
financial_data.head(20)

Unnamed: 0,id,причина дубля,ноябрь 2022,декабрь 2022,январь 2023,февраль 2023,март 2023,апрель 2023,май 2023,июнь 2023,июль 2023,август 2023,сентябрь 2023,октябрь 2023,ноябрь 2023,декабрь 2023,январь 2024,февраль 2024,account
0,42,,"36 220,00",,,,,,,,,,,,,,,,Васильев Артем Александрович
1,657,первая часть оплаты,стоп,,,,,,,,,,,,,,,,Васильев Артем Александрович
2,657,вторая часть оплаты,стоп,,,,,,,,,,,,,,,,Васильев Артем Александрович
3,594,,стоп,,,,,,,,,,,,,,,,Васильев Артем Александрович
4,665,,"10 000,00",,,,,,,,,,,,,,,,Васильев Артем Александрович
5,637,,"38 045,00",,,,,,,,,,,,,,,,Соколова Анастасия Викторовна
6,419,,,,,,,,,,,,,,,,,,Михайлов Андрей Сергеевич
7,578,,"82 800,00",,,,,,,,,,,,,,,,Попова Екатерина Николаевна
8,579,,в ноль,,,,,,,,,,,,,,,,Васильев Артем Александрович
9,592,первая часть оплаты,"92 302,00",,,,,,,,,,,,,,,,Васильев Артем Александрович


In [319]:
# Создадим список столбцов
months = financial_data.columns[2:-1].to_list()

# Заменим значение 'end' на 'стоп' во всех столбцах
financial_data[months] = financial_data[months].replace('end','стоп')

# Заменим значение 'в ноль' на тип данных float - 0
financial_data[months] = financial_data[months].replace('в ноль', float(0))

In [320]:
financial_data[months]

Unnamed: 0,ноябрь 2022,декабрь 2022,январь 2023,февраль 2023,март 2023,апрель 2023,май 2023,июнь 2023,июль 2023,август 2023,сентябрь 2023,октябрь 2023,ноябрь 2023,декабрь 2023,январь 2024,февраль 2024
0,"36 220,00",,,,,,,,,,,,,,,
1,стоп,,,,,,,,,,,,,,,
2,стоп,,,,,,,,,,,,,,,
3,стоп,,,,,,,,,,,,,,,
4,"10 000,00",,,,,,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
446,"76 550,00","79 950,00","66 900,00","89 150,00","108 450,00","77 100,00","78 800,00","126 740,00","117 730,00","115 860,00","160 770,00","142 490,00","99 125,00","74 350,00","105 775,00","92 065,00"
447,"21 450,00","13 300,00","15 900,00","19 850,00","17 350,00","14 650,00","15 900,00","3 000,00",,,,,,,,
448,,,,"5 306,60","12 898,10","5 287,00","10 180,00","8 600,00","3 860,00","8 600,00",70000,70000,0.0,0.0,,
449,,,,,,,,,"58 200,00","58 200,00","58 200,00","58 200,00","58 200,00","58 200,00",,


In [321]:
# Числа в колонкам имеют тип данных object, нам нужно перевести их в float, чтобы было легче агрегировать данные
def to_float(x):
    if x != 'стоп' and isinstance(x, str):
        # удаляем неразрывный пробел, запятую, пробел
        return float(x.replace(' ','').replace(',','.').replace('\xa0', ''))
    else:
        return x

In [325]:
# Применяем функцию ко всем столбцам месяцев
for month in months:
    financial_data.loc[:, month]= financial_data[month].apply(to_float)

In [327]:
financial_data.head(30)

Unnamed: 0,id,причина дубля,ноябрь 2022,декабрь 2022,январь 2023,февраль 2023,март 2023,апрель 2023,май 2023,июнь 2023,июль 2023,август 2023,сентябрь 2023,октябрь 2023,ноябрь 2023,декабрь 2023,январь 2024,февраль 2024,account
0,42,,36220.0,,,,,,,,,,,,,,,,Васильев Артем Александрович
1,657,первая часть оплаты,стоп,,,,,,,,,,,,,,,,Васильев Артем Александрович
2,657,вторая часть оплаты,стоп,,,,,,,,,,,,,,,,Васильев Артем Александрович
3,594,,стоп,,,,,,,,,,,,,,,,Васильев Артем Александрович
4,665,,10000.0,,,,,,,,,,,,,,,,Васильев Артем Александрович
5,637,,38045.0,,,,,,,,,,,,,,,,Соколова Анастасия Викторовна
6,419,,,,,,,,,,,,,,,,,,Михайлов Андрей Сергеевич
7,578,,82800.0,,,,,,,,,,,,,,,,Попова Екатерина Николаевна
8,579,,0.0,,,,,,,,,,,,,,,,Васильев Артем Александрович
9,592,первая часть оплаты,92302.0,,,,,,,,,,,,,,,,Васильев Артем Александрович


In [331]:
# Можно не преобразовывать NaN, так как агрегация корректно сработает

# Создадим функцию агрегации
def aggregate(x):
    if x.isna().all():
        return np.nan
    elif ('стоп' in x.values):
        return 'стоп'
    else:
        try:
            return np.nansum(x)
        except ValueError:
            return np.nan

# Сгруппируем строки по id и агрегируем значения
financial_data = financial_data.groupby(['id', 'account'], as_index= False).agg(aggregate)

In [332]:
# Удалим столбец 'причина дубля'
financial_data = financial_data.drop(columns='причина дубля')

In [333]:
financial_data.head(20)

Unnamed: 0,id,account,ноябрь 2022,декабрь 2022,январь 2023,февраль 2023,март 2023,апрель 2023,май 2023,июнь 2023,июль 2023,август 2023,сентябрь 2023,октябрь 2023,ноябрь 2023,декабрь 2023,январь 2024,февраль 2024
0,15,Иванова Мария Сергеевна,439280.0,439280.0,102433.75,102433.75,102433.75,138158.0,138158.0,102433.75,,,,,,,,
1,16,Иванова Мария Сергеевна,,,,,,,,,,,,,,,,
2,31,Васильев Артем Александрович,55100.0,55100.0,,44775.0,44775.0,44775.0,44775.0,44775.0,44775.0,44775.0,44775.0,44775.0,44775.0,44775.0,44775.0,46200.0
3,39,Попова Екатерина Николаевна,137700.0,137700.0,149206.5,149206.5,149206.5,149206.5,149206.5,149206.5,149206.5,149206.5,149206.5,149206.5,149206.5,149206.5,,
4,42,Васильев Артем Александрович,36220.0,,,,,,,,,,,,,,,
5,45,Попова Екатерина Николаевна,35150.0,47400.0,49130.0,64475.0,71640.0,58995.0,62100.0,61635.0,70755.0,36125.0,85090.0,96680.0,88400.0,77530.0,,
6,46,Смирнова Ольга Владимировна,37939.5,37939.5,39838.5,39298.5,39298.5,39298.5,39298.5,39298.5,39298.5,39298.5,39298.5,39298.5,39298.5,39298.5,,
7,48,Смирнова Ольга Владимировна,,,,39726.0,39726.0,39726.0,,,,,39726.0,39726.0,39726.0,,45175.5,44635.5
8,49,Смирнова Ольга Владимировна,85842.0,85842.0,83358.0,83358.0,83358.0,83358.0,83358.0,83358.0,84582.0,84582.0,84582.0,84582.0,84582.0,84582.0,,
9,54,Смирнова Ольга Владимировна,,,,,41067.0,38461.5,32139.0,31333.5,32139.0,32139.0,49666.5,50094.0,50949.0,50949.0,,


In [335]:
# Заменим нулвые значения на значения предыдущего месяца
for i in range(len(months) - 1):
    cur_month = months[i]
    prev_month = months[i - 1]
    
    # Заменяем 0 в текущем месяце на значение из предыдущего месяца
    financial_data[cur_month] = financial_data.apply(
        lambda row: row[prev_month] if row[cur_month] == 0
        else row[cur_month], axis=1
    )

In [336]:
financial_data.head(30)

Unnamed: 0,id,account,ноябрь 2022,декабрь 2022,январь 2023,февраль 2023,март 2023,апрель 2023,май 2023,июнь 2023,июль 2023,август 2023,сентябрь 2023,октябрь 2023,ноябрь 2023,декабрь 2023,январь 2024,февраль 2024
0,15,Иванова Мария Сергеевна,439280.0,439280.0,102433.75,102433.75,102433.75,138158.0,138158.0,102433.75,,,,,,,,
1,16,Иванова Мария Сергеевна,,,,,,,,,,,,,,,,
2,31,Васильев Артем Александрович,55100.0,55100.0,,44775.0,44775.0,44775.0,44775.0,44775.0,44775.0,44775.0,44775.0,44775.0,44775.0,44775.0,44775.0,46200.0
3,39,Попова Екатерина Николаевна,137700.0,137700.0,149206.5,149206.5,149206.5,149206.5,149206.5,149206.5,149206.5,149206.5,149206.5,149206.5,149206.5,149206.5,,
4,42,Васильев Артем Александрович,36220.0,,,,,,,,,,,,,,,
5,45,Попова Екатерина Николаевна,35150.0,47400.0,49130.0,64475.0,71640.0,58995.0,62100.0,61635.0,70755.0,36125.0,85090.0,96680.0,88400.0,77530.0,,
6,46,Смирнова Ольга Владимировна,37939.5,37939.5,39838.5,39298.5,39298.5,39298.5,39298.5,39298.5,39298.5,39298.5,39298.5,39298.5,39298.5,39298.5,,
7,48,Смирнова Ольга Владимировна,,,,39726.0,39726.0,39726.0,,,,,39726.0,39726.0,39726.0,,45175.5,44635.5
8,49,Смирнова Ольга Владимировна,85842.0,85842.0,83358.0,83358.0,83358.0,83358.0,83358.0,83358.0,84582.0,84582.0,84582.0,84582.0,84582.0,84582.0,,
9,54,Смирнова Ольга Владимировна,,,,,41067.0,38461.5,32139.0,31333.5,32139.0,32139.0,49666.5,50094.0,50949.0,50949.0,,


# Обработаем prolongations

In [340]:
print(prolongations.AM.value_counts(), '\n')
print(prolongations.month.value_counts())

AM
Васильев Артем Александрович     139
Соколова Анастасия Викторовна     86
Попова Екатерина Николаевна       76
Смирнова Ольга Владимировна       69
Иванова Мария Сергеевна           48
Михайлов Андрей Сергеевич         31
Кузнецов Михаил Иванович          23
без А/М                            2
Федорова Марина Васильевна         2
Петрова Анна Дмитриевна            1
Name: count, dtype: int64 

month
декабрь 2023     69
декабрь 2022     67
сентябрь 2023    42
ноябрь 2023      40
март 2023        33
июнь 2023        31
февраль 2023     28
апрель 2023      28
август 2023      26
ноябрь 2022      24
октябрь 2023     24
июль 2023        23
май 2023         22
январь 2023      20
Name: count, dtype: int64


In [341]:
# В столбце АМ есть значения 'без А/М'. Их можно удалить 
prolongations = prolongations [prolongations.AM != 'без А/М']

In [342]:
prolongations

Unnamed: 0,id,month,AM
0,42,ноябрь 2022,Васильев Артем Александрович
1,453,ноябрь 2022,Васильев Артем Александрович
2,548,ноябрь 2022,Михайлов Андрей Сергеевич
3,87,ноябрь 2022,Соколова Анастасия Викторовна
4,429,ноябрь 2022,Соколова Анастасия Викторовна
...,...,...,...
471,350,декабрь 2023,Смирнова Ольга Владимировна
472,955,декабрь 2023,Смирнова Ольга Владимировна
474,281,декабрь 2023,Соколова Анастасия Викторовна
475,785,декабрь 2023,Соколова Анастасия Викторовна


# Рассчет коэффициента

In [344]:
# Объединим датасеты prolongations и financial_data в один 
merged_data = pd.merge(prolongations, financial_data, on = 'id', how = 'inner' )

In [345]:
merged_data

Unnamed: 0,id,month,AM,account,ноябрь 2022,декабрь 2022,январь 2023,февраль 2023,март 2023,апрель 2023,май 2023,июнь 2023,июль 2023,август 2023,сентябрь 2023,октябрь 2023,ноябрь 2023,декабрь 2023,январь 2024,февраль 2024
0,42,ноябрь 2022,Васильев Артем Александрович,Васильев Артем Александрович,36220.0,,,,,,,,,,,,,,,
1,453,ноябрь 2022,Васильев Артем Александрович,Васильев Артем Александрович,,39245.0,44320.0,177635.0,,,,,,,,,,,,
2,548,ноябрь 2022,Михайлов Андрей Сергеевич,Михайлов Андрей Сергеевич,674000.0,674000.0,674000.0,674000.0,,,,,,,,,,,,
3,87,ноябрь 2022,Соколова Анастасия Викторовна,Иванова Мария Сергеевна,70050.0,,73380.0,83480.0,89300.0,89300.0,78605.0,72485.0,,,,,,,,
4,429,ноябрь 2022,Соколова Анастасия Викторовна,Соколова Анастасия Викторовна,30280.0,35580.0,35830.0,42830.0,,,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
470,350,декабрь 2023,Смирнова Ольга Владимировна,Смирнова Ольга Владимировна,,,,,,,,,,,,121000.0,121000.0,121305.0,117805.0,117805.0
471,955,декабрь 2023,Смирнова Ольга Владимировна,Смирнова Ольга Владимировна,,,,,,,,,,,9300.0,9300.0,13200.0,17400.0,,
472,281,декабрь 2023,Соколова Анастасия Викторовна,Соколова Анастасия Викторовна,98000.0,93250.0,82800.0,109000.0,125800.0,91750.0,94700.0,129740.0,117730.0,115860.0,160770.0,142490.0,99125.0,74350.0,105775.0,92065.0
473,785,декабрь 2023,Соколова Анастасия Викторовна,Соколова Анастасия Викторовна,,,,5306.6,12898.1,5287.0,10180.0,8600.0,3860.0,8600.0,700.0,700.0,700.0,700.0,,


# Расчеты

In [347]:
# Исклюим проекты со словом "стоп"из расчета коэффициента пролонгации 
# Создадим булеву маску, где хотя бы в одной из колонок есть слово 'стоп'
mask = merged_data.apply(lambda row: row.astype(str).str.contains('стоп')).any(axis=1)
merged_data = merged_data[~mask]

In [348]:
#Так как нам нужно получить отчет о пролонгациях сотрудников за 2023 год, убираем колонки 2022 и 2024 год 
#merged_data = merged_data.loc[:, ~merged_data.columns.str.contains('2022|2024', regex=True)]

#Убираем строки за 2022 и 2024 года
#merged_data = merged_data[~merged_data['month'].astype(str).str.contains('2022|2024', na=False)]

In [349]:
merged_data = merged_data.drop(columns = 'account')

In [350]:
merged_data

Unnamed: 0,id,month,AM,ноябрь 2022,декабрь 2022,январь 2023,февраль 2023,март 2023,апрель 2023,май 2023,июнь 2023,июль 2023,август 2023,сентябрь 2023,октябрь 2023,ноябрь 2023,декабрь 2023,январь 2024,февраль 2024
0,42,ноябрь 2022,Васильев Артем Александрович,36220.0,,,,,,,,,,,,,,,
1,453,ноябрь 2022,Васильев Артем Александрович,,39245.0,44320.0,177635.0,,,,,,,,,,,,
2,548,ноябрь 2022,Михайлов Андрей Сергеевич,674000.0,674000.0,674000.0,674000.0,,,,,,,,,,,,
3,87,ноябрь 2022,Соколова Анастасия Викторовна,70050.0,,73380.0,83480.0,89300.0,89300.0,78605.0,72485.0,,,,,,,,
4,429,ноябрь 2022,Соколова Анастасия Викторовна,30280.0,35580.0,35830.0,42830.0,,,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
470,350,декабрь 2023,Смирнова Ольга Владимировна,,,,,,,,,,,,121000.0,121000.0,121305.0,117805.0,117805.0
471,955,декабрь 2023,Смирнова Ольга Владимировна,,,,,,,,,,,9300.0,9300.0,13200.0,17400.0,,
472,281,декабрь 2023,Соколова Анастасия Викторовна,98000.0,93250.0,82800.0,109000.0,125800.0,91750.0,94700.0,129740.0,117730.0,115860.0,160770.0,142490.0,99125.0,74350.0,105775.0,92065.0
473,785,декабрь 2023,Соколова Анастасия Викторовна,,,,5306.6,12898.1,5287.0,10180.0,8600.0,3860.0,8600.0,700.0,700.0,700.0,700.0,,


In [351]:
# Создадим еще раз колонки список колонок с месяцами 
months = merged_data.columns[3:].to_list()

In [352]:
# Группируем данные по 'AM', и вычислим сумму проектов по месяцам 
df_grouped = merged_data.groupby(['AM'], as_index=False).agg({col: 'sum' for col in months})

In [369]:
df_grouped.dtypes

AM                object
ноябрь 2022       object
декабрь 2022      object
январь 2023      float64
февраль 2023      object
март 2023         object
апрель 2023       object
май 2023          object
июнь 2023         object
июль 2023         object
август 2023       object
сентябрь 2023     object
октябрь 2023      object
ноябрь 2023       object
декабрь 2023     float64
январь 2024       object
февраль 2024      object
dtype: object

In [371]:
# Преобразуем тип данных в колонках месяцев в float
months = df_grouped.columns[1:].to_list()

df_grouped[months] = df_grouped[months].apply(pd.to_numeric, errors='coerce')
df_grouped['февраль 2023'] = df_grouped['февраль 2023'].apply(pd.to_numeric, errors='coerce')

In [373]:
df_grouped.dtypes

AM                object
ноябрь 2022      float64
декабрь 2022     float64
январь 2023      float64
февраль 2023     float64
март 2023        float64
апрель 2023      float64
май 2023         float64
июнь 2023        float64
июль 2023        float64
август 2023      float64
сентябрь 2023    float64
октябрь 2023     float64
ноябрь 2023      float64
декабрь 2023     float64
январь 2024      float64
февраль 2024     float64
dtype: object

In [375]:
df_grouped

Unnamed: 0,AM,ноябрь 2022,декабрь 2022,январь 2023,февраль 2023,март 2023,апрель 2023,май 2023,июнь 2023,июль 2023,август 2023,сентябрь 2023,октябрь 2023,ноябрь 2023,декабрь 2023,январь 2024,февраль 2024
0,Васильев Артем Александрович,6612944.78,8945785.97,8600064.39,10237325.88,10599261.09,9514807.32,6889100.02,7602570.07,6755656.71,7225230.45,6221043.52,6951782.86,6678407.1,6627535.77,3018771.51,3325107.84
1,Иванова Мария Сергеевна,5087077.25,5141525.71,2182652.92,2339336.25,2356715.5,1572161.75,1765097.75,1599212.5,1115470.2,927775.38,876802.75,806527.75,805747.75,818837.75,267101.25,895927.0
2,Кузнецов Михаил Иванович,595372.0,591219.5,489941.0,751301.84,1155408.85,1002801.0,1639045.54,970021.15,1034285.11,1055191.14,1013555.65,1193086.98,1487515.01,1182026.9,730649.97,652217.45
3,Михайлов Андрей Сергеевич,3012725.96,2795820.21,3602392.09,3424925.69,2657019.77,2084446.26,2349180.22,1826922.43,1825172.67,1951869.77,2044569.12,1439000.06,1123911.77,1412650.0,980333.46,1245218.34
4,Петрова Анна Дмитриевна,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,98492.0,109442.52,0.0,0.0
5,Попова Екатерина Николаевна,1339206.0,1693775.25,1625844.68,1652305.0,1946488.25,2614346.78,2858305.18,2756596.5,2938307.16,2854563.78,2827105.08,2953812.3,2801220.91,2957416.74,1816611.2,1859227.9
6,Смирнова Ольга Владимировна,1093164.5,1304287.2,1469031.2,1771771.2,1966091.95,1954735.45,2357961.6,2312801.05,2537314.25,3250380.08,3075956.15,3431182.59,3499383.24,3105554.65,2087793.15,2251905.25
7,Соколова Анастасия Викторовна,3178857.21,3511733.76,3193159.5,3573484.6,3664282.2,4163335.35,4126701.14,4937579.14,4676773.45,4537148.08,3738750.19,4153932.49,4031420.07,3876452.16,2967728.0,2821306.5
8,Федорова Марина Васильевна,0.0,0.0,0.0,0.0,0.0,0.0,84000.0,78000.0,78000.0,73050.0,192470.0,184135.0,157900.0,50250.0,0.0,0.0


Рассчитать коэффициенты пролонгации для каждого менеджера и для всего отдела в целом
 - за каждый месяц
 - за год


### Рассчитаем коэффициент пролонгации в первый месяц

In [379]:
k1 = df_grouped[months].shift(-1, axis=1) / df_grouped[months]
k1 = k1.round(2)
k1.drop(columns = ['ноябрь 2022', 'декабрь 2022', 'январь 2024', 'февраль 2024'], inplace=True)

# Заменим inf на NaN, чтобы избежать проблем при суммировании
k1.replace([float('inf'), -float('inf')], pd.NA, inplace=True)

k1.insert(0, 'Менеджер', df_grouped['AM'])

In [380]:
k1

Unnamed: 0,Менеджер,январь 2023,февраль 2023,март 2023,апрель 2023,май 2023,июнь 2023,июль 2023,август 2023,сентябрь 2023,октябрь 2023,ноябрь 2023,декабрь 2023
0,Васильев Артем Александрович,1.19,1.04,0.9,0.72,1.1,0.89,1.07,0.86,1.12,0.96,0.99,0.46
1,Иванова Мария Сергеевна,1.07,1.01,0.67,1.12,0.91,0.7,0.83,0.95,0.92,1.0,1.02,0.33
2,Кузнецов Михаил Иванович,1.53,1.54,0.87,1.63,0.59,1.07,1.02,0.96,1.18,1.25,0.79,0.62
3,Михайлов Андрей Сергеевич,0.95,0.78,0.78,1.13,0.78,1.0,1.07,1.05,0.7,0.78,1.26,0.69
4,Петрова Анна Дмитриевна,,,,,,,,,,,1.11,0.0
5,Попова Екатерина Николаевна,1.02,1.18,1.34,1.09,0.96,1.07,0.97,0.99,1.04,0.95,1.06,0.61
6,Смирнова Ольга Владимировна,1.21,1.11,0.99,1.21,0.98,1.1,1.28,0.95,1.12,1.02,0.89,0.67
7,Соколова Анастасия Викторовна,1.12,1.03,1.14,0.99,1.2,0.95,0.97,0.82,1.11,0.97,0.96,0.77
8,Федорова Марина Васильевна,,,,,0.93,1.0,0.94,2.63,0.96,0.86,0.32,0.0


### Рассчитаем коэффициент пролонгации k1 за год для каждого менеджера

In [383]:
k1_months = k1.columns[1:].to_list()
k1_yearly = k1[k1_months].sum(axis=1).to_frame(name = 'Коэффициент K1 за год для каждого менеджера')

k1_yearly.insert(0, 'Менеджер', k1['Менеджер'].values)

In [385]:
k1_yearly

Unnamed: 0,Менеджер,Коэффициент K1 за год для каждого менеджера
0,Васильев Артем Александрович,11.3
1,Иванова Мария Сергеевна,10.53
2,Кузнецов Михаил Иванович,13.05
3,Михайлов Андрей Сергеевич,10.97
4,Петрова Анна Дмитриевна,1.11
5,Попова Екатерина Николаевна,12.28
6,Смирнова Ольга Владимировна,12.53
7,Соколова Анастасия Викторовна,12.03
8,Федорова Марина Васильевна,7.64


### Рассчитаем коэффициент пролонгации k1 за год для всего отдела

In [388]:
k1_yearly_department = k1_yearly['Коэффициент K1 за год для каждого менеджера'].mean()
print(f'Средний коэффициент пролонгации для всего отдела за год: {k1_yearly_department}')

Средний коэффициент пролонгации для всего отдела за год: 10.16
