In [1]:
from pandas import read_excel

from sberpm import DataHolder
from sberpm.autoinsights import AutoInsights
from sberpm.autoinsights._wrapper_auto_insights import WrapperAutoInsights

#### AutoInsights from tutorial

In [2]:
path = "/home/argon/sber/sber_pm/tutorials/example.xlsx"

data_holder = DataHolder(
    data=path,
    id_column="id",
    activity_column="stages",
    start_timestamp_column="dt",
    #  end_timestamp_column='dt',
    user_column="users",
    text_column="some_text",
    time_format="%Y-%m-%d",
)

In [3]:
auto_i = AutoInsights(data_holder, success_activity=None, cluster_eps=0.1, min_cost=0.6)

In [4]:
%%time

auto_i.apply()

[1mINFO[0m | sberpm.autoinsights._auto_insights: Автоинсайты успешно отработали
CPU times: user 820 ms, sys: 143 ms, total: 963 ms
Wall time: 839 ms


Mean of empty slice.
invalid value encountered in double_scalars


In [5]:
print(auto_i.get_description())

В следующих этапах процесса отмечена высокая длительность. Максимальный потенциальный финансовым эффект от её снижения 3792845 рублей:
	Stage_2

Следующие этапы являются нерегулярными (редкими) и не требуются для успешной реализации процесса. Максимальный потенциальный финансовый эффект при отказе от данных этапов 7319855 рублей:
	Stage_6

В следующих этапах обнаружен Bottle neck, стабильно тормозящий процесс. Максимальный потенциальный финансовый эффект от его устранения 3792845 рублей:
	Stage_2

На данном этапе процесса возникают структурные ошибки, приводящие к неуспеху процесса. Максимальный потенциальный финансовый эффект от их устранения 93450240 рублей:
	Stage_9, Stage_1, Stage_6, Stage_0, Stage_4, Stage_2, Stage_3, Stage_7, Stage_5

********************************************************************************
Суммарный финансовый эффект от АвтоИнсайтов 104562940 рублей:
	Stage_9, Stage_1, Stage_6, Stage_0, Stage_4, Stage_2, Stage_3, Stage_7, Stage_5


#### AutoInsights with default parameters and example data

In [6]:
df = read_excel('example.xlsx')
df.head()

Unnamed: 0,id,stages,dt,users,some_text
0,0.0,Stage_0,2019-01-12,Oliver,Вход
1,0.0,Stage_3,2019-02-12,Liam,Выбор операции
2,0.0,Stage_5,2019-05-12,Emma,Печать договора
3,0.0,Stage_2,2019-11-12,Patricia,Загрузка сотрудником скана документа в систему
4,0.0,Stage_7,2019-12-17,Callum,Отмена операции


In [7]:
insights = WrapperAutoInsights(
    data=df,
    model_params={
        "notation_params": dict(
            id_col="id",
            status_col="stages",
            date_col="dt",
            date_end_col=None,
        ),
        "model_params": dict(
            text_column="some_text",
            success_activity=None,
            cluster_eps=0.1,
            min_cost=0.6,
            output_type="financial_only_effect",
        ),
    },
)

DataHolder: 'time_format' is not set, recommended to specify it for correct time conversion, e.g., time_format='%d-%m-%Y %H:%M:%S'
DataHolder: timestamp auto conversion will be done. 'dayfirst' is not set, in ambiguous cases it will be considered as False.
DataHolder: timestamp auto conversion will be done. 'yearfirst' is not set, in ambiguous cases it will be considered as False.


In [8]:
%%time

insights_output = insights.run_model()

[1mINFO[0m | sberpm.autoinsights._auto_insights: Автоинсайты успешно отработали
CPU times: user 871 ms, sys: 106 ms, total: 977 ms
Wall time: 854 ms


Mean of empty slice.
invalid value encountered in double_scalars


In [9]:
insights_output.values

array([['В следующих этапах процесса отмечена высокая длительность. Максимальный потенциальный финансовым эффект от её снижения 3792845 рублей',
        'Stage_2'],
       ['Следующие этапы являются нерегулярными (редкими) и не требуются для успешной реализации процесса. Максимальный потенциальный финансовый эффект при отказе от данных этапов 7319855 рублей',
        'Stage_6'],
       ['В следующих этапах обнаружен Bottle neck, стабильно тормозящий процесс. Максимальный потенциальный финансовый эффект от его устранения 3792845 рублей',
        'Stage_2'],
       ['На данном этапе процесса возникают структурные ошибки, приводящие к неуспеху процесса. Максимальный потенциальный финансовый эффект от их устранения 93450240 рублей',
        'Stage_9, Stage_1, Stage_6, Stage_0, Stage_4, Stage_2, Stage_3, Stage_7, Stage_5'],
       ['*******************************************************************************',
        'уммарный финансовый эффект от АвтоИнсайтов 104562940 рублей:']],
    