In [1]:
import pandas
import pm4py

In [2]:
event_log = pandas.read_csv('TJSP-BL-event-log.csv', sep=',')
#lawsuit_id,date,movement,order,status,area,subject_matter,control,digital,class,distribution_date,court_department,claim_amount,judge
event_log = pm4py.format_dataframe(event_log, case_id='lawsuit_id', activity_key='movement', timestamp_key='date')
start_activities = pm4py.get_start_activities(event_log)
end_activities = pm4py.get_end_activities(event_log)
print("Start activities: {}\nEnd activities: {}".format(start_activities, end_activities))
# the log is filtered on the top 5 variants
#filtered_log = pm4py.filter_variants_top_k(event_log , 5)

Start activities: {'Decisão': 383, 'Remetido ao DJE': 647, 'Remetidos os Autos para o Cartório Distribuidor Local para Anotação/Correção de Classe': 4, 'Conclusos para Sentença': 10, 'Distribuído Livremente (por Sorteio) (movimentação exclusiva do distribuidor)': 619, 'Carta Expedida': 146, 'Conclusos para Decisão': 606, 'Incidente Processual Instaurado': 1, 'Certidão de Publicação Expedida': 446, 'Distribuído por Direcionamento (movimentação exclusiva do distribuidor)': 24, 'Conclusos para Despacho': 60, 'Suspensão do Prazo': 84, 'Recebidos os Autos da Conclusão': 1, 'Petição Juntada': 371, 'Carga à Vara Interna': 1, 'Processo Digitalizado': 1, 'Declarada incompetência': 42, 'Determinada a Emenda à Petição Inicial': 63, 'Redistribuído Livremente (por Sorteio) (movimentação exclusiva do distribuidor)': 54, 'Embargos de Declaração Não-Acolhidos': 10, 'Réplica Juntada': 20, 'Carta de Citação Expedida': 23, 'Mandado de Citação Expedido': 6, 'Remetidos os Autos para Outro Foro/Comarca dest

In [3]:
# a directly - follows graph (DFG) is discovered from the log
dfg, start_activities, end_activities = pm4py.discover_dfg(event_log)


In [None]:
# a process tree is discovered using the inductive miner
process_tree = pm4py.discover_process_tree_inductive(event_log)

In [None]:
# the process tree is converted to an accepting Petri net
petri_net , initial_marking, final_marking = pm4py.convert_to_petri_net(process_tree)
process_tree = pm4py.discover_process_tree_inductive(event_log)

In [7]:
# the accepting Petri net is converted to a BPMN diagram
bpmn_diagram = pm4py.convert_to_bpmn(petri_net, initial_marking, final_marking)

In [None]:
# the discovered process models are shown on the screen as .svg images
pm4py.view_dfg(dfg, start_activities, end_activities, format='png')
pm4py.view_process_tree(process_tree , format='png')
pm4py.view_petri_net(petri_net, initial_marking, final_marking, format='png')
pm4py.view_bpmn(bpmn_diagram, format='png')

In [None]:
# we compare the original log versus the discovered model
fitness = pm4py.fitness_token_based_replay(event_log, petri_net, initial_marking, final_marking)
precision = pm4py.precision_token_based_replay(event_log, petri_net, initial_marking, final_marking)
print(fitness) # 0.984
print(precision) # 0.758
# we check if the discovered model is a sound workflow net
is_sound_wfnet = pm4py.check_soundness(petri_net, initial_marking, final_marking)[0]
print(is_sound_wfnet) # True