In [1]:
import sys
sys.path.append('../')

from process_fragment_miner import (
    ProcessFragmentMiner,
    BigramScorer,
    DependencyScorer,
    SimilarityScorer,
    ScorerFactory
)

from process_fragment_miner.adapters import load_event_log

In [7]:
event_log = load_event_log("../data/raw/BPIC15_3f.xes.gz")

parsing log, completed traces ::   0%|          | 0/1369 [00:00<?, ?it/s]

In [None]:
# 1. Load event log from .xes file (using PM4Py)
import math


miner = ProcessFragmentMiner(
    event_log=event_log,
    scorer="bigram",
    # scorer_kwargs={"remove_loops": True}
)

# 4. Extract top subtraces using DFS
subtraces = miner.extract_subtraces(max_depth=1000, min_depth=2, top_k=math.inf)

# 5. Select the best disjoint subset of fragments
score, best_traces, scores = miner.mine_best_fragments(
    subtraces=subtraces,
    score_agg="mean",       # or "mean", "log_likelihood"
    alpha=0.0,             # reward per unique activity
    beam_size=50,
    max_memory_mb=1,
    method="auto",         # try "dp", "beam", or "auto"
    return_details=True,
    ensure_coverage=True
)

# 6. Output results
print("Best Score:", score)
print("Best Fragments:")
display(best_traces)

display(scores)


Best Score: 0
Best Fragments:


[['01_HOOFD_380',
  '01_HOOFD_510_1',
  '01_HOOFD_520',
  '01_HOOFD_061',
  '01_HOOFD_490_1a',
  '01_HOOFD_010',
  '01_HOOFD_370',
  '01_HOOFD_490_1',
  '08_AWB45_005',
  '01_HOOFD_050',
  '01_HOOFD_250_1',
  '06_VD_010',
  '01_HOOFD_110',
  '01_HOOFD_510_0',
  '01_HOOFD_195',
  '01_HOOFD_375',
  '01_HOOFD_495',
  '01_HOOFD_470',
  '01_HOOFD_015',
  '01_HOOFD_030_1',
  '01_HOOFD_490_3',
  '01_HOOFD_030_2',
  '01_HOOFD_510_2',
  '04_BPT_005',
  '01_HOOFD_490_5a',
  '01_HOOFD_065_2',
  '01_HOOFD_020',
  '01_HOOFD_330',
  'START',
  '01_HOOFD_260',
  '01_HOOFD_490_5',
  '02_DRZ_010',
  '01_HOOFD_250',
  '01_HOOFD_430',
  '01_HOOFD_110_0',
  '11_AH_II_010',
  '13_CRD_010',
  '01_HOOFD_250_2',
  '01_HOOFD_500',
  '01_HOOFD_490_4',
  '01_HOOFD_510_3',
  '01_HOOFD_065_1',
  '01_HOOFD_510_4',
  '03_GBH_005',
  '05_EIND_010',
  '01_HOOFD_490_2',
  '01_HOOFD_060',
  '01_HOOFD_480',
  '01_HOOFD_510_2a',
  '01_HOOFD_491',
  '09_AH_I_010',
  '01_HOOFD_120',
  '01_HOOFD_200',
  '01_HOOFD_196',
  '01

[]

In [15]:
%run ../notebook_init.py
%load_scripts
from fragment_scripts import get_event_names


fragments = best_traces
flat_set = {item for sublist in fragments for item in sublist}

event_names = get_event_names(event_log)

display(event_names.difference(flat_set))

🔄 Reloaded: evaluation_scripts
🔄 Reloaded: fragment_scripts
🔄 Reloaded: mining_scripts
🔄 Reloaded: helper_scripts
🔄 Reloaded: miners
✅ Script reloader active.
📁 Watching paths:
  - /Users/jhtobis/git/fragement-miner/scripts


{'01_HOOFD_250',
 '01_HOOFD_260',
 '01_HOOFD_430',
 '01_HOOFD_470',
 '01_HOOFD_490_1a',
 '01_HOOFD_490_4',
 '01_HOOFD_490_5a',
 '01_HOOFD_491',
 '01_HOOFD_494a',
 '01_HOOFD_510_2a',
 '09_AH_I_010',
 '13_CRD_010'}

In [16]:
display(subtraces)

[(0.0007419468287832092, ['START', '01_HOOFD_010', '01_HOOFD_030_2', 'END']),
 (7.0616319461662005e-06,
  ['START',
   '01_HOOFD_010',
   '01_HOOFD_015',
   '01_HOOFD_020',
   '01_HOOFD_030_1',
   '01_HOOFD_065_2',
   '01_HOOFD_011']),
 (3.7905731685789884e-06,
  ['START',
   '01_HOOFD_010',
   '01_HOOFD_065_2',
   '01_HOOFD_180',
   '08_AWB45_005',
   'END']),
 (3.5859324111573743e-06,
  ['START',
   '01_HOOFD_010',
   '01_HOOFD_065_2',
   '01_HOOFD_011',
   '01_HOOFD_015',
   '01_HOOFD_020',
   '01_HOOFD_030_1',
   '01_HOOFD_030_2',
   'END']),
 (3.1342619509421946e-06,
  ['START',
   '01_HOOFD_010',
   '01_HOOFD_065_2',
   '01_HOOFD_100',
   '01_HOOFD_490_3',
   '01_HOOFD_510_2',
   'END']),
 (1.2332183622339874e-06,
  ['START',
   '01_HOOFD_010',
   '01_HOOFD_065_2',
   '01_HOOFD_011',
   '01_HOOFD_015',
   '03_GBH_005',
   '01_HOOFD_030_2',
   'END']),
 (6.313226048998226e-07,
  ['START',
   '01_HOOFD_010',
   '01_HOOFD_065_2',
   '01_HOOFD_180',
   '01_HOOFD_200',
   '08_AWB45_00