In [12]:
import pandas as pd
from collections import defaultdict

# Exemple de données d'événements (à remplacer par vos propres données)
data = {
    'CaseID': [1, 1, 2, 2, 3, 3, 3, 4],
    'Activity': ['A', 'B', 'A', 'C', 'A', 'B', 'C', 'A'],
    'Timestamp': ['2023-01-01 10:00:00', '2023-01-01 11:00:00', '2023-01-02 09:00:00', '2023-01-02 10:00:00',
                   '2023-01-03 08:00:00', '2023-01-03 09:00:00', '2023-01-03 10:00:00', '2023-01-04 08:00:00']
}

df = pd.DataFrame(data)
df['Timestamp'] = pd.to_datetime(df['Timestamp'])

# Tri des événements par CaseID et Timestamp
df.sort_values(['CaseID', 'Timestamp'], inplace=True)

# Construction du tableau de fréquence
frequency_table = defaultdict(int)
for case_id, group in df.groupby('CaseID')['Activity']:
    sequence = '->'.join(group.tolist())
    print(f"Case {case_id}: {group.tolist()}")
    frequency_table[sequence] += 1

# Affichage du tableau de fréquence
print("Tableau de fréquence :")
for sequence, frequency in frequency_table.items():
    print(f"{sequence}: {frequency} fois")

# Identification des relations de causalité
causal_relations = defaultdict(int)
for sequence, frequency in frequency_table.items():
    activities = sequence.split('->')
    for i in range(len(activities) - 1):
        causal_relations[f"{activities[i]}->{activities[i+1]}"] += frequency
        

# Affichage des relations de causalité
print("\nRelations de causalité :")
for relation, frequency in causal_relations.items():
    print(f"{relation}: {frequency} fois")


Case 1: ['A', 'B']
Case 2: ['A', 'C']
Case 3: ['A', 'B', 'C']
Case 4: ['A']
Tableau de fréquence :
A->B: 1 fois
A->C: 1 fois
A->B->C: 1 fois
A: 1 fois

Relations de causalité :
A->B: 2 fois
A->C: 1 fois
B->C: 1 fois


In [14]:
import pandas as pd
from collections import defaultdict

# Exemple de données d'événements (à remplacer par vos propres données)
data = {
    'CaseID': [1, 1, 2, 2, 3, 3, 3, 4],
    'Activity': ['A', 'B', 'A', 'C', 'A', 'B', 'C', 'A'],
    'Timestamp': ['2023-01-01 10:00:00', '2023-01-01 11:00:00', '2023-01-02 09:00:00', '2023-01-02 10:00:00',
                   '2023-01-03 08:00:00', '2023-01-03 09:00:00', '2023-01-03 10:00:00', '2023-01-04 08:00:00']
}

df = pd.DataFrame(data)
df['Timestamp'] = pd.to_datetime(df['Timestamp'])

# Tri des événements par CaseID et Timestamp
df.sort_values(['CaseID', 'Timestamp'], inplace=True)

# Construction du tableau de fréquence
frequency_table = defaultdict(int)
for case_id, group in df.groupby('CaseID'):
    sequence = '->'.join(group['Activity'].tolist())
    frequency_table[sequence] += 1

# Affichage du tableau de fréquence
print("Tableau de fréquence :")
for sequence, frequency in frequency_table.items():
    print(f"{sequence}: {frequency} fois")

# Identification des relations de causalité avec gestion du temps
causal_relations = defaultdict(int)
for case_id, group in df.groupby('CaseID'):
    activities = group['Activity'].tolist()
    timestamps = group['Timestamp'].tolist()

    for i in range(len(activities) - 1):
        time_difference = (timestamps[i + 1] - timestamps[i]).total_seconds()
        causal_relations[f"{activities[i]}->{activities[i+1]}"] += 1 / time_difference if time_difference != 0 else 0

# Affichage des relations de causalité avec gestion du temps
print("\nRelations de causalité avec gestion du temps :")
for relation, weight in causal_relations.items():
    print(f"{relation}: Weight - {weight}")



Tableau de fréquence :
A->B: 1 fois
A->C: 1 fois
A->B->C: 1 fois
A: 1 fois

Relations de causalité avec gestion du temps :
A->B: Weight - 0.0005555555555555556
A->C: Weight - 0.0002777777777777778
B->C: Weight - 0.0002777777777777778
