[Markdown Guide](https://docs.gitlab.com/ee/user/markdown.html)

# Praxismodul I
## Thema 6: Process Organisation
## Hochschule Mainz
## Wirtschaftsinformatik dual B.Sc., Fachsemester 4

Durchgeführt von

| Student | Matrikel-Nummer |
|:-- |:--|
|Moritz Wetzel | 943566|
|Till Waller | 943565|
Fabian Harmsen| 943611|



## Gliederung

1. Projektziel
2. Erklärungen zu den grafischen Ergebnissen
3. Configuration
4. Import
5. Similar Activities
6. Discover Roles
7. Handover Of Work
8. Clustering Similar Activities
9. Clustering Working together
10. Fazit

## 3. Configuration

Die folgende Tabelle erklärt die Variablen, die im nächsten Code-Block definiert werden können. Die Logdatei muss, um richtig analysiert werden zu können, im XES-Dateiformat vorliegen. Der Speicherort muss in der Variable `log_path` angegeben werden.

| variable | type | description| default|
|:--|:--|:--|:--|
|log_path | (path)| path to the XES File|`data/test.xes`|
|use_networkx | (bool)| output via NetworkX or Pyvis| `False`|
|filter_timeframe | (bool)| filter the timeframe of the traces| `False` |
|filter_timeframe_intersecting | (bool)| use intersecting or contained| `False` |
|filter_timeframe_start | (dateTime)| start of the Timeframe| `1970-01-01 00:00:00` |
|filter_timeframe_end | (dateTime)| end of the Timeframe| `2038-12-31 00:00:00` |
|filter_performance| (bool)| filter on Traceperformance| `False` |
|filter_performance_min| (int)| minimum seconds of trace actions|`0` |
|filter_performance_max |(int)| maximum seconds of trace actions|`360000` |

Die Option `Pyvis` legt die Ergebnisse im Ordner `./result` ab, welcher schreibend Zugriff benötigt.

In [None]:
log_path = 'data/BPI_Challenge_2017_Offer_log.xes'

use_networkx = False

filter_timeframe = False
filter_timeframe_intersecting  = False
filter_timeframe_start = "2011-03-09 00:00:00"
filter_timeframe_end = "2011-03-09 00:00:00"

filter_performance = False
filter_performance_min = 0
filter_performance_max = 864000

## 4. Import
Im folgenden Codeblock werden alle Bibliotheken geladen die im laufenden Skript benötigt werden. Wenn die Bibliotheken nicht gefunden werden können, können sie über den Packagemanager pip seperat nachinstalliert werden.

**Unvollständige Liste der Pythonpackete (pip)**
 - pm4py
 - shutil
 - numpy
 - sklearn
 - scipy


In [None]:
import shutil
from pm4py.objects.log.importer.xes import importer as xes_importer
from pm4py.algo.organizational_mining.sna import algorithm as sna
from pm4py.visualization.sna import visualizer as sna_visualizer
from pm4py.algo.organizational_mining.roles import algorithm as roles_discovery
from pm4py.algo.organizational_mining.sna import util
from pm4py.algo.filtering.log.timestamp import timestamp_filter
from pm4py.algo.filtering.log.cases import case_filter
from pm4py.algo.organizational_mining.local_diagnostics import algorithm as local_diagnostics
from pathlib import Path

Der Ordner für die webbasierten Exportergebnisse wird in diesem Codeblock erstellt. Wird NetworkX als Ausgabe genutzt, wird dieser Abschnitt übersprungen.


In [None]:
if not use_networkx:
    Path("./result").mkdir(parents=True, exist_ok=True)

Dieser Code-Block lädt den Datensatz und wendet die eingestellten Filter an.
Die Einstellungen dazu wurden in Block 3 (Configuration) festgelegt.

In [None]:
log = xes_importer.apply(log_path)

if filter_timeframe:
    if not filter_timeframe_intersecting:
        log = timestamp_filter.filter_traces_contained(   log, filter_timeframe_start, filter_timeframe_end)
    else:
        log = timestamp_filter.filter_traces_intersecting(log, filter_timeframe_start, filter_timeframe_end)

if filter_performance:
    log = case_filter.filter_case_performance(log, filter_performance_min, filter_performance_max)

## 5. Similar Activities

In diesem Abschnitt wird die Methode "Similar Activities" auf den zuvor importierten Datensatz angewendet, um zu berechnen, wie sehr sich die Arbeitsabläufe zwischen den Nutzern (Nodes) ähneln (Quelle: https://pm4py.fit.fraunhofer.de/documentation).

In [None]:
sa_metric  = sna.apply(log, variant=sna.Variants.JOINTACTIVITIES_LOG)

if use_networkx:
    gviz_ja_py = sna_visualizer.apply(sa_metric , variant=sna_visualizer.Variants.NETWORKX)
    sna_visualizer.view(gviz_ja_py, variant=sna_visualizer.Variants.NETWORKX)
else:
    gviz_ja_py = sna_visualizer.apply(sa_metric , variant=sna_visualizer.Variants.PYVIS)
    shutil.move(gviz_ja_py, "result/similar_activities.html")

## 6. Discover Roles

In diesem Abschnitt wird die Methode “Discover Roles” auf den zuvor importierten Datensatz angewendet, um die Rollen eines Nutzers (Node) anhand seiner durchgeführten Aktivitäten zu erkennen. Eine Rolle ist dabei ein Satz von Arbeitsaktivitäten im Log, die in ähnlicher Weise von einem Nutzer (Node) oder mehreren Nutzern (Nodes) ausgeführt wird. Zu Beginn der Analyse gehört jede Arbeitsaktivität zu unterschiedlichen Positionen und ist mit einer hohen Anzahl an Urhebern verbunden. Anschließend werden die Rollen entsprechend ihrer Ähnlichkeit der Arbeitsabläufe gruppiert, bis keine weitere Gruppierung mehr möglich ist. (Quelle: https://pm4py.fit.fraunhofer.de/documentation)

Folgende Quelle kann helfen, die aufgeführten Rollen zu verstehen und zu erkennen:

Burattin, Andrea, Alessandro Sperduti, and Marco Veluscek. “Business models enhancement through discovery of roles.” 2013 IEEE Symposium on Computational Intelligence and Data Mining (CIDM). IEEE, 2013

Die Analyseergebnisse werden folgendermaßen ausgegeben:

1. Rollenname auf Basis der Aktivitäten
2. Benutzer mit der Angabe wie aktiv der Nutzer in der Rolle war
3. `Leerzeile`

In [None]:
roles = roles_discovery.apply(log)

for x in roles:
    print(x[0])
    print(x[1])
    print("")

## 7. Handover Of Work

In diesem Abschnitt wird die Methode “Handover Of Work” auf den zuvor importierten Datensatz angewendet, um zu messen, wie oft ein Nutzer (Node) bei der Ausführung eines Geschäftsprozesses mit einer anderen Person zusammenarbeitet. (Quelle: https://pm4py.fit.fraunhofer.de/documentation)
Ein HandOver wird hier als folgendes definiert, ein Nutzer übergibt den Geschäftsvorfall am Ende seiner Aktivität an einen anderen Nutzer. Die beiden Nutzer sind dabei die Nodes, die Edges sind eine Metrik für die Anzahl an übergebenden Geschäftsvorfällen. Die Edges zeigen bei “Handover Of Work” Analysen somit auch die Richtung des Arbeitsflusses.



In [None]:
hw_values = sna.apply(log, variant=sna.Variants.HANDOVER_LOG)

if use_networkx:
    gviz_hw_py = sna_visualizer.apply(hw_values, variant=sna_visualizer.Variants.NETWORKX)
    sna_visualizer.view(gviz_hw_py, variant=sna_visualizer.Variants.NETWORKX)
else:
    gviz_hw_py = sna_visualizer.apply(hw_values , variant=sna_visualizer.Variants.PYVIS)
    shutil.move(gviz_hw_py, "result/handover_of_work.html")

## 8. Clustering Similar Activities

In diesem Abschnitt werden die unter 6 analysierten Nutzer in Nutzergruppen zusammengefasst, welche gleiche Aufgaben verrichtet haben. Dies soll die Übersichtlichkeit erhöhen und erste Schlussfolgerungen ermöglichen.

Die Analyseergebnisse werden folgendermaßen ausgegeben:

1. Cluster
2. Benutzerliste
3. `Leerzeile`

In [None]:
clustering_sa = util.cluster_affinity_propagation(sa_metric)

for group in clustering_sa:
    print("Gruppe: " + group)
    print(clustering_sa[group])
    print("")


## 9. Clustering Handover Of Work

In diesem Abschnitt werden die unter 8 analysierten Nutzer als Gruppe zusammengefasst, welche häufig miteinander arbeiten. Dies soll die Übersichtlichkeit erhöhen und erste Schlussfolgerungen ermöglichen.

Die Analyseergebnisse werden folgendermaßen ausgegeben:

1. Cluster
2. Benutzerliste
3. `Leerzeile`

In [None]:
clustering_hw = util.cluster_affinity_propagation(hw_values)
for group in clustering_hw:
    print("Gruppe: " + group)
    print(clustering_hw[group])
    print("")

## 10. Fazit

Im Projekt konten wir aus verschiedensten Datensätze auswerten. Dabei konnte man sowohl Guppenpersonen erkennen die regelmäßig die gleichen Aktivitäten machen aber auch Personen die an verschiedenen Stellen in einem Geschäftsprozess arbeiten.
Auffällig war aber, dass es auch Geschäftsprozesse gab bei denen alle Beteiligten ein großes Team waren, in solchen Fällen erzeugen die durchgeführten Analysen kein interpretierbares Ergebnis.
