# Unternehmensdaten

![Data Quality](../imgs/data_quality.png)

## Daten vom Shop Floor

Typische Datenquellen sind Ausfürhgunslogs bezogen auf:
- Prozesse
- Aufträge

In [1]:
import pandas as pd

In [2]:
# read the source files
execution_log_df = pd.read_excel("../data/executions.xlsx")

print(execution_log_df.columns.values)
print(execution_log_df.head())

['Process Execution ID' 'Process Name' 'Start Time' 'End Time'
 'Order Identifier' 'Feature' 'Main Resource' 'Origin Resource'
 'Destination Resource' 'Resulting Quality' 'Resource 0' 'Part 0' 'Part 1'
 'Part 2' 'Part 3']
   Process Execution ID        Process Name          Start Time  \
0                 22715  transport_access_p 2025-07-03 07:00:00   
1                 22774  transport_access_p 2025-07-03 07:00:00   
2                 22706  transport_access_p 2025-07-03 07:00:00   
3                 22747  transport_access_p 2025-07-03 07:00:00   
4                 22769  transport_access_p 2025-07-03 07:00:00   

             End Time  Order Identifier Feature       Main Resource  \
0 2025-07-03 07:00:20             22658     NaN  main_part_agv4_nsr   
1 2025-07-03 07:00:20             22652     NaN   main_part_agv_nsr   
2 2025-07-03 07:00:20             22659     NaN  main_part_agv8_nsr   
3 2025-07-03 07:00:20             22655     NaN  main_part_agv1_nsr   
4 2025-07-03 07:00:2

Im Prozessauführungslog finden Sie eine Liste aller ausgeführten Prozesse.
Jede Zeile enthält die folgenden Daten:
- Prozessinformationen (Link zur Identifizierung und/oder zum Namen des ausgeführten Prozesses)
- Zeitinformationen (Start- und Endzeit des Prozesses)
- Auftragsinformationen (Link zum zugehörigen Auftrag)
- Ressourceninformationen (Link zu den zugehörigen Ressourcen)
- (Eingabe-)Teilinformationen (Link zu den zugehörigen Teilen)
- Übergangsinformationen (Herkunfts- und Zielressource, die zur Spezifizierung des Transports oder Transfers erforderlich sind)
- Qualitätsinformationen (Angabe der resultierenden Qualität der transformierten Teile)

Diese Dateneinträge sind erforderlich, um das Zustandsmodell des Digitalen Zwillings zu aktualisieren.
Dies ist jedoch nur ein Beispiel dafür, wie die Dateneingabe aussehen könnte.
Abweichende Datenstrukturen sind ebenfalls möglich, wie beispielsweise Event Logs.
In Event Logs kann ein Prozess mehrere Einträge haben, z. B. wird für jedes Ereignis ein Eintrag erstellt.
Datenlücken (fehlende Daten) können ebenfalls im Rahmen der Datenintegration behandelt werden.


In [3]:
# read the source files
order_pool_df = pd.read_excel("../data/orders.xlsx")

print(order_pool_df.columns.values)
print(order_pool_df.head())

['Identifier' 'Product Class' 'Price' 'Customer' 'Order Date'
 'Release Date' 'Delivery Date Requested' 'Delivery Date Planned'
 'Delivery Date Actual' 'Urgent' 'Feature 0' 'Feature 1' 'Feature 2'
 'Feature 3' 'Feature 4' 'Feature 5' 'Feature 6' 'Feature 7' 'Feature 8'
 'Feature 9' 'Feature 10' 'Feature 11']
   Identifier Product Class    Price  Customer              Order Date  \
0       22650      frame_et  4842.24     20019 2025-06-30 09:29:53.459   
1       22651      frame_et  3553.83     20018 2025-06-30 09:40:46.459   
2       22652      frame_et  4536.84     20017 2025-06-30 09:49:13.459   
3       22653      frame_et  2928.39     20019 2025-06-30 09:59:55.459   
4       22654      frame_et  3252.65     20020 2025-06-30 10:09:04.459   

         Release Date  Delivery Date Requested   Delivery Date Planned  \
0 2025-07-03 07:00:00                      NaN 2025-06-30 10:19:53.459   
1 2025-07-03 07:00:00                      NaN 2025-06-30 10:30:46.459   
2 2025-07-03 07:00:00  

In der Auftrags-Pool-Ausführungsdatei finden Sie eine Liste aller Aufträge. Diese können bereits abgeschlossen, in Bearbeitung oder geplant sein. Jede Zeile enthält die folgenden Daten:
- Auftragsinformationen (Link zur Auftragskennung und/oder zum Namen)
- Kundeninformationen (Link zum zugehörigen Kunden)
- Preisinformationen (Wie viel kostet der Auftrag?)
- Produktinformationen (Link zum zugehörigen Produkt (Teil) und/oder zur Produktklasse (Art des Produkts))
- Zeitinformationen (Zeitstempel des Auftragslebenszyklus - („Auftragsdatum”, „Freigabedatum”, „Gewünschter Liefertermin“, „Geplanter Liefertermin“, „Tatsächlicher Liefertermin“))
– Dringlichkeitsinformationen (Ist die Bestellung dringend?)
– Feature-Informationen (beschreibt die vom Kunden gewählten Produktspezifikationen)
– Features werden Prozessen zugeordnet (im statischen Zustandsmodell).

Der Auftrag wird durch die Ausführung einer Reihe von Prozessen abgeschlossen, die erforderlich sind, um die ausgewählten Merkmale zum Produkt hinzuzufügen. Diese Dateneinträge sind erforderlich, um das Zustandsmodell des digitalen Zwillings zu aktualisieren. Dies ist jedoch nur ein Beispiel dafür, wie die Dateneingabe aussehen könnte. Abweichende Datenstrukturen sind ebenfalls möglich. Wenn beispielsweise der Auftrag in einem Anwendungsfall auf Stücklisten oder Prozessen statt auf Merkmalen basiert, könnten Merkmale künstlich hinzugefügt werden. Wie bereits für die Event Logs erwähnt, können Datenlücken (fehlende Daten) als Teil der Datenintegration behandelt werden.