In [3]:
# Dieses ipynb generiert Daten für den Energieverbrauch der Maschinen nach einem nichtlinearem Modell mit kleinen Störungen

In [4]:
import pandas as pd
import numpy as np      

In [6]:
# Zufälligen Random Startpunkt wählen
np.random.seed(42)
# Anzahl der Datenpunkte
anzahl_maschinen = 100
# Daten simulieren
betriebszeit = np.random.randint(1000, 3000, size=anzahl_maschinen)  # Betriebszeit in h

In [7]:
wartungskosten = np.random.randint(500, 800, size=anzahl_maschinen)  # Wartungskosten in Euro
maschinenleistung = np.random.randint(75, 95, size=anzahl_maschinen)  # Maschinenleistung in kW

In [8]:
betriebszeit

array([2126, 2459, 1860, 2294, 2130, 2095, 2724, 2044, 2638, 1121, 1466,
       2238, 1330, 2482, 1087, 2396, 2123, 1871, 2687, 1130, 2685, 2332,
       1769, 1343, 2515, 2437, 1805, 1385, 2215, 1955, 1276, 2184, 1459,
       2337, 1021, 1252, 1747, 1856, 2584, 1474, 2082, 1510, 2705, 2499,
       1699, 1975, 2806, 1189, 1957, 1686, 1957, 1562, 2899, 2590, 2267,
       1831, 2528, 2154, 2508, 2842, 1646, 1020, 1840, 1166, 2297, 1387,
       1600, 1315, 1013, 1241, 1776, 2369, 1564, 1897, 2363, 1091, 2390,
       1955, 2478, 2451, 1508, 1775, 2966, 1034, 1205, 2104, 2955, 2585,
       2895, 2411, 2025, 2021, 2413, 1565, 2129, 2795, 2845, 2500, 1702,
       1401])

In [9]:
# Nichtlineares Modell für den Energieverbrauch mit zufälligen Störungen
# Energieverbrauch = 0.01 * (Wartungskosten)^2 + 0.5 * Betriebszeit + 0.3 * Maschinenleistung + Störung
stoerung = np.random.normal(0, 200, size=anzahl_maschinen)  # Störungen mit normalverteiltem Rauschen
energieverbrauch = 0.01 * wartungskosten**2 + 0.5 * betriebszeit + 0.3 * maschinenleistung + stoerung
stoerung

array([  -0.97138893,  -76.66466125,  -92.50537204, -222.49947087,
        173.4458998 ,  191.68276724,   83.62370439, -377.30560916,
        454.6690316 ,   29.39493009,  107.92184032, -299.65912747,
         -2.28868949,   82.67081752,  -28.17971089,  174.43237187,
        260.0690296 , -268.70475281,  170.02411642,   78.86799029,
         -0.93919893, -314.16239671,  295.96975504,   79.35485625,
       -356.65021243,  -48.62689208,   65.44467727,  101.31506033,
        -25.52095886,   68.31816119,  423.77724245,  309.30735109,
       -189.90380904, -119.37946631,  -22.24079996, -349.81388683,
       -268.28069959, -324.33892419, -229.54399457,  277.92056563,
       -171.04810378, -205.41235179,  176.5675321 ,  -89.86087722,
         83.72789383, -145.63584987, -360.3775938 ,   93.5434155 ,
       -310.28678882, -102.09864392, -146.59022701,   39.06929451,
       -111.18897955,  -25.54696569, -312.11141449,  400.06961782,
       -240.02634755,  240.27608884,   29.96674327,   28.18147

In [6]:
# Daten in einem DataFrame speichern
daten = pd.DataFrame({
    'MaschinenID': np.arange(1, anzahl_maschinen + 1),
    'Betriebszeit': betriebszeit,
    'Wartungskosten': wartungskosten,
    'Maschinenleistung': maschinenleistung,
    'Energieverbrauch': energieverbrauch
})

# CSV-Datei speichern (optional, falls benötigt)
daten.to_csv('Maschinendaten.csv', index=False)

# Die ersten Zeilen anzeigen, um einen Eindruck von den simulierten Daten zu bekommen
print(daten.head())

   MaschinenID  Betriebszeit  Wartungskosten  Maschinenleistung  \
0            1          2126             717                 86   
1            2          2459             543                 89   
2            3          1860             661                 83   
3            4          2294             701                 94   
4            5          2130             769                 91   

   Energieverbrauch  
0       6228.718611  
1       4128.025339  
2       5231.604628  
3       5866.710529  
4       7179.355900  
