In [2]:
# import packages and start generating synthetic data
#==============================================================================


import random
import math
import pandas as pd

def generate_synthetic_dataframe(rows=1000):
    """
    Erzeugt ein synthetisches DataFrame mit realistischeren Werten pro Spalte.
    Berücksichtigt unterschiedliche Verteilungen und kleine Korrelationen.
    """

    headers = [
        "Temperatur",      # °C
        "Druck",           # bar
        "Feuchtigkeit",    # % rel. Luftfeuchtigkeit
        "Vibration",       # mm/s
        "Leistung",        # kW
        "Energie",         # kWh
        "Durchfluss",      # m³/h
        "Luftstrom",       # m³/min
        "Spannung",        # V
        "Stromstaerke",    # A
        "Helligkeit",      # Lumen
        "Rauschpegel",     # dB
        "PH_Wert",         # pH
        "Drehzahl",        # U/min
        "Resonanz",        # rel. Einheit (0-1)
        "Amplitude",       # mm
        "Frequenz",        # Hz
        "Leitfaehigkeit",  # µS/cm
        "Schwingung",      # mm/s
        "Verformung"       # mm
    ]

    def generate_row():
        temperatur = max(0, min(120, random.gauss(70, 10)))
        druck = 1.0 + ((temperatur - 70) * 0.01) + random.gauss(0, 0.2)
        druck = max(0.5, min(10, druck))
        feuchtigkeit = random.uniform(10, 90)
        vibration = max(0, min(20, random.gauss(3, 2)))
        leistung = max(100, min(5000, random.gauss(1000, 300)))
        energie = random.uniform(100, 10000)
        durchfluss = max(0, min(200, random.gauss(50, 20)))
        luftstrom = random.uniform(0, 60)
        spannung = max(200, min(250, random.gauss(230, 5)))
        stromstaerke = random.uniform(0, 100)
        helligkeit = max(0, min(20000, random.gauss(10000, 3000)))
        rauschpegel = random.uniform(20, 130)
        ph_wert = max(0, min(14, random.gauss(7, 1)))
        drehzahl = max(0, min(15000, random.gauss(3000, 1000)))
        resonanz = random.uniform(0, 1)
        amplitude = max(0, min(10, random.gauss(2, 1)))
        frequenz = max(0, min(20000, random.gauss(1000, 300)))
        leitfaehigkeit = random.uniform(10, 2000)
        schwingung = max(0, min(15, random.gauss(5, 2)))
        verformung = random.uniform(0, 5)

        return [
            temperatur,
            druck,
            feuchtigkeit,
            vibration,
            leistung,
            energie,
            durchfluss,
            luftstrom,
            spannung,
            stromstaerke,
            helligkeit,
            rauschpegel,
            ph_wert,
            drehzahl,
            resonanz,
            amplitude,
            frequenz,
            leitfaehigkeit,
            schwingung,
            verformung
        ]

    data = [generate_row() for _ in range(rows)]
    df = pd.DataFrame(data, columns=headers)
    return df

if __name__ == "__main__":
    df = generate_synthetic_dataframe()
    print(df.head())

   Temperatur     Druck  Feuchtigkeit  Vibration     Leistung      Energie  \
0   73.913804  0.858152     77.810083   2.680604   914.824605  9936.780588   
1   71.325621  0.885195     51.212377   1.726194   281.314202  6528.699727   
2   76.115558  1.049766     30.414244   2.658389   475.181937  2610.956318   
3   80.354074  0.935738     79.430979   3.810435  1458.113222  4488.579640   
4   78.359765  1.124504     70.845389   2.866039  1403.203142  8989.284709   

   Durchfluss  Luftstrom    Spannung  Stromstaerke    Helligkeit  Rauschpegel  \
0   38.574149  39.823414  232.674860     31.191948  11450.144847    30.051000   
1   64.272972  45.490542  228.107944     59.786275  11484.174137    80.751570   
2   60.462958  29.648866  220.434526     27.949004  11606.087172    90.577670   
3   59.487657   7.012244  225.411156      2.843087  14814.059588    42.152855   
4   26.808857  58.536722  223.215006     52.451671   6811.782270    89.762454   

    PH_Wert     Drehzahl  Resonanz  Amplitud

In [7]:
# Example usage
df.to_csv('/Users/danielambach/Projects/data_mining_dsba/data/raw/synthetic_data_pca.csv', index=False)