In [4]:
import pandas as pd

# Erstellen eines DataFrame mit Fehlerstatistiken der letzten 6 Monate
data = {
    'Monat': ['Januar', 'Februar', 'März', 'April', 'Mai', 'Juni'],
    'Lötfehler': [35, 30, 40, 45, 50, 55],
    'Bauteilbeschädigung': [20, 25, 22, 28, 26, 30],
    'Kurzschlüsse': [15, 10, 12, 14, 18, 20],
    'Offene Verbindungen': [10, 12, 11, 10, 13, 15],
    'Falsche Bauteile': [5, 8, 6, 7, 9, 10],
    'Andere Fehler': [5, 7, 8, 6, 8, 9]
}

df = pd.DataFrame(data)
df.set_index('Monat', inplace=True)

df


Unnamed: 0_level_0,Lötfehler,Bauteilbeschädigung,Kurzschlüsse,Offene Verbindungen,Falsche Bauteile,Andere Fehler
Monat,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
Januar,35,20,15,10,5,5
Februar,30,25,10,12,8,7
März,40,22,12,11,6,8
April,45,28,14,10,7,6
Mai,50,26,18,13,9,8
Juni,55,30,20,15,10,9


In [8]:
import numpy as np

# Erstellen der tagesgenauen Messdaten der Bauteilmaße über die letzten 3 Monate (90 Tage)
np.random.seed(0)
dates = pd.date_range(start='2024-03-01', periods=90, freq='D')
measurements = np.random.normal(loc=100, scale=5, size=90)  # Beispiel: Widerstandswerte um 100 Ohm mit einer Standardabweichung von 5 Ohm

tolerances = {
    'lower_bound': 95,  # Untere Toleranzgrenze
    'upper_bound': 105  # Obere Toleranzgrenze
}

# Erstellen eines DataFrame
measurement_data = pd.DataFrame({
    'Datum': dates,
    'Widerstandswert (Ohm)': measurements
})
measurement_data.set_index('Datum', inplace=True)

measurement_data


Unnamed: 0_level_0,Widerstandswert (Ohm)
Datum,Unnamed: 1_level_1
2024-03-01,108.820262
2024-03-02,102.000786
2024-03-03,104.893690
2024-03-04,111.204466
2024-03-05,109.337790
...,...
2024-05-25,109.479446
2024-05-26,105.893898
2024-05-27,99.100376
2024-05-28,94.646237


In [9]:
# Erstellen der tagesgenauen Messdaten der Bauteilmaße mit Anomalien
np.random.seed(1)
normal_measurements = np.random.normal(loc=100, scale=5, size=80)  # Normale Messdaten
anomalous_measurements = np.random.normal(loc=120, scale=5, size=10)  # Anomale Messdaten (höherer Durchschnitt)

# Kombinieren der normalen und anomalen Messdaten
all_measurements = np.concatenate((normal_measurements, anomalous_measurements))
np.random.shuffle(all_measurements)  # Mischen der Daten

# Erstellen eines DataFrame
dates_with_anomalies = pd.date_range(start='2024-03-01', periods=90, freq='D')
measurement_data_with_anomalies = pd.DataFrame({
    'Datum': dates_with_anomalies,
    'Widerstandswert (Ohm)': all_measurements
})
measurement_data_with_anomalies.set_index('Datum', inplace=True)

measurement_data_with_anomalies


Unnamed: 0_level_0,Widerstandswert (Ohm)
Datum,Unnamed: 1_level_1
2024-03-01,101.427937
2024-03-02,97.477671
2024-03-03,96.581361
2024-03-04,122.050258
2024-03-05,89.699296
...,...
2024-05-25,98.660560
2024-05-26,99.137859
2024-05-27,96.815022
2024-05-28,101.150474


In [11]:
# Generieren von Daten für X̄- und R-Karten, p-Karten und c-Karten

# Daten für X̄- und R-Karten (Mittelwert- und Spannweitenkarten)
np.random.seed(42)
n_samples = 20  # Anzahl der Stichproben
sample_size = 5  # Größe der einzelnen Stichproben

# Generieren von Stichprobendaten
xbar_data = np.random.normal(loc=100, scale=5, size=(n_samples, sample_size))
xbar_means = xbar_data.mean(axis=1)
xbar_ranges = xbar_data.max(axis=1) - xbar_data.min(axis=1)

# Daten für p-Karten (Anteil defekter Einheiten)
p_data = np.random.binomial(n=100, p=0.1, size=30)  # 30 Stichproben, jeweils 100 Einheiten, 10% Fehleranteil

# Daten für c-Karten (Anzahl der Fehler pro Einheit)
c_data = np.random.poisson(lam=5, size=30)  # 30 Stichproben, mittlere Fehleranzahl pro Einheit ist 5

# Erstellen von DataFrames für die verschiedenen Kontrollkarten
xbar_r_data = pd.DataFrame({
    'Stichprobe': range(1, n_samples + 1),
    'Mittelwert': xbar_means,
    'Spannweite': xbar_ranges
})

p_chart_data = pd.DataFrame({
    'Stichprobe': range(1, len(p_data) + 1),
    'Anteil defekter Einheiten': p_data / 100
})

c_chart_data = pd.DataFrame({
    'Stichprobe': range(1, len(c_data) + 1),
    'Anzahl Fehler': c_data
})

xbar_r_data, p_chart_data, c_chart_data


(    Stichprobe  Mittelwert  Spannweite
 0            1  102.295015    8.785916
 1            2  102.185596   10.243436
 2            3   95.674617   10.776213
 3            4   96.418801    8.632755
 4            5   99.338270   14.451985
 5            6   98.443295    7.633458
 6            7  101.001908   14.549946
 7            8   95.897025   10.842669
 8            9   99.014561   11.084943
 9           10   98.457217   14.100812
 10          11  100.904756    8.539608
 11          12  101.089659    9.073813
 12          13   97.845151   10.043662
 13          14  102.004279   10.006799
 14          15  100.808505   20.921944
 15          16   98.714134   14.047357
 16          17  100.288571   11.431938
 17          18  100.725903    7.225812
 18          19   99.643899    8.353490
 19          20   98.864187    8.798176,
     Stichprobe  Anteil defekter Einheiten
 0            1                       0.09
 1            2                       0.08
 2            3               

In [12]:
# Daten für p-Karten (Anteil defekter Einheiten)
p_data = np.random.binomial(n=100, p=0.1, size=30)  # 30 Stichproben, jeweils 100 Einheiten, 10% Fehleranteil

# Daten für c-Karten (Anzahl der Fehler pro Einheit)
c_data = np.random.poisson(lam=5, size=30)  # 30 Stichproben, mittlere Fehleranzahl pro Einheit ist 5

p_chart_data = pd.DataFrame({
    'Stichprobe': range(1, len(p_data) + 1),
    'Anteil defekter Einheiten': p_data / 100
})

c_chart_data = pd.DataFrame({
    'Stichprobe': range(1, len(c_data) + 1),
    'Anzahl Fehler': c_data
})

p_chart_data, c_chart_data


(    Stichprobe  Anteil defekter Einheiten
 0            1                       0.05
 1            2                       0.13
 2            3                       0.12
 3            4                       0.10
 4            5                       0.06
 5            6                       0.10
 6            7                       0.10
 7            8                       0.07
 8            9                       0.09
 9           10                       0.09
 10          11                       0.11
 11          12                       0.11
 12          13                       0.05
 13          14                       0.09
 14          15                       0.11
 15          16                       0.10
 16          17                       0.13
 17          18                       0.11
 18          19                       0.07
 19          20                       0.06
 20          21                       0.11
 21          22                       0.05
 22        

In [15]:
np.random.seed(3)

# Generieren von Datenpaaren für Streudiagramme
dates_for_scatter = pd.date_range(start='2024-03-01', periods=90, freq='D')

# Raumtemperatur (in Grad Celsius) und Fehlerquote (%)
room_temperature = np.random.normal(loc=22, scale=2, size=90)  # Durchschnittlich 22 Grad Celsius mit einer Standardabweichung von 2
error_rate_temp = np.random.normal(loc=0.1, scale=0.05, size=90)  # Durchschnittliche Fehlerquote von 10%

# Maschinenlaufzeit (in Stunden) und Fehlerquote (%)
machine_runtime = np.random.normal(loc=8, scale=1, size=90)  # Durchschnittliche Maschinenlaufzeit von 8 Stunden mit einer Standardabweichung von 1
error_rate_runtime = np.random.normal(loc=0.1, scale=0.05, size=90)  # Durchschnittliche Fehlerquote von 10%

scatter_temp_df = pd.DataFrame({
    'Datum': dates_for_scatter,
    'Raumtemperatur (C)': room_temperature,
    'Fehlerquote (%)': error_rate_temp
})

scatter_runtime_df = pd.DataFrame({
    'Datum': dates_for_scatter,
    'Maschinenlaufzeit (Stunden)': machine_runtime,
    'Fehlerquote (%)': error_rate_runtime
})

scatter_temp_df, scatter_runtime_df


(        Datum  Raumtemperatur (C)  Fehlerquote (%)
 0  2024-03-01           25.577257         0.070446
 1  2024-03-02           22.873020         0.074179
 2  2024-03-03           22.192995         0.052000
 3  2024-03-04           18.273015         0.118865
 4  2024-03-05           21.445224         0.071265
 ..        ...                 ...              ...
 85 2024-05-25           24.335765         0.018877
 86 2024-05-26           21.951791         0.038218
 87 2024-05-27           20.222685         0.092961
 88 2024-05-28           16.168524         0.151948
 89 2024-05-29           20.056319         0.131587
 
 [90 rows x 3 columns],
         Datum  Maschinenlaufzeit (Stunden)  Fehlerquote (%)
 0  2024-03-01                     9.729417         0.153271
 1  2024-03-02                     8.694052         0.056381
 2  2024-03-03                     7.488871         0.180962
 3  2024-03-04                     7.877157         0.125655
 4  2024-03-05                     5.969606  