In [3]:
import pandas as pd
import numpy as np

# Ustawienia dla reprodukowalności
np.random.seed(42)

# Parametry
n_machines = 30  # Liczba maszyn
start_date = '2022-01-01'
end_date = '2024-10-31'

# Generowanie dat (codzienne dane)
dates = pd.date_range(start=start_date, end=end_date, freq='D')

# Generowanie danych
machine_ids = []

# Generowanie realistycznych identyfikatorów maszyn
models = ['M1000', 'M2000', 'M3000', 'M4000', 'M5000']  # Przykładowe modele
locations = ['L01', 'L02', 'L03', 'L04']  # Przykładowe lokalizacje
for i in range(n_machines):
    model = np.random.choice(models)  # Wybór losowego modelu
    location = np.random.choice(locations)  # Wybór losowej lokalizacji
    serial_number = np.random.randint(1000, 9999)  # Losowy numer seryjny
    machine_id = f'{model}_{location}_{serial_number}'  # Tworzenie identyfikatora maszyny
    machine_ids.append(machine_id)

# Nowe czujniki
data = []

for machine_id in machine_ids:
    machine_age_start_year = np.random.randint(2010, 2021)  # Wiek maszyny: maszyna zainstalowana między 2012 a 2021 rokiem
    machine_age = 2022 - machine_age_start_year  # Obliczanie wieku maszyny na początku 2022 roku

    # Obliczamy początkowy czas pracy maszyny
    days_in_service = machine_age * 365  # Liczba dni w pracy
    initial_working_hours = np.random.uniform(12, 16) * days_in_service  # Średnia liczba godzin pracy maszyny na dzień przez jej wiek

    total_working_hours = initial_working_hours  # Początkowy czas pracy maszyny

    for date in dates:
        # Losowe wartości dla czujników
        temperature = np.random.normal(loc=75, scale=5)  # Średnia temperatura 75°C z odchyleniem standardowym 5
        vibration = np.random.normal(loc=0.5, scale=0.1)  # Średnia wibracja 0.5 mm/s
        pressure = np.random.normal(loc=100, scale=10)  # Średnie ciśnienie 100 Pa
        rpm = np.random.normal(loc=1500, scale=200)  # Średnie obroty 1500 rpm
        humidity = np.random.normal(loc=50, scale=10)  # Średnia wilgotność 50%
        oil_level = np.random.normal(loc=80, scale=10)  # Średni poziom oleju 80%
        oil_pressure = np.random.normal(loc=200, scale=15)  # Średnie ciśnienie oleju 200 Pa
        ambient_temp = np.random.normal(loc=22, scale=4)  # Temperatura otoczenia (w stopniach Celsjusza)
        load = np.random.normal(loc=70, scale=10)  # Obciążenie maszyny (%)

        # Codzienny czas pracy maszyny (np. losowo od 12 do 16 godzin dziennie)
        daily_working_hours = np.random.uniform(12, 16)
        total_working_hours += daily_working_hours  # Narastający czas pracy maszyny

        # Aktualizacja wieku maszyny na podstawie daty
        machine_age = 2022 - machine_age_start_year + (date.year - 2022)

        # Złożona logika generowania awarii
        failure_probability = (
                (temperature > 80) * 0.2 +
                (vibration > 0.58) * 0.18 +
                (oil_level < 60) * 0.15 +
                (humidity > 55) * 0.1 +
                (total_working_hours > 45000) * 0.18 +
                (ambient_temp > 24) * 0.05 +
                (load > 83) * 0.14
        )

        # Dodajemy element losowości do procesu
        # failure_chance = np.random.random()
        # failure = 1 if failure_probability > failure_chance else 0
        failure = 1 if failure_probability > 0.4 else 0

        data.append([machine_id, date, temperature, vibration, pressure, rpm, humidity, oil_level, oil_pressure, total_working_hours, ambient_temp, load, machine_age, failure])

# Tworzenie DataFrame
df = pd.DataFrame(data, columns=['Machine_ID', 'Date', 'Temperature', 'Vibration', 'Pressure', 'RPM', 'Humidity', 'Oil_Level', 'Oil_Pressure', 'Working_Hours', 'Ambient_Temperature', 'Load', 'Machine_Age', 'Failure'])

# Zapisanie danych do pliku CSV
df.to_csv('machine_failure_data_4.csv', index=False)

df.head()


Unnamed: 0,Machine_ID,Date,Temperature,Vibration,Pressure,RPM,Humidity,Oil_Level,Oil_Pressure,Working_Hours,Ambient_Temperature,Load,Machine_Age,Failure
0,M4000_L01_6390,2022-01-01,65.621616,0.363322,106.363051,1318.655866,54.760426,93.036613,203.173805,19263.720546,24.388179,61.036648,4,0
1,M4000_L01_6390,2022-01-02,74.440061,0.621217,112.334968,1185.168943,56.379529,59.55577,216.042213,19276.74482,18.264949,77.842082,4,1
2,M4000_L01_6390,2022-01-03,74.247331,0.403444,101.504891,1477.31575,76.335282,69.749091,188.269283,19289.557065,23.695772,78.727051,4,0
3,M4000_L01_6390,2022-01-04,86.43613,0.513575,106.080897,1640.996262,53.609234,65.330321,213.389442,19302.430826,21.578971,60.446536,4,0
4,M4000_L01_6390,2022-01-05,79.813206,0.479031,92.259571,1428.044371,57.240833,77.442354,212.748818,19316.567184,16.754703,61.29695,4,0
