In [3]:
import pandas as pd
import numpy as np
import datetime
import random

np.random.seed(42)

def generate_hydrogen_infrastructure_data(num_records=1000):
    # Generacja danych symulujących dla infrastruktury  infrastrukturę wodorową
    data = {
        'timestamp': [datetime.datetime(2023, 1, 1) + datetime.timedelta(days=x) for x in range(num_records)],
        'temperatura': np.random.normal(25, 5, num_records),  # Temperatura [°C]
        'wilgotnosc': np.random.uniform(30, 80, num_records),  # Wilgotność [%]
        'cisnienie': np.random.normal(10, 2, num_records),  # Ciśnienie [bar]
        'material': np.random.choice(['stal_nierdzewna', 'stal_X70', 'stal_st3'], num_records),
        'grubość_sciany': np.random.normal(10, 2, num_records),  # Grubość ścianki [mm]
        'poziom_wodoru': np.random.uniform(0, 100, num_records),  # proc zaw. wodoru w [%]
        'zasolenie': np.random.uniform(0, 50, num_records),  # Poziom zasolenia dla mieszaniny wodoru z kawern solnych
    }
    
    # Symulacja stopnia korozji
    def simulate_corrosion(row):
        base_risk = 0
        
        # Czynniki zwiększające ryzyko korozji
        if row['material'] == 'stal_st3':
            base_risk += 20
        if row['temperatura'] > 30:
            base_risk += 15
        if row['wilgotnosc'] > 70:
            base_risk += 25
        if row['zasolenie'] > 30:
            base_risk += 30
        
        # Dodatkowe losowe wahania
        base_risk += np.random.uniform(0, 10)
        
        return min(base_risk, 100)

    df = pd.DataFrame(data)
    df['stopien_korozji'] = df.apply(simulate_corrosion, axis=1)
    
    # Klasyfikacja ryzyka
    def classify_risk(corrosion_level):
        if corrosion_level < 20:
            return 'niskie'
        elif corrosion_level < 50:
            return 'średnie'
        else:
            return 'wysokie'
    
    df['kategoria_ryzyka'] = df['stopien_korozji'].apply(classify_risk)
    
    return df

# Generacja danych
hydrogen_data = generate_hydrogen_infrastructure_data()
hydrogen_data.to_csv(r"C:\Users\arcis\OneDrive\Pulpit\4_korozja_ywbrany\dane_infrastruktury_wodorowej.csv")
print(hydrogen_data.head())
print("\nPodsumowanie danych:")
print(hydrogen_data.describe())

   timestamp  temperatura  wilgotnosc  cisnienie         material  \
0 2023-01-01    27.483571   38.374129   9.381582         stal_st3   
1 2023-01-02    24.308678   35.228392   8.495687  stal_nierdzewna   
2 2023-01-03    28.238443   61.821512  10.638349  stal_nierdzewna   
3 2023-01-04    32.615149   65.323786  12.680901  stal_nierdzewna   
4 2023-01-05    23.829233   31.579307   6.249655  stal_nierdzewna   

   grubość_sciany  poziom_wodoru  zasolenie  stopien_korozji kategoria_ryzyka  
0       13.941729      29.391676  24.124653        21.382456          średnie  
1        9.961063      44.632636  31.128770        34.394654          średnie  
2        8.324581      72.701853   0.502349         4.963228           niskie  
3        7.841215      69.292023   9.742025        19.036467           niskie  
4       11.672657      98.736847  24.566522         6.786601           niskie  

Podsumowanie danych:
                 timestamp  temperatura   wilgotnosc    cisnienie  \
count         