In [1]:
# Importação das Bibliotecas
import pandas as pd
import os

In [2]:
# Função para calcular estatísticas para um sensor
def calcular_estatisticas_sensor(file_path, sensor_prefix):
    """
    Lê o arquivo do sensor, transforma para formato longo e calcula estatísticas por ciclo.
    Retorna um DataFrame com as estatísticas e a coluna 'Ciclo'.
    """
    # Ler o arquivo (assumindo que os dados estão separados por tabulação e sem cabeçalho)
    df = pd.read_csv(file_path, delimiter="\t", header=None)
    # Cada linha representa um ciclo; adiciona a coluna 'Ciclo'
    df["Ciclo"] = df.index + 1
    
    # Transforma o DataFrame de wide para long format: cada medição se torna uma linha
    df_long = df.melt(id_vars=["Ciclo"], var_name="Tempo", value_name=f"{sensor_prefix}_valor")
    df_long["Tempo"] = df_long["Tempo"].astype(int)
    
    # Calcular estatísticas agregadas por ciclo
    estatisticas = df_long.groupby("Ciclo")[f"{sensor_prefix}_valor"].agg(
        media="mean",
        desvio="std",
        minimo="min",
        maximo="max",
        mediana="median"
    ).reset_index()
    
    # Renomear as colunas para incluir o prefixo do sensor
    estatisticas = estatisticas.rename(columns={
        "media": f"{sensor_prefix}_media",
        "desvio": f"{sensor_prefix}_desvio",
        "minimo": f"{sensor_prefix}_min",
        "maximo": f"{sensor_prefix}_max",
        "mediana": f"{sensor_prefix}_mediana"
    })
    
    return estatisticas

In [3]:
# Defina o caminho da pasta onde estão os arquivos
data_folder = "Dados"

# Lista todos os arquivos .txt na pasta, exceto o profile.txt (ignorando maiúsculas/minúsculas)
all_files = [f for f in os.listdir(data_folder) 
             if f.endswith(".txt") and f.lower() != "profile.txt"]

# Inicializa um DataFrame vazio para juntar os dados de todos os sensores
df_all_sensors = None

In [4]:
# Itera sobre os arquivos de sensores e calcula as estatísticas
for file in all_files:
    sensor_prefix = os.path.splitext(file)[0]  # extrai o nome do sensor (ex: "CE", "PS1", etc.)
    file_path = os.path.join(data_folder, file)
    sensor_df = calcular_estatisticas_sensor(file_path, sensor_prefix)
    
    # Se for o primeiro sensor, atribui ao DataFrame global; caso contrário, faz o merge
    if df_all_sensors is None:
        df_all_sensors = sensor_df
    else:
        df_all_sensors = pd.merge(df_all_sensors, sensor_df, on="Ciclo", how="outer")

# Visualiza as primeiras linhas do DataFrame consolidado dos sensores
print("Estatísticas consolidadas dos sensores:")
print(df_all_sensors.head())

Estatísticas consolidadas dos sensores:
   Ciclo   CE_media  CE_desvio  CE_min  CE_max  CE_mediana  CP_media  \
0      1  39.601350   6.370535  28.866  47.438     40.6755  1.862750   
1      2  25.786433   1.686129  23.320  29.208     25.3855  1.255550   
2      3  22.218233   0.638345  21.220  23.554     22.1040  1.113217   
3      4  20.459817   0.455755  19.673  21.565     20.4805  1.062150   
4      5  19.787017   0.290156  19.133  20.460     19.7985  1.070467   

   CP_desvio  CP_min  CP_max  ...  TS4_media  TS4_desvio  TS4_min  TS4_max  \
0   0.279385   1.383   2.188  ...  31.745250    1.116478   30.363   33.594   
1   0.074605   1.147   1.414  ...  34.493867    0.435312   33.648   35.148   
2   0.023263   1.076   1.159  ...  35.646150    0.293889   35.098   36.141   
3   0.024621   1.022   1.107  ...  36.579467    0.262397   36.105   36.988   
4   0.021477   1.016   1.106  ...  37.427900    0.239571   36.992   37.781   

   TS4_mediana  VS1_media  VS1_desvio  VS1_min  VS1_max  V

In [5]:
# Ler o arquivo profile.txt que contém as condições dos ciclos
profile_path = os.path.join(data_folder, "profile.txt")
profile_df = pd.read_csv(profile_path, delimiter="\t", header=None, 
                         names=["Cooler_condition", "Valve_condition", "Pump_leakage", "Accumulator_pressure", "Stable_flag"])

# Adicionar a coluna 'Ciclo' para o profile (assumindo que o primeiro ciclo é o índice 0 + 1)
profile_df["Ciclo"] = profile_df.index + 1

In [6]:
# Fazer o merge entre os dados dos sensores e o profile.txt usando a coluna 'Ciclo'
df_final = pd.merge(df_all_sensors, profile_df, on="Ciclo", how="inner")

# Visualizar as primeiras linhas do DataFrame final unificado
print("DataFrame final unificado (sensores + profile.txt):")
print(df_final.head())

DataFrame final unificado (sensores + profile.txt):
   Ciclo   CE_media  CE_desvio  CE_min  CE_max  CE_mediana  CP_media  \
0      1  39.601350   6.370535  28.866  47.438     40.6755  1.862750   
1      2  25.786433   1.686129  23.320  29.208     25.3855  1.255550   
2      3  22.218233   0.638345  21.220  23.554     22.1040  1.113217   
3      4  20.459817   0.455755  19.673  21.565     20.4805  1.062150   
4      5  19.787017   0.290156  19.133  20.460     19.7985  1.070467   

   CP_desvio  CP_min  CP_max  ...  VS1_media  VS1_desvio  VS1_min  VS1_max  \
0   0.279385   1.383   2.188  ...   0.576950    0.027078    0.532    0.624   
1   0.074605   1.147   1.414  ...   0.565850    0.027241    0.524    0.626   
2   0.023263   1.076   1.159  ...   0.576533    0.036729    0.529    0.662   
3   0.024621   1.022   1.107  ...   0.569267    0.033464    0.527    0.645   
4   0.021477   1.016   1.106  ...   0.577367    0.033484    0.524    0.660   

   VS1_mediana  Cooler_condition  Valve_condit

In [9]:
df_final.isna().sum()

Ciclo                   0
CE_media                0
CE_desvio               0
CE_min                  0
CE_max                  0
                       ..
Cooler_condition        0
Valve_condition         0
Pump_leakage            0
Accumulator_pressure    0
Stable_flag             0
Length: 91, dtype: int64

In [10]:
# Salvar o DataFrame final unificado em um arquivo CSV
df_final.to_csv("dataset_hydraulicSystems.csv", index=False)

print("Dataset salvo com sucesso em 'dataset_hydraulicSystems.csv'.")

Dataset salvo com sucesso em 'dataset_hydraulicSystems.csv'.
