In [1]:
import os
import pandas as pd
from joblib import Parallel, delayed

In [None]:
# Ruta donde están los archivos
folder_path = r"D:\Proyectos python\Bearings\IMS\1st_test"

# Nombres de columnas
column_names = ["Ro_1a", "Ro_1b", "Ro_2a", "Ro_2b", "Ro_3a", "Ro_3b", "Ro_4a", "Ro_4b"]

# Función para cargar un archivo
def cargar_archivo(file):
    file_path = os.path.join(folder_path, file)

    if os.path.isfile(file_path):  
        try:
            # 📖 Leer el archivo
            df = pd.read_csv(file_path, sep=r"\s+", header=None, engine="python", encoding="utf-8")
            
            # Renombrar columnas
            df.columns = column_names  

            # 🕒 Extraer fecha y hora del nombre del archivo
            try:
                fecha_hora = pd.to_datetime(file, format="%Y.%m.%d.%H.%M.%S")
            except ValueError:
                fecha_hora = file  # Si no se puede convertir, dejar como texto
            
            df.insert(0, "fecha_hora", fecha_hora)  # 🛠 Poner la fecha como primera columna
            return df

        except Exception as e:
            print(f" No se pudo leer el archivo {file}: {e}")
            return None

# Obtener lista de archivos y procesar en paralelo
archivos = sorted(os.listdir(folder_path))
dataframes = Parallel(n_jobs=-1)(delayed(cargar_archivo)(file) for file in archivos)

# 🗃 Filtrar archivos cargados correctamente
dataframes = [df for df in dataframes if df is not None]

# Unir todos los DataFrames en uno solo
if dataframes:
    final_df = pd.concat(dataframes, ignore_index=True)

    # Mostrar primeras filas
    print(final_df.head())

    # Guardar en parquet si lo necesitas
    final_df.to_parquet('test_1.parquet', engine='pyarrow')
else:
    print("No se cargaron archivos.")

           fecha_hora  Ro_1a  Ro_1b  Ro_2a  Ro_2b  Ro_3a  Ro_3b  Ro_4a  Ro_4b
0 2003-10-22 12:06:24 -0.022 -0.039 -0.183 -0.054 -0.105 -0.134 -0.129 -0.142
1 2003-10-22 12:06:24 -0.105 -0.017 -0.164 -0.183 -0.049  0.029 -0.115 -0.122
2 2003-10-22 12:06:24 -0.183 -0.098 -0.195 -0.125 -0.005 -0.007 -0.171 -0.071
3 2003-10-22 12:06:24 -0.178 -0.161 -0.159 -0.178 -0.100 -0.115 -0.112 -0.078
4 2003-10-22 12:06:24 -0.208 -0.129 -0.261 -0.098 -0.151 -0.205 -0.063 -0.066


In [None]:
# Ruta donde están los archivos
folder_path = r"D:\Proyectos python\Bearings\IMS\2nd_test"

# Nombres de columnas
column_names = ["Ro_1a", "Ro_2a", "Ro_3a",  "Ro_4a"]

# Función para cargar un archivo
def cargar_archivo(file):
    file_path = os.path.join(folder_path, file)

    if os.path.isfile(file_path):  
        try:
            # Leer el archivo
            df = pd.read_csv(file_path, sep=r"\s+", header=None, engine="python", encoding="utf-8")
            
            # Renombrar columnas
            df.columns = column_names  

            # Extraer fecha y hora del nombre del archivo
            try:
                fecha_hora = pd.to_datetime(file, format="%Y.%m.%d.%H.%M.%S")
            except ValueError:
                fecha_hora = file  # Si no se puede convertir, dejar como texto
            
            df.insert(0, "fecha_hora", fecha_hora)  # 🛠 Poner la fecha como primera columna
            return df

        except Exception as e:
            print(f"No se pudo leer el archivo {file}: {e}")
            return None

# Obtener lista de archivos y procesar en paralelo
archivos = sorted(os.listdir(folder_path))
dataframes = Parallel(n_jobs=-1)(delayed(cargar_archivo)(file) for file in archivos)

# 🗃 Filtrar archivos cargados correctamente
dataframes = [df for df in dataframes if df is not None]

#  Unir todos los DataFrames en uno solo
if dataframes:
    final_df = pd.concat(dataframes, ignore_index=True)

    # Mostrar primeras filas
    print(final_df.head())

    # Guardar en CSV si lo necesitas
    final_df.to_parquet('test_2.parquet', engine='pyarrow')
else:
    print("No se cargaron archivos.")

           fecha_hora  Ro_1a  Ro_2a  Ro_3a  Ro_4a
0 2004-02-12 10:32:39 -0.049 -0.071 -0.132 -0.010
1 2004-02-12 10:32:39 -0.042 -0.073 -0.007 -0.105
2 2004-02-12 10:32:39  0.015  0.000  0.007  0.000
3 2004-02-12 10:32:39 -0.051  0.020 -0.002  0.100
4 2004-02-12 10:32:39 -0.107  0.010  0.127  0.054


In [None]:
# Ruta donde están los archivos
folder_path = r"D:\Proyectos python\Bearings\IMS\3th_test"

# Nombres de columnas
column_names = ["Ro_1a", "Ro_2a", "Ro_3a",  "Ro_4a"]

# Función para cargar un archivo
def cargar_archivo(file):
    file_path = os.path.join(folder_path, file)

    if os.path.isfile(file_path):  
        try:
            # Leer el archivo
            df = pd.read_csv(file_path, sep=r"\s+", header=None, engine="python", encoding="utf-8")
            
            # Renombrar columnas
            df.columns = column_names  

            # Extraer fecha y hora del nombre del archivo
            try:
                fecha_hora = pd.to_datetime(file, format="%Y.%m.%d.%H.%M.%S")
            except ValueError:
                fecha_hora = file  # Si no se puede convertir, dejar como texto
            
            df.insert(0, "fecha_hora", fecha_hora)  # 🛠 Poner la fecha como primera columna
            return df

        except Exception as e:
            print(f"No se pudo leer el archivo {file}: {e}")
            return None

# Obtener lista de archivos y procesar en paralelo
archivos = sorted(os.listdir(folder_path))
dataframes = Parallel(n_jobs=-1)(delayed(cargar_archivo)(file) for file in archivos)

# 🗃 Filtrar archivos cargados correctamente
dataframes = [df for df in dataframes if df is not None]

# Unir todos los DataFrames en uno solo
if dataframes:
    final_df = pd.concat(dataframes, ignore_index=True)

    # Mostrar primeras filas
    print(final_df.head())

    # Guardar en CSV si lo necesitas
    final_df.to_parquet('test_3.parquet', engine='pyarrow')
else:
    print("No se cargaron archivos.")

           fecha_hora  Ro_1a  Ro_2a  Ro_3a  Ro_4a
0 2004-03-04 09:27:46  0.034  0.264  0.039 -0.046
1 2004-03-04 09:27:46  0.103  0.083 -0.061 -0.012
2 2004-03-04 09:27:46  0.095 -0.039 -0.007  0.039
3 2004-03-04 09:27:46  0.000  0.110  0.022 -0.002
4 2004-03-04 09:27:46  0.005  0.154 -0.127 -0.020
