In [1]:
import pandas as pd
from pathlib import Path

In [4]:
class ProcesadorDatosEmbarcaciones:
    def __init__(self, directorio):
        self.directorio = Path(directorio).resolve()

    def listar_archivos_nemos(self):
        # Listar archivos en el directorio especificado
        return [archivo.as_posix() for archivo in self.directorio.iterdir() if archivo.is_file()]

    def cargar_datos_nemos(self, lista_archivos):
        # Leer archivos y concatenar en un único DataFrame
        lista_dfs = [pd.read_csv(archivo) for archivo in lista_archivos]
        return pd.concat(lista_dfs, ignore_index=True)

    def renombrar_columnas_nemos(self, df):
        nuevo_nombre_columnas = {
                    'Unique_id': 'ID_Unico',
                    'Nave': 'Nombre_Embarcacion',
                    'Referencia': 'Ref_Posicion',
                    'Referenc_1': 'Ref_Auxiliar',
                    'Longitud': 'Longitud',
                    'Latitud': 'Latitud',
                    'Fecha y ho': 'Fecha_Hora',
                    'Fecha de l': 'Fecha_Log',
                    'Hora de la': 'Hora_Log',
                    'Marca de t': 'Tipo_Marca',
                    'Marca de_1': 'Subtipo_Marca',
                    'Guardar ma': 'Guardar_Marca',
                    'Rumbo': 'Rumbo',
                    'Rumbo prom': 'Rumbo_Promedio',
                    'Velocidad': 'Velocidad',
                    'Velocida_1': 'Velocidad_Promedio',
                    'Referenc_2': 'Ref_Secundaria',
                    'Dipoitivo': 'Dispositivo',
                    'Retrasar l': 'Retraso_Local',
                    'Dispositiv': 'Tipo_Dispositivo',
                    'Retraso Pr': 'Retraso_Promedio',
                    'Retraso re': 'Retraso_Reporte',
                    'ID zona de': 'ID_Zona',
                    'Dia': 'Dia',
                    'Mes': 'Mes',
                    'Anio': 'Anio',
                    'Viaje': 'ID_Viaje',
                    'Etapa': 'Etapa_Viaje',
                    'Inicio de viaje': 'Inicio_Viaje',
                    'Fin de viaje': 'Fin_Viaje',
                    'Unique_ID': 'ID_Unico_Alterno',
                    'Disposit_1': 'Detalle_Dispositivo',
                    'Inicio de Viaje': 'Inicio_Viaje_Detalle',
                    'Fin de Viaje': 'Fin_Viaje_Detalle'
        }
        return df.rename(columns=nuevo_nombre_columnas)

    def convertir_datetime(self, df):
        # Convertir columnas de fechas y horas a datetime
        df['Fecha_Hora'] = pd.to_datetime(df['Fecha_Hora'], errors='coerce')
        df['Fecha_Log'] = pd.to_datetime(df['Fecha_Log'], errors='coerce')
        df['Hora_Log'] = pd.to_datetime('2000-01-01 ' + df['Hora_Log'].astype(str), format='%Y-%m-%d %H:%M:%S', errors='coerce')
        return df
    
    def eliminar_columnas_vacias(self, df):
        return df.dropna(axis=1, how='all')


In [5]:
procesador = ProcesadorDatosEmbarcaciones('NEMOS')
archivos = procesador.listar_archivos_nemos()
df = procesador.cargar_datos_nemos(archivos)
df_renombrado = procesador.renombrar_columnas_nemos(df)
df_final = procesador.convertir_datetime(df_renombrado)
df_final = procesador.eliminar_columnas_vacias(df_final)
df.to_csv('vms_flota_nemo.csv',encoding='utf-8')

   ID_Unico Nombre_Embarcacion  Ref_Posicion  Ref_Auxiliar  Longitud  \
0       1.0     704009_ATUNERA        704009        704009  -92.4653   
1       2.0     704009_ATUNERA        704009        704009  -92.4652   
2       3.0     704009_ATUNERA        704009        704009  -92.4652   
3       4.0     704009_ATUNERA        704009        704009  -92.4652   
4       5.0     704009_ATUNERA        704009        704009  -92.4656   

    Latitud          Fecha_Hora  Fecha_Log     Guardar_Marca  Rumbo  ...  Dia  \
0  18.64470 2022-03-10 09:28:00 2022-03-10  03/10/2022 09:32    276  ...    3   
1  18.64445 2022-03-10 09:31:00 2022-03-10  03/10/2022 09:32      0  ...    3   
2  18.64480 2022-03-10 10:01:00 2022-03-10  03/10/2022 11:03      0  ...    3   
3  18.64480 2022-03-10 10:16:00 2022-03-10  03/10/2022 11:03      0  ...    3   
4  18.64460 2022-03-10 15:00:00 2022-03-10  03/10/2022 15:02      0  ...    3   

   Mes  Anio  ID_Viaje  Etapa_Viaje  Inicio_Viaje  Fin_Viaje  \
0   10  2022    