In [None]:
import os
import time
import pandas as pd
from sqlalchemy import create_engine
from watchdog.observers import Observer
from watchdog.events import FileSystemEventHandler

# Configuración de la base de datos
database_config = {
    'server': 'dislicores-1.cxc0gcgy4dsz.us-east-2.rds.amazonaws.com,1433',  
    'database': 'dislicores-1', 
    'username': 'admin',  
    'password': 'KingKong9#_9+',  
}

# Crear cadena de conexión
connection_string = f"mssql+pyodbc://{database_config['username']}:{database_config['password']}@{database_config['server']}/{database_config['database']}?driver=ODBC+Driver+17+for+SQL+Server"
engine = create_engine(connection_string)

class DataHandler(FileSystemEventHandler):
    def __init__(self, engine):
        self.engine = engine

    def on_created(self, event):
        if event.is_directory or not event.src_path.endswith(".csv"):
            return
        self.process_new_file(event.src_path)

    def on_modified(self, event):
        if event.is_directory or not event.src_path.endswith(".csv"):
            return
        self.process_new_file(event.src_path)

    def process_new_file(self, file_path):
        try:
            new_data = pd.read_csv(file_path)
            new_data = new_data.drop(columns=['Unnamed: 0'], errors='ignore')

            # Convertir columnas que contengan la palabra 'date' a formato datetime
            for column in new_data.columns:
                if 'date' in column.lower():
                    new_data[column] = pd.to_datetime(new_data[column], errors='coerce')

            table_name = os.path.splitext(os.path.basename(file_path))[0]

            # Obtener el nombre de la columna ID específica
            id_column = self.get_id_column(table_name)

            # Verificar que la columna ID exista en el DataFrame
            if id_column not in new_data.columns:
                print(f"Error: La columna '{id_column}' no existe en el archivo {file_path}")
                return

            # Cargar los datos existentes de la base de datos
            existing_data = pd.read_sql(f"SELECT * FROM {table_name}", self.engine)

            # Identificar filas nuevas (basado en id_column)
            new_rows = new_data[~new_data[id_column].isin(existing_data[id_column])]

            # Verificar integridad referencial para 'Inventario_inicialID' si es necesario
            if table_name == 'VentasFinales':
                inventario_inicial_ids = pd.read_sql("SELECT InventoryInicialID FROM InventarioInicial2016", self.engine)
                valid_ids = inventario_inicial_ids['InventoryInicialID']
                new_rows = new_rows[new_rows['InventoryInicialID'].isin(valid_ids)]

            # Insertar datos nuevos en la base de datos
            if not new_rows.empty:
                new_rows.to_sql(table_name, self.engine, if_exists='append', index=False)
                print(f"Se han insertado {len(new_rows)} filas nuevas en la tabla {table_name}")
            else:
                print(f"No hay filas nuevas para insertar en la tabla {table_name}")

        except Exception as e:
            print(f"Error al procesar el archivo {file_path}: {e}")

    def get_id_column(self, table_name):
        id_columns = {
            'VentasFinales': 'VentasID',
            'DetalleCompra': 'DetalleCompraID',
            'InventarioFinal2016': 'InventoryFinalID',
            'InventarioInicial2016': 'InventoryInicialID',
            'Producto': 'BrandID',
            'FacturaCompras': 'CompraID',
        }
        return id_columns.get(table_name, 'id')

def process_existing_files(path, handler):
    for filename in os.listdir(path):
        if filename.endswith(".csv"):
            file_path = os.path.join(path, filename)
            handler.process_new_file(file_path)

if __name__ == '__main__':
    path_to_watch = r"C:\Users\Juan Daniel Bermudez\OneDrive\Escritorio\M6\inventory_prueba\CSV_Finales"  # Cambia esto por tu ruta
    event_handler = DataHandler(engine)

    # Procesar archivos existentes en la carpeta
    process_existing_files(path_to_watch, event_handler)

    observer = Observer()
    observer.schedule(event_handler, path=path_to_watch, recursive=True)
    observer.start()
    print(f"Observando cambios en: {path_to_watch}")

    try:
        while True:
            time.sleep(1)
    except KeyboardInterrupt:
        observer.stop()
    observer.join()
    print("El observador ha sido detenido.")
