### Importación de Archivos SQL

En esta sección, se importa y organiza la información contenida en archivos SQL, separándolos por carpetas o claves para su uso posterior. El objetivo es asegurar que la estructura de los datos sea consistente y adecuada para su procesamiento posterior.

El proceso incluye las siguientes verificaciones:

- **Validación de archivos**: Se revisa si todos los archivos necesarios están presentes, asegurando que no falten archivos importantes.
- **Detección de duplicados**: Se comprueba si existen registros duplicados en los datos importados.
- **Verificación de la consistencia de las dimensiones**: Se asegura que todos los archivos tengan el mismo número de filas y columnas, para evitar errores de incompatibilidad.
- **Estructura de los datos**: Se valida que cada DataFrame importado tenga la siguiente estructura:
  - **Data time**
  - **Close**
  - **Open**
  - **High**
  - **Low**
  - **Volume**

El objetivo es garantizar que todos los datos estén bien organizados, sin errores de duplicidad ni inconsistencias, para su posterior análisis y procesamiento en el sistema.


In [None]:
from modules.import_modules.import_m import cargar_dataframes, agregar_extension_csv #Dataframe de importacion, identificador de dataframes.
from modules.import_modules.security_import import verificar_diccionario,DuplicateChecker #Verificacion de los datos importados


#importando en un diccionario:
carpeta_base = 'C:\\Users\\spinz\\Documents\\Portafolio Oficial\\HERMESDB\\data\\raw' # Directorio de los datos sin procesar
diccionario_datos = cargar_dataframes(carpeta_base) #Diccionario con los dataframes de importacion
diccionario_datos = agregar_extension_csv(diccionario_datos) #Agregando la extension csv a los dataframes importados

#Verificacion de los datos importados
verificacion_1 = verificar_diccionario(diccionario_datos) # Verifica la estructura y validez de los archivos CSV en un diccionario de datos.

import nest_asyncio #Libreria necesaria para que funcione el asyncio en jupyter
nest_asyncio.apply() # Aplicando la libreria nest_asyncio
if __name__ == '__main__':
    # Crear un diccionario con DataFrames de ejemplo
    # Instanciar la clase y ejecutar la detección de duplicados
    verificacion_2 = DuplicateChecker(diccionario_datos)
    verificacion_2.run()



Comparing DataFrames: 100%|██████████| 12/12 [00:13<00:00,  1.15s/it]
