In [1]:
import pandas as pd
import numpy as np

In [None]:

def generar_sql_desde_excel(ruta_excel, nombre_tabla, ruta_salida_sql):
    # === 1. Leer el archivo Excel ===
    df = pd.read_excel(ruta_excel)

    # === 2. Mapeo de tipos pandas â†’ PostgreSQL ===
    tipo_map = {
        "int64": "INTEGER",
        "float64": "NUMERIC(15,2)",
        "object": "VARCHAR(255)",
        "bool": "BOOLEAN",
        "datetime64[ns]": "TIMESTAMP"
    }

    # === 3. Generar columnas ===
    columnas_sql = []
    for col in df.columns:
        tipo = str(df[col].dtype)
        sql_tipo = tipo_map.get(tipo, "VARCHAR(255)")
        columnas_sql.append(f"\"{col}\" {sql_tipo}")
    
    columnas_sql_str = ",\n  ".join(columnas_sql)
    create_table_sql = f"CREATE TABLE {nombre_tabla} (\n  {columnas_sql_str}\n);\n"

    # === 4. Guardar en archivo .sql ===
    with open(ruta_salida_sql, "w", encoding="utf-8") as f:
        f.write(create_table_sql)

    print(f"\nâœ… Archivo SQL generado correctamente en: {ruta_salida_sql}")
    print("\n--- Vista previa ---\n")
    print(create_table_sql)
# Ejemplo de uso
generar_sql_desde_excel("/home/emelchor/Descargas/AVALES POR CREDITO 2020-2025 V2.xlsx", 
                        nombre_tabla="mi_tabla_excel",   # Nombre de la tabla SQL
                        ruta_salida_sql="mi_tabla_excel.sql"  # Archivo .sql de salida
    )

In [None]:
data = pd.read_csv("Export_procesado.csv")
data

In [9]:

# === 2. Calcular valores nulos ===
nulos = data.isnull().sum()                 # cantidad de nulos por columna
porcentaje = (nulos / len(data)) * 100      # porcentaje de nulos

# === 3. Crear resumen en DataFrame ===
resumen_nulos = pd.DataFrame({
    "Columna": data.columns,
    "Nulos": nulos.values,
    "Porcentaje (%)": porcentaje.round(2)
})

# === 4. Filtrar solo las columnas con nulos ===
resumen_nulos = resumen_nulos[resumen_nulos["Nulos"] > 0]

# === 5. Mostrar resultado ===
print("\n=== Resumen de columnas con datos nulos ===\n")
print(resumen_nulos.to_string(index=False))

# === 6. (Opcional) Exportar el resumen a un CSV ===
resumen_nulos.to_csv("resumen_nulos_captacion.csv", index=False)


=== Resumen de columnas con datos nulos ===

               Columna  Nulos  Porcentaje (%)
           escolaridad   2306           14.01
         codigo_postal   2306           14.01
         cod_actividad   2306           14.01
  antiguedad_actividad   2306           14.01
   ingresos_ordinarios   2306           14.01
      num_dependientes   2306           14.01
  reputaciÃ“n_localidad   2306           14.01
   antigudad_domicilio   2306           14.01
      exp_cred_externa   2306           14.01
      exp_cred_interna   2306           14.01
              cap_pago   2306           14.01
             tipo_casa   2306           14.01
                deudas   2306           14.01
permiso_para_funcionar   2306           14.01
    comercio_en_region   2306           14.01
                empleo   2306           14.01
       permiso_negocio   2306           14.01


In [11]:

# === 2. Separar registros con y sin nulos ===
df_con_nulos = data[data.isnull().any(axis=1)]      # filas con al menos un valor nulo
df_sin_nulos = data[data.notnull().all(axis=1)]     # filas sin ningÃºn valor nulo

# === 3. Guardar en nuevos archivos CSV ===
ruta_con_nulos = "/home/emelchor/Documentos/ProyectoLachao/EDA/Registros_con_nulos.csv"
ruta_sin_nulos = "/home/emelchor/Documentos/ProyectoLachao/EDA/Registros_sin_nulos.csv"

df_con_nulos.to_csv(ruta_con_nulos, index=False)
df_sin_nulos.to_csv(ruta_sin_nulos, index=False)

# === 4. Mostrar resumen ===
print(f"âœ… Registros con nulos guardados: {len(df_con_nulos)} en {ruta_con_nulos}")
print(f"âœ… Registros sin nulos guardados: {len(df_sin_nulos)} en {ruta_sin_nulos}")
print(f"ðŸ“Š Total original: {len(data)} registros")


âœ… Registros con nulos guardados: 2306 en /home/emelchor/Documentos/ProyectoLachao/EDA/Registros_con_nulos.csv
âœ… Registros sin nulos guardados: 14148 en /home/emelchor/Documentos/ProyectoLachao/EDA/Registros_sin_nulos.csv
ðŸ“Š Total original: 16454 registros
