In [1]:
import pandas as pd
from pathlib import Path

# 1️⃣ Definir rutas
data_path = Path.cwd() / "../data"
database_path = Path.cwd() / "../database"
database_path.mkdir(parents=True, exist_ok=True)

input_file = data_path / "bancos.csv"
output_file = database_path / "bancos_clean.csv"

# 2️⃣ Leer el archivo CSV original
df = pd.read_csv(input_file)

# 3️⃣ Mostrar cantidad de valores nulos antes
print("🔍 Valores nulos antes de la limpieza:")
print(df.isnull().sum())

# 4️⃣ Reemplazar valores nulos en la columna TipoCuenta
df["TipoCuenta"] = df["TipoCuenta"].fillna("CTA AHORROS SOLES")

# 5️⃣ Eliminar filas completamente vacías o duplicadas (opcional)
df.dropna(how="all", inplace=True)
df.drop_duplicates(inplace=True)

# 6️⃣ Mostrar resumen después de la limpieza
print("\n✅ Después de la limpieza:")
print(df.isnull().sum())

# 7️⃣ Guardar el nuevo archivo limpio
df.to_csv(output_file, index=False, encoding="utf-8")
print(f"\n📁 Archivo limpio guardado en: {output_file}")


🔍 Valores nulos antes de la limpieza:
Num_Cta            0
Cli_codigo         0
TipoCuenta       246
Sucursal           0
FechaApertura      0
Saldo              0
dtype: int64

✅ Después de la limpieza:
Num_Cta          0
Cli_codigo       0
TipoCuenta       0
Sucursal         0
FechaApertura    0
Saldo            0
dtype: int64

📁 Archivo limpio guardado en: c:\Users\user\Documents\BancoDigital_2025A\scripts\..\database\bancos_clean.csv
