In [10]:
# Importar librerías
import pandas as pd

# Paso 1: Cargar los datos limpios
print("Cargando archivos de datos limpios...")
file_accesos = "../data/Internet_cleaned.xlsx"  # Datos de accesos totales
file_penetracion = "../data/Penetracion_hogares_cleaned.xlsx"  # Datos de penetración por hogares

# Cargar los datasets
df_accesos = pd.read_excel(file_accesos)
df_penetracion = pd.read_excel(file_penetracion)

# Paso 2: Mapear valores numéricos de provincia a nombres reales
print("\nMapeando valores numéricos a nombres de provincias...")
mapa_provincias = {
    "1.0": "BUENOS AIRES",
    "2.0": "CAPITAL FEDERAL",
    "3.0": "CATAMARCA",
    "4.0": "CHACO",
    "5.0": "CHUBUT",
    "6.0": "CORRIENTES",
    "7.0": "CÓRDOBA",
    "8.0": "ENTRE RÍOS",
    "9.0": "FORMOSA",
    "10.0": "JUJUY",
    "11.0": "LA PAMPA",
    "12.0": "LA RIOJA",
    "13.0": "MENDOZA",
    "14.0": "MISIONES",
    "15.0": "NEUQUÉN",
    "16.0": "RÍO NEGRO",
    "17.0": "SALTA",
    "18.0": "SAN JUAN",
    "19.0": "SAN LUIS",
    "20.0": "SANTA CRUZ",
    "21.0": "SANTA FE",
    "22.0": "SANTIAGO DEL ESTERO",
    "23.0": "TIERRA DEL FUEGO",
    "24.0": "TUCUMÁN"
}

# Reemplazar valores en la columna 'Provincia' de df_accesos
df_accesos["Provincia"] = df_accesos["Provincia"].astype(str).map(mapa_provincias)

# Paso 3: Consolidar accesos totales por provincia
print("\nConsolidando accesos totales por provincia...")
accesos_totales = df_accesos.groupby("Provincia")["Accesos"].sum().reset_index()
accesos_totales.rename(columns={"Accesos": "Accesos Totales"}, inplace=True)

# Paso 4: Consolidar penetración por cada 100 hogares
print("\nConsolidando penetración por cada 100 hogares...")
penetracion_promedio = df_penetracion.groupby("Provincia")["Accesos por cada 100 hogares"].mean().reset_index()

# Paso 5: Limpiar y forzar la columna 'Provincia' a string en ambos DataFrames
print("\nForzando la columna 'Provincia' a tipo string...")
accesos_totales["Provincia"] = accesos_totales["Provincia"].astype(str).str.strip().str.upper()
penetracion_promedio["Provincia"] = penetracion_promedio["Provincia"].astype(str).str.strip().str.upper()

# Paso 6: Fusionar los DataFrames
print("\nFusionando los datos por provincia...")
df_consolidado = pd.merge(accesos_totales, penetracion_promedio, on="Provincia", how="inner")

# Paso 7: Calcular el primer KPI
print("Calculando el KPI con un incremento del 2%...")
df_consolidado["Nuevo acceso"] = df_consolidado["Accesos Totales"] * 1.02
df_consolidado["KPI (%)"] = ((df_consolidado["Nuevo acceso"] - df_consolidado["Accesos Totales"]) / df_consolidado["Accesos Totales"]) * 100

# Paso 8: Calcular KPIs adicionales
print("\nCalculando KPIs adicionales...")

# KPI 2: Crecimiento de la penetración respecto a un objetivo (por ejemplo, 80 accesos por cada 100 hogares)
objetivo_penetracion = 80
df_consolidado["KPI Penetración (%)"] = ((df_consolidado["Accesos por cada 100 hogares"] - objetivo_penetracion) / objetivo_penetracion) * 100

# KPI 3: Proporción de accesos totales a nivel nacional
total_accesos_nacional = df_consolidado["Accesos Totales"].sum()
df_consolidado["Proporción Nacional (%)"] = (df_consolidado["Accesos Totales"] / total_accesos_nacional) * 100

# Paso 9: Mostrar el DataFrame con todos los KPIs
print("\nDataFrame final con todos los KPIs:")
print(df_consolidado)

# Paso 10: Guardar el archivo final con todos los KPIs
output_path = "../data/KPI_Analysis_Final.xlsx"
df_consolidado.to_excel(output_path, index=False)
print(f"\nAnálisis final de KPIs guardado en: {output_path}")


Cargando archivos de datos limpios...

Mapeando valores numéricos a nombres de provincias...

Consolidando accesos totales por provincia...

Consolidando penetración por cada 100 hogares...

Forzando la columna 'Provincia' a tipo string...

Fusionando los datos por provincia...
Calculando el KPI con un incremento del 2%...

Calculando KPIs adicionales...

DataFrame final con todos los KPIs:
              Provincia  Accesos Totales  Accesos por cada 100 hogares  \
0          BUENOS AIRES          55781.0                     66.297052   
1       CAPITAL FEDERAL          67217.0                    114.247268   
2             CATAMARCA         173130.0                     41.213171   
3                 CHACO          67136.0                     34.976478   
4                CHUBUT         102208.0                     57.641113   
5            CORRIENTES         304032.0                     37.966266   
6               CÓRDOBA          27397.0                     70.302257   
7            E