In [1]:
import geopandas as gpd
import pandas as pd
import fiona

In [2]:
# Ruta del archivo geopackage
archivo_gpkg = r"C:\Users\ADMIN\Desktop\Ejercicio\Completo\Mzn_Tipologías_NAC_ImpEq.gpkg"

# Listar todas las capas en el geopackage
capas = fiona.listlayers(archivo_gpkg)
print("Capas disponibles en el geopackage:", capas)

# Leer una capa específica en formato tabular (sin información vectorial)
# Aquí, reemplaza "Mzn_Subtipologias_UeEq_filtrado" con el nombre de la capa que deseas cargar
df = gpd.read_file(archivo_gpkg, layer="Mzn_Subtipologias_UeEq_filtrado")

# Convertir a un DataFrame de Pandas si solo necesitas la información tabular
df = pd.DataFrame(df.drop(columns='geometry'))

# Mostrar el contenido de la tabla
print(df.head())

Capas disponibles en el geopackage: ['Mzn_Subtipologias_UeEq', 'Mzn_Subtipologias_UeEq_filtrado']
             CVEGEO  POPTOT2010  POPTOT2020  VIVTOT2010  VIVTOT2020  \
0  0100100010229006          25          26           8          10   
1  0100100010229007          99          56          18          14   
2  0100100010229008          78          46          20          22   
3  0100100010229010         134         114          51          51   
4  0100100010233006           1           1           1           2   

   TVIVHAB2010  TVIVHAB2020  TVIVPAR2010  TVIVPAR2020  TVIVPARHAB2010  ...  \
0            1            9            1           10               1  ...   
1            1           14            1           14               1  ...   
2            1           18            1           21               1  ...   
3            1           48            1           51               1  ...   
4            1            1            1            1               1  ...   

   SUB

In [3]:
import pandas as pd
from scipy.stats import chi2_contingency
import unicodedata
import re

In [6]:
# Función para limpiar nombres eliminando acentos y caracteres no permitidos
def limpiar_nombre(nombre):
    nombre = unicodedata.normalize("NFKD", nombre)
    nombre_sin_acentos = "".join([c for c in nombre if not unicodedata.combining(c)])
    nombre_limpio = nombre_sin_acentos.replace(" ", "_")
    return nombre_limpio[:31]

# Función para calcular la tabla de contingencia, residuos estandarizados y porcentajes
def calcular_tabla_residuos_porcentajes(df_filtrado):
    tabla_contingencia = pd.crosstab(df_filtrado['TIPOLOGIA'], df_filtrado['TIPOLOGIA_ue'])
    tabla_porcentajes = tabla_contingencia / tabla_contingencia.values.sum() * 100
    chi2_met, p_met, dof_met, expected_met = chi2_contingency(tabla_contingencia)
    frecuencias_esperadas_met = pd.DataFrame(expected_met, index=tabla_contingencia.index, columns=tabla_contingencia.columns)
    residuos_estandarizados_met = (tabla_contingencia - frecuencias_esperadas_met) / frecuencias_esperadas_met**0.5
    return tabla_contingencia, residuos_estandarizados_met, tabla_porcentajes

# Crear diccionario para almacenar las tablas por TIPO_MET
tablas_por_tipo_met = {}

# Cálculo total (sin filtro)
tabla_total, residuos_total, porcentajes_total = calcular_tabla_residuos_porcentajes(df)

# Agrupamiento por TIPO_MET
tipos_met = df['TIPO_MET'].unique()
for tipo in tipos_met:
    df_filtrado_tipo_met = df[df['TIPO_MET'] == tipo]
    tabla_tipo_met, residuos_tipo_met, porcentajes_tipo_met = calcular_tabla_residuos_porcentajes(df_filtrado_tipo_met)
    tablas_por_tipo_met[tipo] = {
        'tabla': tabla_tipo_met,
        'residuos_estandarizados': residuos_tipo_met,
        'porcentajes': porcentajes_tipo_met
    }

    # Agrupamiento por NOM_MET dentro de cada TIPO_MET
    nom_met_values = df_filtrado_tipo_met['NOM_MET'].unique()
    for nom_met in nom_met_values:
        df_filtrado_nom_met = df_filtrado_tipo_met[df_filtrado_tipo_met['NOM_MET'] == nom_met]
        tabla_nom_met, residuos_nom_met, porcentajes_nom_met = calcular_tabla_residuos_porcentajes(df_filtrado_nom_met)
        
        # Almacenar tablas de NOM_MET dentro del tipo actual
        tablas_por_tipo_met[tipo][nom_met] = {
            'tabla': tabla_nom_met,
            'residuos_estandarizados': residuos_nom_met,
            'porcentajes': porcentajes_nom_met
        }

# Exportar a Excel
output_file = r'C:\Users\ADMIN\Desktop\tabla_contingencia_y_residuos_combinados.xlsx'
with pd.ExcelWriter(output_file) as writer:
    # Guardar el cálculo principal (total)
    sheet_name_total = "Contingencia_Total"
    tabla_total.to_excel(writer, sheet_name=sheet_name_total, index=True)
    start_row = len(tabla_total) + 2
    residuos_total.to_excel(writer, sheet_name=sheet_name_total, startrow=start_row, index=True)
    start_row += len(residuos_total) + 2
    porcentajes_total.to_excel(writer, sheet_name=sheet_name_total, startrow=start_row, index=True)
    
    # Guardar cálculo por TIPO_MET
    for tipo, data in tablas_por_tipo_met.items():
        sheet_name_tipo_met = f'TCR_{limpiar_nombre(str(tipo))}'
        data['tabla'].to_excel(writer, sheet_name=sheet_name_tipo_met, index=True)
        start_row = len(data['tabla']) + 2
        data['residuos_estandarizados'].to_excel(writer, sheet_name=sheet_name_tipo_met, startrow=start_row, index=True)
        start_row += len(data['residuos_estandarizados']) + 2
        data['porcentajes'].to_excel(writer, sheet_name=sheet_name_tipo_met, startrow=start_row, index=True)
        
        # Guardar cálculo por NOM_MET dentro de cada TIPO_MET
        for nom_met, nom_met_data in data.items():
            if isinstance(nom_met, str) and nom_met not in ['tabla', 'residuos_estandarizados', 'porcentajes']:
                sheet_name_nom_met = f'TCR_{limpiar_nombre(str(nom_met))}'
                nom_met_data['tabla'].to_excel(writer, sheet_name=sheet_name_nom_met, index=True)
                start_row = len(nom_met_data['tabla']) + 2
                nom_met_data['residuos_estandarizados'].to_excel(writer, sheet_name=sheet_name_nom_met, startrow=start_row, index=True)
                start_row += len(nom_met_data['residuos_estandarizados']) + 2
                nom_met_data['porcentajes'].to_excel(writer, sheet_name=sheet_name_nom_met, startrow=start_row, index=True)

print(f"Las tablas de contingencia, residuos estandarizados y porcentajes se han exportado a {output_file}")

Las tablas de contingencia, residuos estandarizados y porcentajes se han exportado a C:\Users\ADMIN\Desktop\tabla_contingencia_y_residuos_combinados.xlsx
