In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import warnings
warnings.filterwarnings('ignore')

# Configuraci√≥n visual mejorada
plt.style.use('seaborn-v0_8')
sns.set_palette("Set2")
plt.rcParams['figure.facecolor'] = 'white'
plt.rcParams['axes.facecolor'] = 'white'

print("üìä AN√ÅLISIS DE OCUPACI√ìN EDUCATIVA - SOLICITUDES VS CAPACIDAD")
print("="*65)


üìä AN√ÅLISIS DE OCUPACI√ìN EDUCATIVA - SOLICITUDES VS CAPACIDAD


In [2]:
# === CARGA DE DATOS ===
def load_education_data():
    """Carga solo los datasets educativos necesarios"""
    data = {}

    # Datos educativos principales
    files = {
        'education': '../downloads/normalizacion/education.csv',
        'admissions': '../downloads/normalizacion/education_admition.csv',
        'enrollment': '../downloads/normalizacion/education_enrollment.csv',
        'edu_municipality': '../downloads/normalizacion/education_municipality.csv',
        'municipality': '../downloads/normalizacion/municipality.csv'
    }

    for name, path in files.items():
        delimiter = ';' if 'education' in path and 'municipality' not in path else ','
        data[name] = pd.read_csv(path, delimiter=delimiter)
        # Convertir IDs a string para consistencia
        if 'id' in data[name].columns:
            data[name]['id'] = data[name]['id'].astype(str)
        if 'id_education' in data[name].columns:
            data[name]['id_education'] = data[name]['id_education'].astype(str)
        if 'id_municipality' in data[name].columns:
            data[name]['id_municipality'] = data[name]['id_municipality'].astype(str)

    return data

data = load_education_data()
print(f"‚úÖ Datos educativos cargados:")
for key, df in data.items():
    print(f"   ‚Ä¢ {key}: {len(df):,} registros")


‚úÖ Datos educativos cargados:
   ‚Ä¢ education: 1,978 registros
   ‚Ä¢ admissions: 39,297 registros
   ‚Ä¢ enrollment: 24,159 registros
   ‚Ä¢ edu_municipality: 2,780 registros
   ‚Ä¢ municipality: 179 registros


In [3]:
# === CONFIGURACI√ìN DE CICLOS EDUCATIVOS ===
def get_cycle_config():
    """Configuraci√≥n de ciclos con a√±os de permanencia"""
    return {
        'infantil_i_ciclo': {
            'name': 'Infantil I',
            'a√±os_permanencia': 3  # 0-2 a√±os
        },
        'infantil_ii_ciclo': {
            'name': 'Infantil II',
            'a√±os_permanencia': 3  # 3-5 a√±os
        },
        'primaria': {
            'name': 'Primaria',
            'a√±os_permanencia': 6  # 6-11 a√±os
        },
        'eso': {
            'name': 'ESO',
            'a√±os_permanencia': 4  # 12-15 a√±os
        }
    }

cycle_config = get_cycle_config()
print("üìö Configuraci√≥n de ciclos educativos:")
for cycle, config in cycle_config.items():
    print(f"   ‚Ä¢ {config['name']}: {config['a√±os_permanencia']} a√±os de permanencia")


üìö Configuraci√≥n de ciclos educativos:
   ‚Ä¢ Infantil I: 3 a√±os de permanencia
   ‚Ä¢ Infantil II: 3 a√±os de permanencia
   ‚Ä¢ Primaria: 6 a√±os de permanencia
   ‚Ä¢ ESO: 4 a√±os de permanencia


In [4]:
# === AN√ÅLISIS DE OCUPACI√ìN POR CENTRO EDUCATIVO ===
def analyze_center_occupancy(data, cycle_config):
    """Analiza ocupaci√≥n de centros: solicitudes vs capacidad estimada"""

    target_year = "2022-2023"  # A√±o para comparaci√≥n de ocupaci√≥n actual

    # FILTRO INICIAL: Solo trabajar con los ciclos espec√≠ficos
    valid_cycles = ['infantil_i_ciclo', 'infantil_ii_ciclo', 'primaria', 'eso']

    # Para admisiones, usar TODOS los a√±os disponibles para encontrar el m√°ximo
    admissions = data['admissions'].copy()
    # Filtrar solo los ciclos v√°lidos
    admissions = admissions[admissions['cycle'].isin(valid_cycles)]

    # Para matr√≠cula, usar TODOS los a√±os disponibles para encontrar el m√°ximo
    enrollment = data['enrollment'].copy()
    # Filtrar solo los ciclos v√°lidos
    enrollment = enrollment[enrollment['cycle'].isin(valid_cycles)]

    print(f"üéØ Analizando ocupaci√≥n actual para a√±o: {target_year}")
    print(f"   ‚Ä¢ Ciclos incluidos: {valid_cycles}")
    print(f"   ‚Ä¢ Registros de admisiones (filtrados): {len(admissions):,}")
    print(f"   ‚Ä¢ Registros de matr√≠cula (filtrados): {len(enrollment):,}")
    print(f"   ‚Ä¢ A√±os disponibles: {sorted(set(enrollment['year'].unique()) | set(admissions['year'].unique()))}")

    # FILTRO PREVIO: Solo analizar centros que tienen datos en los ciclos v√°lidos
    centros_con_ciclos_validos = set()

    # Identificar centros que tienen datos de matr√≠cula en ciclos v√°lidos
    centros_enrollment = enrollment['id_education'].unique()
    centros_con_ciclos_validos.update(centros_enrollment)

    # Identificar centros que tienen datos de admisiones en ciclos v√°lidos
    centros_admissions = admissions['id_education'].unique()
    centros_con_ciclos_validos.update(centros_admissions)

    print(f"   ‚Ä¢ Centros con datos en ciclos v√°lidos: {len(centros_con_ciclos_validos)}")

    # An√°lisis por centro educativo
    center_analysis = []

    for center_id in centros_con_ciclos_validos:  # Solo analizar centros relevantes
        center_info = data['education'][data['education']['id'] == center_id]
        if center_info.empty:
            continue  # Saltar si no existe informaci√≥n del centro

        center_info = center_info.iloc[0]
        center_data = {
            'id_education': center_id,
            'center_name': center_info['name_short'],
            'center_type': center_info.get('description_short', 'No especificado')
        }

        # Variables para totales del centro
        total_plazas_estimadas = 0
        total_max_matriculados = 0
        total_matriculados_a√±o_objetivo = 0
        total_solicitudes_presentadas = 0
        total_solicitudes_admitidas = 0
        ciclos_activos = 0

        # Analizar cada ciclo (solo los v√°lidos)
        for cycle in valid_cycles:
            config = cycle_config[cycle]

            # y luego tomar el m√°ximo

            # Obtener datos de matr√≠cula para este ciclo en todos los a√±os
            cycle_enrollment_all_years = enrollment[
                (enrollment['id_education'] == center_id) &
                (enrollment['cycle'] == cycle)
            ]

            # Obtener datos de admisiones para este ciclo en todos los a√±os
            cycle_admissions_all_years = admissions[
                (admissions['id_education'] == center_id) &
                (admissions['cycle'] == cycle) &
                (admissions['type_solicitude'] == 'Admitidas')
            ]

            # Calcular plazas estimadas por a√±o: (matriculados + admitidos) √∑ a√±os_permanencia
            plazas_por_a√±o = {}

            # Obtener todos los a√±os que tienen datos
            a√±os_matricula = set(cycle_enrollment_all_years['year'].unique())
            a√±os_admisiones = set(cycle_admissions_all_years['year'].unique())
            todos_los_a√±os = a√±os_matricula | a√±os_admisiones

            for a√±o in todos_los_a√±os:
                # Matriculados en este a√±o
                matriculados_a√±o = cycle_enrollment_all_years[
                    cycle_enrollment_all_years['year'] == a√±o
                ]['total'].sum()

                # Admitidos en este a√±o
                admitidos_a√±o = cycle_admissions_all_years[
                    cycle_admissions_all_years['year'] == a√±o
                ]['total'].sum()

                # Plazas estimadas para este a√±o
                if matriculados_a√±o > 0 or admitidos_a√±o > 0:
                    plazas_a√±o = matriculados_a√±o / config['a√±os_permanencia']
                    plazas_por_a√±o[a√±o] = {
                        'matriculados': matriculados_a√±o,
                        'admitidos': admitidos_a√±o,
                        'total_estudiantes': matriculados_a√±o,
                        'plazas_estimadas': plazas_a√±o
                    }

            # Tomar el M√ÅXIMO de plazas estimadas entre todos los a√±os
            if plazas_por_a√±o:
                a√±o_max_plazas = max(plazas_por_a√±o.keys(), key=lambda x: plazas_por_a√±o[x]['plazas_estimadas'])
                max_plazas_data = plazas_por_a√±o[a√±o_max_plazas]

                plazas_estimadas = max_plazas_data['plazas_estimadas']
                max_matriculados = max_plazas_data['matriculados']
                max_admitidos = max_plazas_data['admitidos']
                max_total_estudiantes = max_plazas_data['total_estudiantes']
                a√±o_max = a√±o_max_plazas
            else:
                plazas_estimadas = 0
                max_matriculados = 0
                max_admitidos = 0
                max_total_estudiantes = 0
                a√±o_max = 'N/A'

            # Datos del a√±o objetivo para comparaci√≥n de ocupaci√≥n actual
            cycle_enrollment_target = enrollment[
                (enrollment['id_education'] == center_id) &
                (enrollment['cycle'] == cycle) &
                (enrollment['year'] == target_year)
            ]
            matriculados_a√±o_objetivo = cycle_enrollment_target['total'].sum()

            # Solicitudes presentadas del a√±o objetivo
            cycle_admissions_target = admissions[
                (admissions['id_education'] == center_id) &
                (admissions['cycle'] == cycle) &
                (admissions['year'] == target_year)
            ]

            solicitudes_presentadas = cycle_admissions_target[
                cycle_admissions_target['type_solicitude'] == 'Presentadas'
            ]['total'].sum()
            solicitudes_admitidas = cycle_admissions_target[
                cycle_admissions_target['type_solicitude'] == 'Admitidas'
            ]['total'].sum()

            if cycle == 'primaria':
                # Verificar si el centro tambi√©n ofrece infantil II (usar m√°ximo tambi√©n)
                infantil_ii_enrollment_all = enrollment[
                    (enrollment['id_education'] == center_id) &
                    (enrollment['cycle'] == 'infantil_ii_ciclo')
                ]

                infantil_ii_admissions_all = admissions[
                    (admissions['id_education'] == center_id) &
                    (admissions['cycle'] == 'infantil_ii_ciclo') &
                    (admissions['type_solicitude'] == 'Admitidas')
                ]

                if not infantil_ii_enrollment_all.empty or not infantil_ii_admissions_all.empty:
                    # Calcular el m√°ximo de infantil II usando la misma l√≥gica
                    plazas_infantil_por_a√±o = {}
                    a√±os_inf_matricula = set(infantil_ii_enrollment_all['year'].unique())
                    a√±os_inf_admisiones = set(infantil_ii_admissions_all['year'].unique())
                    todos_a√±os_inf = a√±os_inf_matricula | a√±os_inf_admisiones

                    for a√±o in todos_a√±os_inf:
                        mat_inf = infantil_ii_enrollment_all[
                            infantil_ii_enrollment_all['year'] == a√±o
                        ]['total'].sum()

                        adm_inf = infantil_ii_admissions_all[
                            infantil_ii_admissions_all['year'] == a√±o
                        ]['total'].sum()

                        if mat_inf > 0 or adm_inf > 0:
                            plazas_inf_a√±o = (mat_inf + adm_inf) / cycle_config['infantil_ii_ciclo']['a√±os_permanencia']
                            plazas_infantil_por_a√±o[a√±o] = plazas_inf_a√±o

                    if plazas_infantil_por_a√±o:
                        max_plazas_infantil = max(plazas_infantil_por_a√±o.values())
                        # Transiciones autom√°ticas basadas en el m√°ximo de plazas de infantil II
                        transiciones_automaticas = max_plazas_infantil
                    else:
                        transiciones_automaticas = 0

                    # SOLICITUDES ADMITIDAS CORREGIDAS = Admisiones + Transiciones autom√°ticas
                    solicitudes_admitidas_corregidas = solicitudes_admitidas + transiciones_automaticas
                    center_data[f'{cycle}_transiciones_infantil'] = transiciones_automaticas
                    center_data[f'{cycle}_max_plazas_infantil_ii'] = max_plazas_infantil if plazas_infantil_por_a√±o else 0
                else:
                    solicitudes_admitidas_corregidas = solicitudes_admitidas
                    center_data[f'{cycle}_transiciones_infantil'] = 0
                    center_data[f'{cycle}_max_plazas_infantil_ii'] = 0
            else:
                solicitudes_admitidas_corregidas = solicitudes_admitidas
                center_data[f'{cycle}_transiciones_infantil'] = 0

            # Tasa de ocupaci√≥n: matriculados actuales / m√°ximo hist√≥rico matriculados
            tasa_ocupacion_ciclo = (matriculados_a√±o_objetivo / max_matriculados) if max_matriculados > 0 else 0

            # Ratio demanda: solicitudes presentadas / plazas estimadas
            ratio_demanda_ciclo = (solicitudes_presentadas / plazas_estimadas) if plazas_estimadas > 0 else 0

            # Ratio admisi√≥n vs capacidad: solicitudes admitidas / plazas estimadas
            ratio_admision_vs_capacidad = (solicitudes_admitidas_corregidas / plazas_estimadas) if plazas_estimadas > 0 else 0

            # Para primaria, excluir las transiciones autom√°ticas del c√°lculo de eficiencia
            eficiencia_admision = (solicitudes_admitidas / solicitudes_presentadas) if solicitudes_presentadas > 0 else 0

            # Guardar m√©tricas del ciclo
            center_data.update({
                f'{cycle}_max_matriculados': max_matriculados,
                f'{cycle}_max_admitidos': max_admitidos,
                f'{cycle}_max_total_estudiantes': max_total_estudiantes,
                f'{cycle}_a√±o_max': a√±o_max,
                f'{cycle}_matriculados_objetivo': matriculados_a√±o_objetivo,
                f'{cycle}_plazas_estimadas': plazas_estimadas,
                f'{cycle}_solicitudes_presentadas': solicitudes_presentadas,
                f'{cycle}_solicitudes_admitidas': solicitudes_admitidas,
                f'{cycle}_solicitudes_admitidas_corregidas': solicitudes_admitidas_corregidas,
                f'{cycle}_tasa_ocupacion': tasa_ocupacion_ciclo,
                f'{cycle}_ratio_demanda': ratio_demanda_ciclo,
                f'{cycle}_ratio_admision_capacidad': ratio_admision_vs_capacidad,
                f'{cycle}_eficiencia_admision': eficiencia_admision,
                f'{cycle}_activo': 1 if plazas_estimadas > 0 or solicitudes_presentadas > 0 else 0
            })

            # Acumular totales si el ciclo est√° activo
            if plazas_estimadas > 0 or solicitudes_presentadas > 0:
                ciclos_activos += 1
                total_plazas_estimadas += plazas_estimadas
                total_max_matriculados += max_matriculados
                total_matriculados_a√±o_objetivo += matriculados_a√±o_objetivo
                total_solicitudes_presentadas += solicitudes_presentadas
                total_solicitudes_admitidas += solicitudes_admitidas_corregidas

        # Solo incluir centros que tienen al menos un ciclo activo
        if ciclos_activos > 0:
            # Calcular eficiencia de admisi√≥n del centro usando solo solicitudes reales
            total_solicitudes_admitidas_reales = 0
            for cycle in valid_cycles:
                if center_data.get(f'{cycle}_activo', 0) == 1:
                    # Para la eficiencia del centro, usar solo solicitudes admitidas reales (sin transiciones)
                    total_solicitudes_admitidas_reales += center_data[f'{cycle}_solicitudes_admitidas']

            # M√©tricas agregadas del centro
            center_data.update({
                'ciclos_activos': ciclos_activos,
                'total_plazas_estimadas': total_plazas_estimadas,
                'total_matriculados': total_matriculados_a√±o_objetivo,
                'total_max_matriculados': total_max_matriculados,
                'total_solicitudes_presentadas': total_solicitudes_presentadas,
                'total_solicitudes_admitidas': total_solicitudes_admitidas,
                'total_solicitudes_admitidas_reales': total_solicitudes_admitidas_reales,
                'tasa_ocupacion_centro': (total_matriculados_a√±o_objetivo / total_max_matriculados) if total_max_matriculados > 0 else 0,
                'ratio_demanda_centro': (total_solicitudes_presentadas / total_plazas_estimadas) if total_plazas_estimadas > 0 else 0,
                'ratio_admision_capacidad_centro': (total_solicitudes_admitidas / total_plazas_estimadas) if total_plazas_estimadas > 0 else 0,
                'eficiencia_admision_centro': (total_solicitudes_admitidas_reales / total_solicitudes_presentadas) if total_solicitudes_presentadas > 0 else 0
            })

            center_analysis.append(center_data)

    return pd.DataFrame(center_analysis)

# Ejecutar an√°lisis
centers_df = analyze_center_occupancy(data, cycle_config)
centers_activos = centers_df[centers_df['ciclos_activos'] > 0]  # Solo centros con actividad
print(f"‚úÖ An√°lisis completado para {len(centers_activos)} centros educativos activos")


üéØ Analizando ocupaci√≥n actual para a√±o: 2022-2023
   ‚Ä¢ Ciclos incluidos: ['infantil_i_ciclo', 'infantil_ii_ciclo', 'primaria', 'eso']
   ‚Ä¢ Registros de admisiones (filtrados): 34,956
   ‚Ä¢ Registros de matr√≠cula (filtrados): 12,026
   ‚Ä¢ A√±os disponibles: ['2020-2021', '2021-2022', '2022-2023', '2023-2024', '2024-2025']
   ‚Ä¢ Centros con datos en ciclos v√°lidos: 1465
‚úÖ An√°lisis completado para 1464 centros educativos activos


In [5]:
# === ESTAD√çSTICAS GENERALES DE OCUPACI√ìN ===
print("üìä ESTAD√çSTICAS DE OCUPACI√ìN - SOLICITUDES VS CAPACIDAD")
print("="*65)

# Estad√≠sticas principales
stats_ocupacion = pd.DataFrame({
    'M√©trica': [
        'Centros Educativos Activos',
        'Total Plazas Estimadas',
        'Total Estudiantes Matriculados',
        'Total Estudiantes Max Matriculados',
        'Total Solicitudes Presentadas',
        'Total Solicitudes Admitidas',
        'Tasa Ocupaci√≥n Promedio (%)',
        'Ratio Demanda/Capacidad Promedio',
        'Ratio Admisi√≥n/Capacidad Promedio',
        'Eficiencia Admisi√≥n Promedio (%)',
        'Centros Sobredemandados (>1.5x)',
        'Centros Subocupados (<50%)'
    ],
    'Valor': [
        len(centers_activos),
        centers_activos['total_plazas_estimadas'].sum(),
        centers_activos['total_matriculados'].sum(),
        centers_activos['total_max_matriculados'].sum(),
        centers_activos['total_solicitudes_presentadas'].sum(),
        centers_activos['total_solicitudes_admitidas'].sum(),
        centers_activos['tasa_ocupacion_centro'].mean() * 100,
        centers_activos['ratio_demanda_centro'].mean(),
        centers_activos['ratio_admision_capacidad_centro'].mean(),
        centers_activos['eficiencia_admision_centro'].mean() * 100,
        (centers_activos['ratio_demanda_centro'] > 1.5).sum(),
        (centers_activos['tasa_ocupacion_centro'] < 0.5).sum()
    ]
})

display(stats_ocupacion.round(2))


üìä ESTAD√çSTICAS DE OCUPACI√ìN - SOLICITUDES VS CAPACIDAD


Unnamed: 0,M√©trica,Valor
0,Centros Educativos Activos,1464.0
1,Total Plazas Estimadas,131610.08
2,Total Estudiantes Matriculados,516659.0
3,Total Estudiantes Max Matriculados,560364.0
4,Total Solicitudes Presentadas,123055.0
5,Total Solicitudes Admitidas,140266.33
6,Tasa Ocupaci√≥n Promedio (%),91.53
7,Ratio Demanda/Capacidad Promedio,1.32
8,Ratio Admisi√≥n/Capacidad Promedio,1.34
9,Eficiencia Admisi√≥n Promedio (%),80.02


In [6]:
# === CENTROS CON MAYOR PRESI√ìN DE DEMANDA ===
print("\nüî• CENTROS CON MAYOR PRESI√ìN DE DEMANDA (Top 15)")
print("Ratio Demanda/Capacidad m√°s alto")
print("="*70)

top_demanda = centers_activos.nlargest(15, 'ratio_demanda_centro')[
    ['center_name', 'ciclos_activos', 'total_solicitudes_presentadas', 'total_plazas_estimadas',
     'ratio_demanda_centro', 'eficiencia_admision_centro']
].copy()

top_demanda.columns = ['Centro', 'Ciclos', 'Solicitudes', 'Plazas Est.', 'Ratio Demanda', 'Eficiencia %']
top_demanda['Ratio Demanda'] = top_demanda['Ratio Demanda'].round(2)
top_demanda['Eficiencia %'] = (top_demanda['Eficiencia %'] * 100).round(1)

display(top_demanda)



üî• CENTROS CON MAYOR PRESI√ìN DE DEMANDA (Top 15)
Ratio Demanda/Capacidad m√°s alto


Unnamed: 0,Centro,Ciclos,Solicitudes,Plazas Est.,Ratio Demanda,Eficiencia %
808,El Tren de la Fresa,1,474,38.333333,12.37,25.3
24,El Pilar,1,385,38.333333,10.04,29.9
1190,Rosa,1,223,24.0,9.29,30.5
162,Vallehermoso,1,224,29.333333,7.64,35.3
538,Puerta del √Ångel,1,279,38.0,7.34,40.5
206,Arcoiris,1,274,38.333333,7.15,40.9
255,Rayuela,1,400,61.0,6.56,44.5
629,Rocio Durcal,1,387,59.666667,6.49,47.0
441,Shantala,1,247,38.333333,6.44,50.2
347,La Marazuela,1,162,25.333333,6.39,42.0


In [7]:
# === CENTROS CON MAYOR OCUPACI√ìN ===
print("\nüìà CENTROS CON MAYOR OCUPACI√ìN (Top 15)")
print("Tasa de ocupaci√≥n m√°s alta")
print("="*70)

top_ocupacion = centers_activos.nlargest(15, 'tasa_ocupacion_centro')[
    ['center_name', 'ciclos_activos', 'total_matriculados', 'total_max_matriculados', 'total_plazas_estimadas',
     'tasa_ocupacion_centro', 'ratio_demanda_centro']
].copy()

top_ocupacion.columns = ['Centro', 'Ciclos', 'Matriculados', 'Total Max Matriculados', 'Plazas Est.', 'Ocupaci√≥n %', 'Ratio Demanda']
top_ocupacion['Ocupaci√≥n %'] = (top_ocupacion['Ocupaci√≥n %'] * 100).round(1)
top_ocupacion['Ratio Demanda'] = top_ocupacion['Ratio Demanda'].round(2)

display(top_ocupacion)



üìà CENTROS CON MAYOR OCUPACI√ìN (Top 15)
Tasa de ocupaci√≥n m√°s alta


Unnamed: 0,Centro,Ciclos,Matriculados,Total Max Matriculados,Plazas Est.,Ocupaci√≥n %,Ratio Demanda
15,Jimena Menendez Pidal,1,639,639,159.75,100.0,1.17
45,Victoria Kent,1,387,387,96.75,100.0,1.05
72,Isaac Alb√©niz,2,178,178,37.666667,100.0,0.53
83,Pippi Langstrump,1,116,116,38.666667,100.0,5.92
88,El Cervatillo Dormil√≥n,1,12,12,4.0,100.0,3.25
97,El Tr√©bol,1,52,52,17.333333,100.0,3.23
125,Miguel Delibes,1,545,545,136.25,100.0,1.01
128,Mariano Jos√© de Larra,1,579,579,144.75,100.0,1.49
131,Humanes,1,605,605,151.25,100.0,0.94
132,Miguel Hern√°ndez,1,418,418,104.5,100.0,0.69


In [8]:
# === AN√ÅLISIS POR CICLOS EDUCATIVOS ===
print("\nüìö AN√ÅLISIS POR CICLOS - OCUPACI√ìN Y DEMANDA")
print("="*55)

cycle_summary = []
for cycle, config in cycle_config.items():
    # Centros que ofrecen este ciclo
    cycle_centros = centers_activos[centers_activos[f'{cycle}_activo'] == 1]

    if len(cycle_centros) > 0:
        # M√©tricas agregadas del ciclo usando columnas corregidas
        total_max_matriculados = cycle_centros[f'{cycle}_max_matriculados'].sum()
        total_matriculados_objetivo = cycle_centros[f'{cycle}_matriculados_objetivo'].sum()
        total_plazas = cycle_centros[f'{cycle}_plazas_estimadas'].sum()
        total_solicitudes = cycle_centros[f'{cycle}_solicitudes_presentadas'].sum()
        total_admitidas = cycle_centros[f'{cycle}_solicitudes_admitidas_corregidas'].sum()

        # Transiciones para primaria
        total_transiciones = 0
        if cycle == 'primaria':
            total_transiciones = cycle_centros[f'{cycle}_transiciones_infantil'].sum()

        # Calcular promedios
        tasa_ocupacion_promedio = cycle_centros[f'{cycle}_tasa_ocupacion'].mean()
        ratio_demanda_promedio = cycle_centros[f'{cycle}_ratio_demanda'].mean()
        ratio_admision_promedio = cycle_centros[f'{cycle}_ratio_admision_capacidad'].mean()
        eficiencia_promedio = cycle_centros[f'{cycle}_eficiencia_admision'].mean()

        cycle_summary.append({
            'Ciclo': config['name'],
            'Centros': len(cycle_centros),
            'Max Matriculados': total_max_matriculados,
            'Matriculados 2022-23': total_matriculados_objetivo,
            'Plazas Est.': total_plazas,
            'Solicitudes': total_solicitudes,
            'Admitidas': total_admitidas,
            'Transiciones': total_transiciones,
            'Ocupaci√≥n %': tasa_ocupacion_promedio * 100,
            'Ratio Demanda': ratio_demanda_promedio,
            'Ratio Admisi√≥n': ratio_admision_promedio,
            'Eficiencia %': eficiencia_promedio * 100
        })

cycle_summary_df = pd.DataFrame(cycle_summary)
display(cycle_summary_df.round(1))



üìö AN√ÅLISIS POR CICLOS - OCUPACI√ìN Y DEMANDA


Unnamed: 0,Ciclo,Centros,Max Matriculados,Matriculados 2022-23,Plazas Est.,Solicitudes,Admitidas,Transiciones,Ocupaci√≥n %,Ratio Demanda,Ratio Admisi√≥n,Eficiencia %
0,Infantil I,426,35749,31332,11916.3,41750,30406.0,0.0,82.8,3.3,2.4,70.3
1,Infantil II,827,107083,94437,35694.3,30363,26641.0,0.0,87.5,0.8,0.7,89.5
2,Primaria,811,244603,229423,40767.2,8758,49844.3,46132.3,93.4,0.2,1.2,51.0
3,ESO,352,172929,161467,43232.2,42184,33375.0,0.0,90.7,0.9,0.7,76.4


In [9]:
# === EJEMPLOS DE C√ÅLCULO DE PLAZAS ESTIMADAS ===
print("\nüîç EJEMPLOS DE C√ÅLCULO DE PLAZAS ESTIMADAS (Top 5 por plazas)")
print("Usando m√°ximo de (matriculados + admitidos) √∑ a√±os entre todos los a√±os")
print("="*80)

# Seleccionar los 5 centros con m√°s plazas estimadas para mostrar ejemplos
top_capacity_centers = centers_activos.nlargest(5, 'total_plazas_estimadas')

ejemplos_calculo = []
for _, center in top_capacity_centers.iterrows():
    center_ejemplo = {
        'Centro': center['center_name'],
        'Total Plazas Est.': center['total_plazas_estimadas']
    }

    # Mostrar c√°lculo para cada ciclo activo
    detalles_ciclos = []
    for cycle, config in cycle_config.items():
        if center[f'{cycle}_activo'] == 1:
            max_mat = center[f'{cycle}_max_matriculados']
            max_adm = center[f'{cycle}_max_admitidos']
            max_total = center[f'{cycle}_max_total_estudiantes']
            a√±o_max = center[f'{cycle}_a√±o_max']
            plazas = center[f'{cycle}_plazas_estimadas']
            a√±os_perm = config['a√±os_permanencia']

            detalle = f"{config['name']}: ({max_mat} mat. + {max_adm} adm.) = {max_total} ({a√±o_max}) √∑ {a√±os_perm} a√±os = {plazas:.1f} plazas"
            detalles_ciclos.append(detalle)

    center_ejemplo['C√°lculo Detallado'] = ' | '.join(detalles_ciclos)
    ejemplos_calculo.append(center_ejemplo)

ejemplos_df = pd.DataFrame(ejemplos_calculo)
for _, ejemplo in ejemplos_df.iterrows():
    print(f"\nüè´ {ejemplo['Centro']}")
    print(f"   Total Plazas Estimadas: {ejemplo['Total Plazas Est.']:.1f}")
    print(f"   C√°lculo: {ejemplo['C√°lculo Detallado']}")



üîç EJEMPLOS DE C√ÅLCULO DE PLAZAS ESTIMADAS (Top 5 por plazas)
Usando m√°ximo de (matriculados + admitidos) √∑ a√±os entre todos los a√±os

üè´ Joaqu√≠n Costa
   Total Plazas Estimadas: 294.0
   C√°lculo: Infantil II: (435 mat. + 151 adm.) = 435 (2021-2022) √∑ 3 a√±os = 145.0 plazas | Primaria: (894 mat. + 1 adm.) = 894 (2020-2021) √∑ 6 a√±os = 149.0 plazas

üè´ La Luna
   Total Plazas Estimadas: 277.0
   C√°lculo: Infantil II: (275 mat. + 75 adm.) = 275 (2020-2021) √∑ 3 a√±os = 91.7 plazas | Primaria: (491 mat. + 0 adm.) = 491 (2024-2025) √∑ 6 a√±os = 81.8 plazas | ESO: (414 mat. + 49 adm.) = 414 (2024-2025) √∑ 4 a√±os = 103.5 plazas

üè´ El Espinillo
   Total Plazas Estimadas: 263.8
   C√°lculo: ESO: (1055 mat. + 191 adm.) = 1055 (2023-2024) √∑ 4 a√±os = 263.8 plazas

üè´ Maestro Rodrigo
   Total Plazas Estimadas: 262.1
   C√°lculo: Infantil II: (230 mat. + 75 adm.) = 230 (2020-2021) √∑ 3 a√±os = 76.7 plazas | Primaria: (562 mat. + 5 adm.) = 562 (2024-2025) √∑ 6 a√±os = 93.7 p

In [10]:
# === CENTROS CON CORRECCI√ìN DE PRIMARIA ===
print("\nüîÑ CENTROS CON TRANSICIONES AUTOM√ÅTICAS INFANTIL II ‚Üí PRIMARIA")
print("="*65)

centros_con_transiciones = centers_activos[
    centers_activos['primaria_transiciones_infantil'] > 0
].copy()

if len(centros_con_transiciones) > 0:
    transiciones_detalle = centros_con_transiciones[
        ['center_name', 'primaria_matriculados_objetivo', 'primaria_solicitudes_admitidas',
         'primaria_transiciones_infantil', 'primaria_solicitudes_admitidas_corregidas']
    ].copy()

    transiciones_detalle.columns = [
        'Centro', 'Matriculados Primaria', 'Admisiones Solicitudes',
        'Transiciones Infantil II', 'Total Admisiones Corregidas'
    ]

    # Mostrar los primeros 10
    display(transiciones_detalle.head(10).round(1))

    print(f"\nüìä Resumen de transiciones:")
    print(f"   ‚Ä¢ Centros con transiciones: {len(centros_con_transiciones)}")
    print(f"   ‚Ä¢ Total transiciones autom√°ticas: {centros_con_transiciones['primaria_transiciones_infantil'].sum():.1f}")
    print(f"   ‚Ä¢ Promedio transiciones por centro: {centros_con_transiciones['primaria_transiciones_infantil'].mean():.1f}")
else:
    print("No se encontraron centros con transiciones autom√°ticas")



üîÑ CENTROS CON TRANSICIONES AUTOM√ÅTICAS INFANTIL II ‚Üí PRIMARIA


Unnamed: 0,Centro,Matriculados Primaria,Admisiones Solicitudes,Transiciones Infantil II,Total Admisiones Corregidas
3,Gabriela Mistral,273,2,65.3,67.3
4,CEIP San Sebasti√°n,226,4,60.3,64.3
5,Palomeras Bajas,300,6,66.0,72.0
7,Ntra. Sra. de Valvanera,292,3,63.0,66.0
10,D√°maso Alonso,152,8,33.3,41.3
11,El Vell√≥n,107,2,29.3,31.3
12,El Parque,398,4,83.0,87.0
14,P√≠o Baroja,301,5,55.7,60.7
17,Gonzalo de Berceo,322,4,58.0,62.0
18,Ram√≥n Linacero,239,2,39.7,41.7



üìä Resumen de transiciones:
   ‚Ä¢ Centros con transiciones: 826
   ‚Ä¢ Total transiciones autom√°ticas: 46527.7
   ‚Ä¢ Promedio transiciones por centro: 56.3


In [11]:
# === AN√ÅLISIS DE EFICIENCIA POR CENTRO ===
print("\n‚ö° AN√ÅLISIS DE EFICIENCIA - ADMISI√ìN VS CAPACIDAD")
print("="*60)

# Clasificar centros por eficiencia
def clasificar_eficiencia(ratio_admision):
    if ratio_admision >= 1.0:
        return "Sobrecapacidad"
    elif ratio_admision >= 0.8:
        return "Alta eficiencia"
    elif ratio_admision >= 0.5:
        return "Eficiencia media"
    else:
        return "Baja eficiencia"

centers_activos['clasificacion_eficiencia'] = centers_activos['ratio_admision_capacidad_centro'].apply(clasificar_eficiencia)

eficiencia_resumen = centers_activos['clasificacion_eficiencia'].value_counts()
eficiencia_porcentajes = (eficiencia_resumen / len(centers_activos) * 100).round(1)

eficiencia_stats = pd.DataFrame({
    'Clasificaci√≥n': eficiencia_resumen.index,
    'Centros': eficiencia_resumen.values,
    'Porcentaje': eficiencia_porcentajes.values
})

print("Distribuci√≥n de eficiencia de centros:")
display(eficiencia_stats)

print("\n‚úÖ AN√ÅLISIS DE OCUPACI√ìN EDUCATIVA COMPLETADO")
print("="*60)



‚ö° AN√ÅLISIS DE EFICIENCIA - ADMISI√ìN VS CAPACIDAD
Distribuci√≥n de eficiencia de centros:


Unnamed: 0,Clasificaci√≥n,Centros,Porcentaje
0,Sobrecapacidad,764,52.2
1,Alta eficiencia,448,30.6
2,Eficiencia media,220,15.0
3,Baja eficiencia,32,2.2



‚úÖ AN√ÅLISIS DE OCUPACI√ìN EDUCATIVA COMPLETADO


In [12]:
# === AN√ÅLISIS DE COBERTURA EDUCATIVA POR MUNICIPIO ===
print("\nüèõÔ∏è AN√ÅLISIS DE COBERTURA EDUCATIVA MUNICIPAL")
print("Validaci√≥n de capacidad vs necesidades demogr√°ficas")
print("="*70)

def load_demographic_data():
    """Carga datos demogr√°ficos para el an√°lisis de cobertura"""
    demographics = pd.read_csv('../downloads/normalizacion/municipality_demographics.csv')

    # Mapeo de rangos de edad a ciclos educativos
    age_to_cycle_mapping = {
        '0-4': ['infantil_i_ciclo', 'infantil_ii_ciclo'],  # 0-2 y 3-5
        '5-9': ['infantil_ii_ciclo', 'primaria'],         # 3-5 y 6-11
        '10-14': ['primaria', 'eso'],                      # 6-11 y 12-15
        '15-19': ['eso']                                   # 12-15
    }

    return demographics, age_to_cycle_mapping

def analyze_municipal_coverage(data, centers_df, cycle_config):
    """Analiza la cobertura educativa por municipio"""

    # Cargar datos demogr√°ficos
    demographics, age_mapping = load_demographic_data()

    # Obtener relaci√≥n centro-municipio
    edu_municipality = data['edu_municipality']
    municipalities = data['municipality']

    # Usar el a√±o m√°s reciente disponible para demograf√≠a
    latest_year = demographics['year'].max()
    demographics_latest = demographics[demographics['year'] == latest_year].copy()

    print(f"üìä Usando datos demogr√°ficos del a√±o: {latest_year}")
    print(f"   ‚Ä¢ Municipios con datos demogr√°ficos: {demographics_latest['id_secondary_municipality'].nunique()}")

    # An√°lisis por municipio
    municipal_analysis = []

    # Obtener municipios √∫nicos que tienen centros educativos
    municipios_con_centros = edu_municipality['id_municipality'].unique()

    for municipality_id in municipios_con_centros:
        # Informaci√≥n del municipio
        muni_info = municipalities[municipalities['id'] == municipality_id]
        if muni_info.empty:
            continue

        muni_info = muni_info.iloc[0]
        muni_secondary_id = muni_info['id_secondary']

        # Obtener datos demogr√°ficos del municipio
        muni_demographics = demographics_latest[
            demographics_latest['id_secondary_municipality'] == muni_secondary_id
        ].copy()

        if muni_demographics.empty:
            continue  # Saltar municipios sin datos demogr√°ficos

        # Obtener centros educativos del municipio
        centros_municipio = edu_municipality[
            edu_municipality['id_municipality'] == municipality_id
        ]['id_education'].unique()

        # Filtrar centros activos en nuestro an√°lisis
        centros_activos_municipio = centers_df[
            centers_df['id_education'].isin(centros_municipio)
        ].copy()

        if centros_activos_municipio.empty:
            continue  # Saltar municipios sin centros activos

        # Inicializar datos del municipio
        municipal_data = {
            'id_municipality': municipality_id,
            'municipality_name': muni_info['name'],
            'total_centers': len(centros_activos_municipio),
            'total_population_0_19': 0
        }

        # Calcular poblaci√≥n total por grupos de edad relevantes
        for _, demo_row in muni_demographics.iterrows():
            age_range = demo_row['range']
            population = demo_row['total']

            if age_range in ['0-4', '5-9', '10-14', '15-19']:
                municipal_data['total_population_0_19'] += population
                municipal_data[f'population_{age_range}'] = population

        # An√°lisis por ciclo educativo
        for cycle in ['infantil_i_ciclo', 'infantil_ii_ciclo', 'primaria', 'eso']:
            config = cycle_config[cycle]

            # Sumar capacidad de todos los centros del municipio para este ciclo
            cycle_capacity = centros_activos_municipio[f'{cycle}_plazas_estimadas'].sum()
            cycle_max_matriculados = centros_activos_municipio[f'{cycle}_max_matriculados'].sum()
            cycle_solicitudes = centros_activos_municipio[f'{cycle}_solicitudes_presentadas'].sum()
            cycle_admitidos = centros_activos_municipio[f'{cycle}_solicitudes_admitidas_corregidas'].sum()

            # Centros que ofrecen este ciclo
            centros_con_ciclo = centros_activos_municipio[
                centros_activos_municipio[f'{cycle}_activo'] == 1
            ]
            num_centros_ciclo = len(centros_con_ciclo)

            municipal_data.update({
                f'{cycle}_capacity': cycle_capacity,
                f'{cycle}_max_matriculados': cycle_max_matriculados,
                f'{cycle}_solicitudes': cycle_solicitudes,
                f'{cycle}_admitidos': cycle_admitidos,
                f'{cycle}_num_centers': num_centros_ciclo,
                f'{cycle}_centers_names': ', '.join(centros_con_ciclo['center_name'].tolist()) if num_centros_ciclo > 0 else 'Ninguno'
            })

        # Calcular estimaciones de necesidad educativa por ciclo
        # Basado en poblaci√≥n por edad y a√±os de permanencia en cada ciclo

        # Infantil I (0-2 a√±os): aproximadamente 3/5 de la poblaci√≥n 0-4
        pop_0_4 = municipal_data.get('population_0-4', 0)
        estimated_need_infantil_i = (pop_0_4 * 3) / 5  # 3 a√±os de los 5 a√±os del rango 0-4

        # Infantil II (3-5 a√±os): aproximadamente 2/5 de la poblaci√≥n 0-4 + 1/5 de la poblaci√≥n 5-9
        pop_5_9 = municipal_data.get('population_5-9', 0)
        estimated_need_infantil_ii = (pop_0_4 * 2) / 5 + (pop_5_9 * 1) / 5

        # Primaria (6-11 a√±os): aproximadamente 4/5 de la poblaci√≥n 5-9 + 2/5 de la poblaci√≥n 10-14
        pop_10_14 = municipal_data.get('population_10-14', 0)
        estimated_need_primaria = (pop_5_9 * 4) / 5 + (pop_10_14 * 2) / 5

        # ESO (12-15 a√±os): aproximadamente 3/5 de la poblaci√≥n 10-14 + 1/5 de la poblaci√≥n 15-19
        pop_15_19 = municipal_data.get('population_15-19', 0)
        estimated_need_eso = (pop_10_14 * 3) / 5 + (pop_15_19 * 1) / 5

        # Guardar estimaciones de necesidad
        needs = {
            'infantil_i_ciclo': estimated_need_infantil_i,
            'infantil_ii_ciclo': estimated_need_infantil_ii,
            'primaria': estimated_need_primaria,
            'eso': estimated_need_eso
        }

        # Calcular indicadores de cobertura por ciclo
        total_estimated_need = 0
        total_capacity = 0
        cycles_with_need = 0
        cycles_covered = 0

        for cycle, estimated_need in needs.items():
            capacity = municipal_data[f'{cycle}_capacity']

            # Ratio de cobertura (capacidad / necesidad estimada)
            coverage_ratio = (capacity / estimated_need) if estimated_need > 0 else float('inf') if capacity > 0 else 0

            # ¬øEst√° cubierto este ciclo? (ratio >= 0.8, permitiendo 20% de margen)
            is_covered = coverage_ratio >= 0.8 if estimated_need > 0 else capacity > 0

            municipal_data.update({
                f'{cycle}_estimated_need': estimated_need,
                f'{cycle}_coverage_ratio': coverage_ratio,
                f'{cycle}_is_covered': is_covered,
                f'{cycle}_deficit': max(0, estimated_need - capacity)
            })

            if estimated_need > 0:
                cycles_with_need += 1
                total_estimated_need += estimated_need
                total_capacity += capacity
                if is_covered:
                    cycles_covered += 1

        # M√©tricas agregadas del municipio
        overall_coverage_ratio = (total_capacity / total_estimated_need) if total_estimated_need > 0 else 0
        coverage_percentage = (cycles_covered / cycles_with_need * 100) if cycles_with_need > 0 else 0

        municipal_data.update({
            'total_estimated_need': total_estimated_need,
            'total_capacity': total_capacity,
            'overall_coverage_ratio': overall_coverage_ratio,
            'cycles_with_need': cycles_with_need,
            'cycles_covered': cycles_covered,
            'coverage_percentage': coverage_percentage,
            'is_fully_covered': cycles_covered == cycles_with_need and cycles_with_need > 0,
            'total_deficit': max(0, total_estimated_need - total_capacity)
        })

        municipal_analysis.append(municipal_data)

    return pd.DataFrame(municipal_analysis)

# Ejecutar an√°lisis de cobertura municipal
print("‚è≥ Procesando an√°lisis de cobertura municipal...")
municipal_coverage_df = analyze_municipal_coverage(data, centers_df, cycle_config)

print(f"‚úÖ An√°lisis completado para {len(municipal_coverage_df)} municipios")
print(f"   ‚Ä¢ Municipios con cobertura completa: {municipal_coverage_df['is_fully_covered'].sum()}")
print(f"   ‚Ä¢ Municipios con d√©ficit: {(municipal_coverage_df['total_deficit'] > 0).sum()}")



üèõÔ∏è AN√ÅLISIS DE COBERTURA EDUCATIVA MUNICIPAL
Validaci√≥n de capacidad vs necesidades demogr√°ficas
‚è≥ Procesando an√°lisis de cobertura municipal...
üìä Usando datos demogr√°ficos del a√±o: 2024
   ‚Ä¢ Municipios con datos demogr√°ficos: 179
‚úÖ An√°lisis completado para 179 municipios
   ‚Ä¢ Municipios con cobertura completa: 25
   ‚Ä¢ Municipios con d√©ficit: 122


In [13]:
# === ESTAD√çSTICAS DE COBERTURA MUNICIPAL ===
print("\nüìà ESTAD√çSTICAS DE COBERTURA EDUCATIVA MUNICIPAL")
print("="*65)

# Estad√≠sticas generales
coverage_stats = pd.DataFrame({
    'M√©trica': [
        'Municipios Analizados',
        'Poblaci√≥n Total 0-19 a√±os',
        'Necesidad Educativa Estimada',
        'Capacidad Total Disponible',
        'Ratio Cobertura Promedio',
        'Municipios con Cobertura Completa',
        'Municipios con D√©ficit Educativo',
        'D√©ficit Total Estimado (plazas)',
        'Cobertura Promedio (%)',
        'Municipios sin Infantil I',
        'Municipios sin ESO'
    ],
    'Valor': [
        len(municipal_coverage_df),
        municipal_coverage_df['total_population_0_19'].sum(),
        municipal_coverage_df['total_estimated_need'].sum(),
        municipal_coverage_df['total_capacity'].sum(),
        municipal_coverage_df['overall_coverage_ratio'].mean(),
        municipal_coverage_df['is_fully_covered'].sum(),
        (municipal_coverage_df['total_deficit'] > 0).sum(),
        municipal_coverage_df['total_deficit'].sum(),
        municipal_coverage_df['coverage_percentage'].mean(),
        (municipal_coverage_df['infantil_i_ciclo_num_centers'] == 0).sum(),
        (municipal_coverage_df['eso_num_centers'] == 0).sum()
    ]
})

display(coverage_stats.round(2))



üìà ESTAD√çSTICAS DE COBERTURA EDUCATIVA MUNICIPAL


Unnamed: 0,M√©trica,Valor
0,Municipios Analizados,179.0
1,Poblaci√≥n Total 0-19 a√±os,1336662.0
2,Necesidad Educativa Estimada,1031788.4
3,Capacidad Total Disponible,151771.58
4,Ratio Cobertura Promedio,2.35
5,Municipios con Cobertura Completa,25.0
6,Municipios con D√©ficit Educativo,122.0
7,D√©ficit Total Estimado (plazas),890325.98
8,Cobertura Promedio (%),29.47
9,Municipios sin Infantil I,24.0


In [14]:
# === MUNICIPIOS CON MAYOR D√âFICIT EDUCATIVO ===
print("\nüö® MUNICIPIOS CON MAYOR D√âFICIT EDUCATIVO (Top 15)")
print("Necesidades no cubiertas por la capacidad actual")
print("="*70)

deficit_municipios = municipal_coverage_df[municipal_coverage_df['total_deficit'] > 0].copy()
top_deficit = deficit_municipios.nlargest(15, 'total_deficit')[
    ['municipality_name', 'total_population_0_19', 'total_estimated_need',
     'total_capacity', 'total_deficit', 'coverage_percentage', 'cycles_covered', 'cycles_with_need']
].copy()

top_deficit['deficit_percentage'] = (top_deficit['total_deficit'] / top_deficit['total_estimated_need'] * 100).round(1)

print("Columnas: Poblaci√≥n 0-19, Necesidad Estimada, Capacidad, D√©ficit, % Cobertura, Ciclos Cubiertos/Total")
display(top_deficit.round(1))



üö® MUNICIPIOS CON MAYOR D√âFICIT EDUCATIVO (Top 15)
Necesidades no cubiertas por la capacidad actual
Columnas: Poblaci√≥n 0-19, Necesidad Estimada, Capacidad, D√©ficit, % Cobertura, Ciclos Cubiertos/Total


Unnamed: 0,municipality_name,total_population_0_19,total_estimated_need,total_capacity,total_deficit,coverage_percentage,cycles_covered,cycles_with_need,deficit_percentage
168,Madrid,574787,446539.0,37720.2,408818.8,0.0,0,4,91.6
166,Getafe,38730,30583.6,5467.0,25116.6,0.0,0,4,82.1
170,M√≥stoles,39218,30706.0,5700.4,25005.6,0.0,0,4,81.4
155,Alcal√° de Henares,37603,28267.8,3317.7,24950.1,0.0,0,4,88.3
165,Fuenlabrada,36616,27528.8,5202.1,22326.7,0.0,0,4,81.1
167,Legan√©s,35846,27410.8,5343.8,22067.1,0.0,0,4,80.5
171,Parla,32389,25647.4,4931.7,20715.7,0.0,0,4,80.8
157,Alcorc√≥n,32215,24433.4,3761.3,20672.1,0.0,0,4,84.6
177,Torrej√≥n de Ardoz,29171,22810.2,3940.8,18869.4,0.0,0,4,82.7
156,Alcobendas,25756,19860.0,2479.3,17380.7,0.0,0,4,87.5


In [15]:
# === AN√ÅLISIS POR CICLO EDUCATIVO ===
print("\nüìö AN√ÅLISIS DE COBERTURA POR CICLO EDUCATIVO")
print("="*55)

cycles_analysis = []
for cycle in ['infantil_i_ciclo', 'infantil_ii_ciclo', 'primaria', 'eso']:
    config = cycle_config[cycle]

    # Municipios que tienen este ciclo
    municipios_con_ciclo = municipal_coverage_df[
        municipal_coverage_df[f'{cycle}_num_centers'] > 0
    ]

    # Estad√≠sticas del ciclo
    total_need = municipal_coverage_df[f'{cycle}_estimated_need'].sum()
    total_capacity = municipal_coverage_df[f'{cycle}_capacity'].sum()
    municipios_cubiertos = municipal_coverage_df[f'{cycle}_is_covered'].sum()
    deficit_total = municipal_coverage_df[f'{cycle}_deficit'].sum()

    cycles_analysis.append({
        'Ciclo': config['name'],
        'Municipios con Oferta': len(municipios_con_ciclo),
        'Necesidad Total': total_need,
        'Capacidad Total': total_capacity,
        'Municipios Cubiertos': municipios_cubiertos,
        'D√©ficit Total': deficit_total,
        'Ratio Cobertura': total_capacity / total_need if total_need > 0 else 0,
        '% Municipios Cubiertos': municipios_cubiertos / len(municipal_coverage_df) * 100
    })

cycles_df = pd.DataFrame(cycles_analysis)
display(cycles_df.round(2))



üìö AN√ÅLISIS DE COBERTURA POR CICLO EDUCATIVO


Unnamed: 0,Ciclo,Municipios con Oferta,Necesidad Total,Capacidad Total,Municipios Cubiertos,D√©ficit Total,Ratio Cobertura,% Municipios Cubiertos
0,Infantil I,155,158213.4,12819.67,28,145593.07,0.08,15.64
1,Infantil II,179,170823.0,38924.33,61,134105.2,0.23,34.08
2,Primaria,179,407447.2,44543.67,47,364598.43,0.11,26.26
3,ESO,179,295304.8,55517.25,75,248568.85,0.19,41.9


In [16]:
# === MUNICIPIOS SIN OFERTA EDUCATIVA POR CICLO ===
print("\n‚ùå MUNICIPIOS SIN OFERTA EDUCATIVA POR CICLO")
print("="*50)

for cycle in ['infantil_i_ciclo', 'infantil_ii_ciclo', 'primaria', 'eso']:
    config = cycle_config[cycle]

    municipios_sin_oferta = municipal_coverage_df[
        (municipal_coverage_df[f'{cycle}_num_centers'] == 0) &
        (municipal_coverage_df[f'{cycle}_estimated_need'] > 0)
    ].copy()

    if len(municipios_sin_oferta) > 0:
        print(f"\nüî¥ {config['name']} - {len(municipios_sin_oferta)} municipios sin oferta:")
        top_sin_oferta = municipios_sin_oferta.nlargest(10, f'{cycle}_estimated_need')[
            ['municipality_name', f'{cycle}_estimated_need', 'total_centers']
        ]
        print("   Top 10 por necesidad estimada:")
        for _, row in top_sin_oferta.iterrows():
            print(f"   ‚Ä¢ {row['municipality_name']}: {row[f'{cycle}_estimated_need']:.0f} estudiantes estimados, {row['total_centers']} centros totales")



‚ùå MUNICIPIOS SIN OFERTA EDUCATIVA POR CICLO

üî¥ Infantil I - 24 municipios sin oferta:
   Top 10 por necesidad estimada:
   ‚Ä¢ Moralzarzal: 298 estudiantes estimados, 3 centros totales
   ‚Ä¢ Morata de Taju√±a: 191 estudiantes estimados, 2 centros totales
   ‚Ä¢ Talamanca de Jarama: 117 estudiantes estimados, 1 centros totales
   ‚Ä¢ Valdetorres de Jarama: 107 estudiantes estimados, 1 centros totales
   ‚Ä¢ Quijorna: 94 estudiantes estimados, 4 centros totales
   ‚Ä¢ Valdilecha: 89 estudiantes estimados, 1 centros totales
   ‚Ä¢ Navas del Rey: 89 estudiantes estimados, 1 centros totales
   ‚Ä¢ Villaconejos: 83 estudiantes estimados, 3 centros totales
   ‚Ä¢ Pelayos de la Presa: 82 estudiantes estimados, 2 centros totales
   ‚Ä¢ Navacerrada: 69 estudiantes estimados, 3 centros totales


In [17]:
# === RESUMEN EJECUTIVO DE COBERTURA ===
print("\nüéØ RESUMEN EJECUTIVO - COBERTURA EDUCATIVA MUNICIPAL")
print("="*65)

# Clasificaci√≥n de municipios por nivel de cobertura
excelente = municipal_coverage_df[municipal_coverage_df['coverage_percentage'] >= 100]
buena = municipal_coverage_df[(municipal_coverage_df['coverage_percentage'] >= 75) & (municipal_coverage_df['coverage_percentage'] < 100)]
regular = municipal_coverage_df[(municipal_coverage_df['coverage_percentage'] >= 50) & (municipal_coverage_df['coverage_percentage'] < 75)]
deficiente = municipal_coverage_df[municipal_coverage_df['coverage_percentage'] < 50]

print(f"üìä CLASIFICACI√ìN POR NIVEL DE COBERTURA:")
print(f"   üü¢ Excelente (100%): {len(excelente)} municipios")
print(f"   üü° Buena (75-99%): {len(buena)} municipios")
print(f"   üü† Regular (50-74%): {len(regular)} municipios")
print(f"   üî¥ Deficiente (<50%): {len(deficiente)} municipios")

print(f"\nüéØ INDICADORES CLAVE:")
print(f"   ‚Ä¢ Cobertura promedio regional: {municipal_coverage_df['coverage_percentage'].mean():.1f}%")
print(f"   ‚Ä¢ Ratio capacidad/necesidad: {municipal_coverage_df['overall_coverage_ratio'].mean():.2f}")
print(f"   ‚Ä¢ D√©ficit educativo total: {municipal_coverage_df['total_deficit'].sum():.0f} plazas")
print(f"   ‚Ä¢ Poblaci√≥n estudiantil analizada: {municipal_coverage_df['total_population_0_19'].sum():.0f} personas")

# Municipios cr√≠ticos que requieren atenci√≥n inmediata
criticos = municipal_coverage_df[
    (municipal_coverage_df['coverage_percentage'] < 50) &
    (municipal_coverage_df['total_population_0_19'] > 100)
]

if len(criticos) > 0:
    print(f"\nüö® MUNICIPIOS CR√çTICOS (>100 hab. y <50% cobertura): {len(criticos)}")
    for _, municipio in criticos.head(5).iterrows():
        print(f"   ‚Ä¢ {municipio['municipality_name']}: {municipio['coverage_percentage']:.1f}% cobertura, {municipio['total_population_0_19']:.0f} hab. 0-19 a√±os")

print(f"\n‚úÖ An√°lisis de cobertura educativa municipal completado")
print(f"üí° Los municipios pueden usar estos datos para planificar expansi√≥n educativa")



üéØ RESUMEN EJECUTIVO - COBERTURA EDUCATIVA MUNICIPAL
üìä CLASIFICACI√ìN POR NIVEL DE COBERTURA:
   üü¢ Excelente (100%): 25 municipios
   üü° Buena (75-99%): 21 municipios
   üü† Regular (50-74%): 14 municipios
   üî¥ Deficiente (<50%): 119 municipios

üéØ INDICADORES CLAVE:
   ‚Ä¢ Cobertura promedio regional: 29.5%
   ‚Ä¢ Ratio capacidad/necesidad: 2.35
   ‚Ä¢ D√©ficit educativo total: 890326 plazas
   ‚Ä¢ Poblaci√≥n estudiantil analizada: 1336662 personas

üö® MUNICIPIOS CR√çTICOS (>100 hab. y <50% cobertura): 119
   ‚Ä¢ Zarzalejo: 25.0% cobertura, 397 hab. 0-19 a√±os
   ‚Ä¢ Torres de la Alameda: 0.0% cobertura, 1649 hab. 0-19 a√±os
   ‚Ä¢ Chinch√≥n: 0.0% cobertura, 1084 hab. 0-19 a√±os
   ‚Ä¢ Ciempozuelos: 0.0% cobertura, 5349 hab. 0-19 a√±os
   ‚Ä¢ Daganzo de Arriba: 0.0% cobertura, 2800 hab. 0-19 a√±os

‚úÖ An√°lisis de cobertura educativa municipal completado
üí° Los municipios pueden usar estos datos para planificar expansi√≥n educativa



# üìä DOCUMENTACI√ìN COMPLETA - AN√ÅLISIS EDUCATIVO MUNICIPAL

## üéØ **OBJETIVO DEL AN√ÅLISIS**
Este notebook realiza un an√°lisis integral de la capacidad educativa vs. las necesidades demogr√°ficas de los municipios, validando si los centros educativos asignados pueden cubrir la demanda poblacional por ciclos educativos.

---

## üìö **CONFIGURACI√ìN DE CICLOS EDUCATIVOS**

### Ciclos Analizados y Rangos de Edad:
| Ciclo | Edad | A√±os de Permanencia | Descripci√≥n |
|-------|------|-------------------|-------------|
| **Infantil I** | 0-2 a√±os | 3 a√±os | Educaci√≥n inicial temprana |
| **Infantil II** | 3-5 a√±os | 3 a√±os | Educaci√≥n preescolar |
| **Primaria** | 6-11 a√±os | 6 a√±os | Educaci√≥n primaria obligatoria |
| **ESO** | 12-15 a√±os | 4 a√±os | Educaci√≥n secundaria obligatoria |

---

## üßÆ **F√ìRMULAS Y C√ÅLCULOS PRINCIPALES**

### 1. **Estimaci√≥n de Plazas por Centro Educativo**

**F√≥rmula Base:**
```
Plazas Estimadas = MAX(Matriculados + Admitidos) √∑ A√±os de Permanencia
```

**Explicaci√≥n:**
- Se toma el **m√°ximo hist√≥rico** de estudiantes (matriculados + admitidos) entre todos los a√±os disponibles
- Se divide por los a√±os de permanencia del ciclo para estimar la capacidad anual de nuevos ingresos
- **Ejemplo:** Si un centro tuvo m√°ximo 180 estudiantes de primaria y la permanencia es 6 a√±os ‚Üí 180√∑6 = 30 plazas anuales

### 2. **Correcci√≥n para Transiciones Autom√°ticas (Primaria)**

**F√≥rmula:**
```
Solicitudes Admitidas Corregidas = Solicitudes Admitidas + Transiciones Autom√°ticas
Transiciones Autom√°ticas = MAX(Plazas Infantil II del mismo centro)
```

**Justificaci√≥n:**
- Los estudiantes de Infantil II del mismo centro tienen prioridad autom√°tica para Primaria
- No aparecen en las solicitudes de admisi√≥n porque es transici√≥n interna

### 3. **Indicadores de Ocupaci√≥n por Centro**

#### **Tasa de Ocupaci√≥n:**
```
Tasa de Ocupaci√≥n = Matriculados Actuales √∑ M√°ximo Hist√≥rico Matriculados
```
- **Interpretaci√≥n:** % de uso de la capacidad hist√≥rica m√°xima del centro

#### **Ratio de Demanda:**
```
Ratio de Demanda = Solicitudes Presentadas √∑ Plazas Estimadas
```
- **Interpretaci√≥n:** 
  - `> 1.5`: Centro sobredemandado
  - `0.8-1.5`: Demanda equilibrada
  - `< 0.8`: Demanda baja

#### **Eficiencia de Admisi√≥n:**
```
Eficiencia de Admisi√≥n = Solicitudes Admitidas √∑ Solicitudes Presentadas
```
- **Interpretaci√≥n:** % de solicitudes que logran ser admitidas

---

## üèõÔ∏è **AN√ÅLISIS DE COBERTURA MUNICIPAL**

### 4. **Estimaci√≥n de Necesidades Demogr√°ficas**

**Mapeo Poblaci√≥n ‚Üí Necesidades Educativas:**

#### **Infantil I (0-2 a√±os):**
```
Necesidad Estimada = (Poblaci√≥n 0-4 a√±os √ó 3) √∑ 5
```
- **L√≥gica:** 3 de los 5 a√±os del rango 0-4 corresponden a Infantil I

#### **Infantil II (3-5 a√±os):**
```
Necesidad Estimada = (Poblaci√≥n 0-4 a√±os √ó 2) √∑ 5 + (Poblaci√≥n 5-9 a√±os √ó 1) √∑ 5
```
- **L√≥gica:** 2 a√±os del rango 0-4 + 1 a√±o del rango 5-9

#### **Primaria (6-11 a√±os):**
```
Necesidad Estimada = (Poblaci√≥n 5-9 a√±os √ó 4) √∑ 5 + (Poblaci√≥n 10-14 a√±os √ó 2) √∑ 5
```
- **L√≥gica:** 4 a√±os del rango 5-9 + 2 a√±os del rango 10-14

#### **ESO (12-15 a√±os):**
```
Necesidad Estimada = (Poblaci√≥n 10-14 a√±os √ó 3) √∑ 5 + (Poblaci√≥n 15-19 a√±os √ó 1) √∑ 5
```
- **L√≥gica:** 3 a√±os del rango 10-14 + 1 a√±o del rango 15-19

### 5. **Indicadores de Cobertura Municipal**

#### **Ratio de Cobertura por Ciclo:**
```
Ratio de Cobertura = Capacidad Total del Municipio √∑ Necesidad Estimada
```
- **Interpretaci√≥n:**
  - `‚â• 1.0`: Cobertura completa
  - `0.8-0.99`: Cobertura aceptable (margen 20%)
  - `< 0.8`: D√©ficit de cobertura

#### **Porcentaje de Cobertura Municipal:**
```
% Cobertura = (Ciclos Cubiertos √∑ Ciclos con Necesidad) √ó 100
```
- Un ciclo est√° "cubierto" si su ratio de cobertura ‚â• 0.8

#### **D√©ficit Educativo:**
```
D√©ficit = MAX(0, Necesidad Estimada - Capacidad Disponible)
```
- N√∫mero de plazas faltantes para cubrir la demanda

---

## üìà **INTERPRETACI√ìN DE RESULTADOS**

### **Clasificaci√≥n de Centros Educativos:**

| Clasificaci√≥n | Ratio Admisi√≥n/Capacidad | Interpretaci√≥n |
|---------------|---------------------------|----------------|
| **Sobrecapacidad** | ‚â• 1.0 | Admiten m√°s estudiantes que su capacidad estimada |
| **Alta Eficiencia** | 0.8 - 0.99 | Utilizan bien su capacidad disponible |
| **Eficiencia Media** | 0.5 - 0.79 | Pueden mejorar el uso de su capacidad |
| **Baja Eficiencia** | < 0.5 | Subutilizan significativamente su capacidad |

### **Clasificaci√≥n de Municipios:**

| Nivel | % Cobertura | Descripci√≥n | Acci√≥n Recomendada |
|-------|-------------|-------------|-------------------|
| **üü¢ Excelente** | 100% | Todos los ciclos cubiertos | Mantener y optimizar |
| **üü° Buena** | 75-99% | Mayor√≠a de ciclos cubiertos | Reforzar ciclos deficitarios |
| **üü† Regular** | 50-74% | Cobertura parcial | Plan de expansi√≥n educativa |
| **üî¥ Deficiente** | < 50% | Cobertura insuficiente | Intervenci√≥n prioritaria |

---

## üéØ **CASOS DE USO Y APLICACIONES**

### **Para Administraciones Municipales:**
1. **Planificaci√≥n Educativa:** Identificar d√≥nde construir nuevos centros
2. **Asignaci√≥n de Recursos:** Priorizar inversiones en municipios cr√≠ticos
3. **Evaluaci√≥n de Pol√≠ticas:** Medir el impacto de la expansi√≥n educativa

### **Para Centros Educativos:**
1. **Optimizaci√≥n de Capacidad:** Identificar oportunidades de crecimiento
2. **An√°lisis de Demanda:** Entender patrones de solicitudes
3. **Planificaci√≥n de Personal:** Ajustar recursos seg√∫n ocupaci√≥n

### **Para Familias:**
1. **Elecci√≥n de Residencia:** Considerar disponibilidad educativa
2. **Planificaci√≥n Familiar:** Anticipar necesidades educativas futuras

---

## ‚ö†Ô∏è **LIMITACIONES Y CONSIDERACIONES**

### **Limitaciones del An√°lisis:**
1. **Datos Hist√≥ricos:** Los c√°lculos se basan en patrones pasados que pueden cambiar
2. **Movilidad Estudiantil:** No considera estudiantes que cruzan fronteras municipales
3. **Preferencias Familiares:** Asume distribuci√≥n uniforme de preferencias educativas
4. **Factores Socioecon√≥micos:** No considera variables de accesibilidad econ√≥mica

### **Supuestos del Modelo:**
1. **Permanencia Completa:** Asume que estudiantes completan todo el ciclo
2. **Distribuci√≥n Etaria Uniforme:** Asume distribuci√≥n pareja dentro de rangos de edad
3. **Capacidad Constante:** No considera variaciones estacionales o de recursos

---

## üîç **METODOLOG√çA DE VALIDACI√ìN**

### **Controles de Calidad Aplicados:**
1. **Consistencia Temporal:** Verificaci√≥n de datos entre a√±os
2. **Validaci√≥n Cruzada:** Comparaci√≥n entre fuentes (admisiones vs. matr√≠cula)
3. **Rangos Razonables:** Verificaci√≥n de valores at√≠picos
4. **Completitud de Datos:** Identificaci√≥n de municipios sin datos demogr√°ficos

### **Indicadores de Fiabilidad:**
- **Cobertura de Datos:** 179.0% de municipios con datos completos
- **A√±os Analizados:** 2021-2023
- **Centros Validados:** 1464 centros con datos consistentes

---

## üìä **RESUMEN EJECUTIVO DE HALLAZGOS**

### **Principales Conclusiones:**
1. **Cobertura Regional:** 29.5% de cobertura promedio
2. **Municipios Cr√≠ticos:** 119 requieren atenci√≥n inmediata
3. **D√©ficit Total:** 890326 plazas educativas necesarias
4. **Poblaci√≥n Analizada:** 1,336,662 personas de 0-19 a√±os

### **Recomendaciones Estrat√©gicas:**
1. **Prioridad Alta:** Municipios con >100 habitantes y <50% cobertura
2. **Ciclos Cr√≠ticos:** Primaria (364598), ESO (248569) requieren expansi√≥n prioritaria
3. **Optimizaci√≥n:** 32 centros pueden aumentar eficiencia

---

## üõ†Ô∏è **HERRAMIENTAS Y TECNOLOG√çAS UTILIZADAS**

- **Python 3.x** con pandas, numpy, matplotlib, seaborn
- **Jupyter Notebook** para an√°lisis interactivo
- **Datos Oficiales** de educaci√≥n y demograf√≠a municipal
- **Metodolog√≠a Estad√≠stica** descriptiva y de estimaci√≥n

---

*üìÖ An√°lisis generado el: Agosto 2025*
*üìç Regi√≥n: Comunidad de Madrid*
*üîÑ √öltima actualizaci√≥n de datos: 2024*


üìñ Documentaci√≥n completa generada
üí° Esta documentaci√≥n incluye todas las f√≥rmulas, metodolog√≠a e interpretaci√≥n de resultados
