In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import warnings
warnings.filterwarnings('ignore')

# Configuración visual mejorada
plt.style.use('seaborn-v0_8')
sns.set_palette("Set2")
plt.rcParams['figure.facecolor'] = 'white'
plt.rcParams['axes.facecolor'] = 'white'

print("📊 ANÁLISIS DE OCUPACIÓN EDUCATIVA - SOLICITUDES VS CAPACIDAD")
print("="*65)


📊 ANÁLISIS DE OCUPACIÓN EDUCATIVA - SOLICITUDES VS CAPACIDAD


In [2]:
# === CARGA DE DATOS ===
def load_education_data():
    """Carga solo los datasets educativos necesarios"""
    data = {}

    # Datos educativos principales
    files = {
        'education': '../downloads/normalizacion/education.csv',
        'admissions': '../downloads/normalizacion/education_admition.csv',
        'enrollment': '../downloads/normalizacion/education_enrollment.csv',
        'edu_municipality': '../downloads/normalizacion/education_municipality.csv',
        'municipality': '../downloads/normalizacion/municipality.csv'
    }

    for name, path in files.items():
        delimiter = ';' if 'education' in path and 'municipality' not in path else ','
        data[name] = pd.read_csv(path, delimiter=delimiter)
        # Convertir IDs a string para consistencia
        if 'id' in data[name].columns:
            data[name]['id'] = data[name]['id'].astype(str)
        if 'id_education' in data[name].columns:
            data[name]['id_education'] = data[name]['id_education'].astype(str)
        if 'id_municipality' in data[name].columns:
            data[name]['id_municipality'] = data[name]['id_municipality'].astype(str)

    return data

data = load_education_data()
print(f"✅ Datos educativos cargados:")
for key, df in data.items():
    print(f"   • {key}: {len(df):,} registros")


✅ Datos educativos cargados:
   • education: 1,978 registros
   • admissions: 39,297 registros
   • enrollment: 24,159 registros
   • edu_municipality: 2,780 registros
   • municipality: 179 registros


In [3]:
# === CONFIGURACIÓN DE CICLOS EDUCATIVOS ===
def get_cycle_config():
    """Configuración de ciclos con años de permanencia"""
    return {
        'infantil_i_ciclo': {
            'name': 'Infantil I',
            'años_permanencia': 3  # 0-2 años
        },
        'infantil_ii_ciclo': {
            'name': 'Infantil II',
            'años_permanencia': 3  # 3-5 años
        },
        'primaria': {
            'name': 'Primaria',
            'años_permanencia': 6  # 6-11 años
        },
        'eso': {
            'name': 'ESO',
            'años_permanencia': 4  # 12-15 años
        }
    }

cycle_config = get_cycle_config()
print("📚 Configuración de ciclos educativos:")
for cycle, config in cycle_config.items():
    print(f"   • {config['name']}: {config['años_permanencia']} años de permanencia")


📚 Configuración de ciclos educativos:
   • Infantil I: 3 años de permanencia
   • Infantil II: 3 años de permanencia
   • Primaria: 6 años de permanencia
   • ESO: 4 años de permanencia


In [4]:
# === ANÁLISIS DE OCUPACIÓN POR CENTRO EDUCATIVO ===
def analyze_center_occupancy(data, cycle_config):
    """Analiza ocupación de centros: solicitudes vs capacidad estimada"""

    target_year = "2022-2023"  # Año para comparación de ocupación actual

    # FILTRO INICIAL: Solo trabajar con los ciclos específicos
    valid_cycles = ['infantil_i_ciclo', 'infantil_ii_ciclo', 'primaria', 'eso']

    # Para admisiones, usar TODOS los años disponibles para encontrar el máximo
    admissions = data['admissions'].copy()
    # Filtrar solo los ciclos válidos
    admissions = admissions[admissions['cycle'].isin(valid_cycles)]

    # Para matrícula, usar TODOS los años disponibles para encontrar el máximo
    enrollment = data['enrollment'].copy()
    # Filtrar solo los ciclos válidos
    enrollment = enrollment[enrollment['cycle'].isin(valid_cycles)]

    print(f"🎯 Analizando ocupación actual para año: {target_year}")
    print(f"   • Ciclos incluidos: {valid_cycles}")
    print(f"   • Registros de admisiones (filtrados): {len(admissions):,}")
    print(f"   • Registros de matrícula (filtrados): {len(enrollment):,}")
    print(f"   • Años disponibles: {sorted(set(enrollment['year'].unique()) | set(admissions['year'].unique()))}")

    # FILTRO PREVIO: Solo analizar centros que tienen datos en los ciclos válidos
    centros_con_ciclos_validos = set()

    # Identificar centros que tienen datos de matrícula en ciclos válidos
    centros_enrollment = enrollment['id_education'].unique()
    centros_con_ciclos_validos.update(centros_enrollment)

    # Identificar centros que tienen datos de admisiones en ciclos válidos
    centros_admissions = admissions['id_education'].unique()
    centros_con_ciclos_validos.update(centros_admissions)

    print(f"   • Centros con datos en ciclos válidos: {len(centros_con_ciclos_validos)}")

    # Análisis por centro educativo
    center_analysis = []

    for center_id in centros_con_ciclos_validos:  # Solo analizar centros relevantes
        center_info = data['education'][data['education']['id'] == center_id]
        if center_info.empty:
            continue  # Saltar si no existe información del centro

        center_info = center_info.iloc[0]
        center_data = {
            'id_education': center_id,
            'center_name': center_info['name_short'],
            'center_type': center_info.get('description_short', 'No especificado')
        }

        # Variables para totales del centro
        total_plazas_estimadas = 0
        total_max_matriculados = 0
        total_matriculados_año_objetivo = 0
        total_solicitudes_presentadas = 0
        total_solicitudes_admitidas = 0
        ciclos_activos = 0

        # Analizar cada ciclo (solo los válidos)
        for cycle in valid_cycles:
            config = cycle_config[cycle]

            # y luego tomar el máximo

            # Obtener datos de matrícula para este ciclo en todos los años
            cycle_enrollment_all_years = enrollment[
                (enrollment['id_education'] == center_id) &
                (enrollment['cycle'] == cycle)
            ]

            # Obtener datos de admisiones para este ciclo en todos los años
            cycle_admissions_all_years = admissions[
                (admissions['id_education'] == center_id) &
                (admissions['cycle'] == cycle) &
                (admissions['type_solicitude'] == 'Admitidas')
            ]

            # Calcular plazas estimadas por año: (matriculados + admitidos) ÷ años_permanencia
            plazas_por_año = {}

            # Obtener todos los años que tienen datos
            años_matricula = set(cycle_enrollment_all_years['year'].unique())
            años_admisiones = set(cycle_admissions_all_years['year'].unique())
            todos_los_años = años_matricula | años_admisiones

            for año in todos_los_años:
                # Matriculados en este año
                matriculados_año = cycle_enrollment_all_years[
                    cycle_enrollment_all_years['year'] == año
                ]['total'].sum()

                # Admitidos en este año
                admitidos_año = cycle_admissions_all_years[
                    cycle_admissions_all_years['year'] == año
                ]['total'].sum()

                # Plazas estimadas para este año
                if matriculados_año > 0 or admitidos_año > 0:
                    plazas_año = matriculados_año / config['años_permanencia']
                    plazas_por_año[año] = {
                        'matriculados': matriculados_año,
                        'admitidos': admitidos_año,
                        'total_estudiantes': matriculados_año,
                        'plazas_estimadas': plazas_año
                    }

            # Tomar el MÁXIMO de plazas estimadas entre todos los años
            if plazas_por_año:
                año_max_plazas = max(plazas_por_año.keys(), key=lambda x: plazas_por_año[x]['plazas_estimadas'])
                max_plazas_data = plazas_por_año[año_max_plazas]

                plazas_estimadas = max_plazas_data['plazas_estimadas']
                max_matriculados = max_plazas_data['matriculados']
                max_admitidos = max_plazas_data['admitidos']
                max_total_estudiantes = max_plazas_data['total_estudiantes']
                año_max = año_max_plazas
            else:
                plazas_estimadas = 0
                max_matriculados = 0
                max_admitidos = 0
                max_total_estudiantes = 0
                año_max = 'N/A'

            # Datos del año objetivo para comparación de ocupación actual
            cycle_enrollment_target = enrollment[
                (enrollment['id_education'] == center_id) &
                (enrollment['cycle'] == cycle) &
                (enrollment['year'] == target_year)
            ]
            matriculados_año_objetivo = cycle_enrollment_target['total'].sum()

            # Solicitudes presentadas del año objetivo
            cycle_admissions_target = admissions[
                (admissions['id_education'] == center_id) &
                (admissions['cycle'] == cycle) &
                (admissions['year'] == target_year)
            ]

            solicitudes_presentadas = cycle_admissions_target[
                cycle_admissions_target['type_solicitude'] == 'Presentadas'
            ]['total'].sum()
            solicitudes_admitidas = cycle_admissions_target[
                cycle_admissions_target['type_solicitude'] == 'Admitidas'
            ]['total'].sum()

            if cycle == 'primaria':
                # Verificar si el centro también ofrece infantil II (usar máximo también)
                infantil_ii_enrollment_all = enrollment[
                    (enrollment['id_education'] == center_id) &
                    (enrollment['cycle'] == 'infantil_ii_ciclo')
                ]

                infantil_ii_admissions_all = admissions[
                    (admissions['id_education'] == center_id) &
                    (admissions['cycle'] == 'infantil_ii_ciclo') &
                    (admissions['type_solicitude'] == 'Admitidas')
                ]

                if not infantil_ii_enrollment_all.empty or not infantil_ii_admissions_all.empty:
                    # Calcular el máximo de infantil II usando la misma lógica
                    plazas_infantil_por_año = {}
                    años_inf_matricula = set(infantil_ii_enrollment_all['year'].unique())
                    años_inf_admisiones = set(infantil_ii_admissions_all['year'].unique())
                    todos_años_inf = años_inf_matricula | años_inf_admisiones

                    for año in todos_años_inf:
                        mat_inf = infantil_ii_enrollment_all[
                            infantil_ii_enrollment_all['year'] == año
                        ]['total'].sum()

                        adm_inf = infantil_ii_admissions_all[
                            infantil_ii_admissions_all['year'] == año
                        ]['total'].sum()

                        if mat_inf > 0 or adm_inf > 0:
                            plazas_inf_año = (mat_inf + adm_inf) / cycle_config['infantil_ii_ciclo']['años_permanencia']
                            plazas_infantil_por_año[año] = plazas_inf_año

                    if plazas_infantil_por_año:
                        max_plazas_infantil = max(plazas_infantil_por_año.values())
                        # Transiciones automáticas basadas en el máximo de plazas de infantil II
                        transiciones_automaticas = max_plazas_infantil
                    else:
                        transiciones_automaticas = 0

                    # SOLICITUDES ADMITIDAS CORREGIDAS = Admisiones + Transiciones automáticas
                    solicitudes_admitidas_corregidas = solicitudes_admitidas + transiciones_automaticas
                    center_data[f'{cycle}_transiciones_infantil'] = transiciones_automaticas
                    center_data[f'{cycle}_max_plazas_infantil_ii'] = max_plazas_infantil if plazas_infantil_por_año else 0
                else:
                    solicitudes_admitidas_corregidas = solicitudes_admitidas
                    center_data[f'{cycle}_transiciones_infantil'] = 0
                    center_data[f'{cycle}_max_plazas_infantil_ii'] = 0
            else:
                solicitudes_admitidas_corregidas = solicitudes_admitidas
                center_data[f'{cycle}_transiciones_infantil'] = 0

            # Tasa de ocupación: matriculados actuales / máximo histórico matriculados
            tasa_ocupacion_ciclo = (matriculados_año_objetivo / max_matriculados) if max_matriculados > 0 else 0

            # Ratio demanda: solicitudes presentadas / plazas estimadas
            ratio_demanda_ciclo = (solicitudes_presentadas / plazas_estimadas) if plazas_estimadas > 0 else 0

            # Ratio admisión vs capacidad: solicitudes admitidas / plazas estimadas
            ratio_admision_vs_capacidad = (solicitudes_admitidas_corregidas / plazas_estimadas) if plazas_estimadas > 0 else 0

            # Para primaria, excluir las transiciones automáticas del cálculo de eficiencia
            eficiencia_admision = (solicitudes_admitidas / solicitudes_presentadas) if solicitudes_presentadas > 0 else 0

            # Guardar métricas del ciclo
            center_data.update({
                f'{cycle}_max_matriculados': max_matriculados,
                f'{cycle}_max_admitidos': max_admitidos,
                f'{cycle}_max_total_estudiantes': max_total_estudiantes,
                f'{cycle}_año_max': año_max,
                f'{cycle}_matriculados_objetivo': matriculados_año_objetivo,
                f'{cycle}_plazas_estimadas': plazas_estimadas,
                f'{cycle}_solicitudes_presentadas': solicitudes_presentadas,
                f'{cycle}_solicitudes_admitidas': solicitudes_admitidas,
                f'{cycle}_solicitudes_admitidas_corregidas': solicitudes_admitidas_corregidas,
                f'{cycle}_tasa_ocupacion': tasa_ocupacion_ciclo,
                f'{cycle}_ratio_demanda': ratio_demanda_ciclo,
                f'{cycle}_ratio_admision_capacidad': ratio_admision_vs_capacidad,
                f'{cycle}_eficiencia_admision': eficiencia_admision,
                f'{cycle}_activo': 1 if plazas_estimadas > 0 or solicitudes_presentadas > 0 else 0
            })

            # Acumular totales si el ciclo está activo
            if plazas_estimadas > 0 or solicitudes_presentadas > 0:
                ciclos_activos += 1
                total_plazas_estimadas += plazas_estimadas
                total_max_matriculados += max_matriculados
                total_matriculados_año_objetivo += matriculados_año_objetivo
                total_solicitudes_presentadas += solicitudes_presentadas
                total_solicitudes_admitidas += solicitudes_admitidas_corregidas

        # Solo incluir centros que tienen al menos un ciclo activo
        if ciclos_activos > 0:
            # Calcular eficiencia de admisión del centro usando solo solicitudes reales
            total_solicitudes_admitidas_reales = 0
            for cycle in valid_cycles:
                if center_data.get(f'{cycle}_activo', 0) == 1:
                    # Para la eficiencia del centro, usar solo solicitudes admitidas reales (sin transiciones)
                    total_solicitudes_admitidas_reales += center_data[f'{cycle}_solicitudes_admitidas']

            # Métricas agregadas del centro
            center_data.update({
                'ciclos_activos': ciclos_activos,
                'total_plazas_estimadas': total_plazas_estimadas,
                'total_matriculados': total_matriculados_año_objetivo,
                'total_max_matriculados': total_max_matriculados,
                'total_solicitudes_presentadas': total_solicitudes_presentadas,
                'total_solicitudes_admitidas': total_solicitudes_admitidas,
                'total_solicitudes_admitidas_reales': total_solicitudes_admitidas_reales,
                'tasa_ocupacion_centro': (total_matriculados_año_objetivo / total_max_matriculados) if total_max_matriculados > 0 else 0,
                'ratio_demanda_centro': (total_solicitudes_presentadas / total_plazas_estimadas) if total_plazas_estimadas > 0 else 0,
                'ratio_admision_capacidad_centro': (total_solicitudes_admitidas / total_plazas_estimadas) if total_plazas_estimadas > 0 else 0,
                'eficiencia_admision_centro': (total_solicitudes_admitidas_reales / total_solicitudes_presentadas) if total_solicitudes_presentadas > 0 else 0
            })

            center_analysis.append(center_data)

    return pd.DataFrame(center_analysis)

# Ejecutar análisis
centers_df = analyze_center_occupancy(data, cycle_config)
centers_activos = centers_df[centers_df['ciclos_activos'] > 0]  # Solo centros con actividad
print(f"✅ Análisis completado para {len(centers_activos)} centros educativos activos")


🎯 Analizando ocupación actual para año: 2022-2023
   • Ciclos incluidos: ['infantil_i_ciclo', 'infantil_ii_ciclo', 'primaria', 'eso']
   • Registros de admisiones (filtrados): 34,956
   • Registros de matrícula (filtrados): 12,026
   • Años disponibles: ['2020-2021', '2021-2022', '2022-2023', '2023-2024', '2024-2025']
   • Centros con datos en ciclos válidos: 1465
✅ Análisis completado para 1464 centros educativos activos


In [5]:
# === ESTADÍSTICAS GENERALES DE OCUPACIÓN ===
print("📊 ESTADÍSTICAS DE OCUPACIÓN - SOLICITUDES VS CAPACIDAD")
print("="*65)

# Estadísticas principales
stats_ocupacion = pd.DataFrame({
    'Métrica': [
        'Centros Educativos Activos',
        'Total Plazas Estimadas',
        'Total Estudiantes Matriculados',
        'Total Estudiantes Max Matriculados',
        'Total Solicitudes Presentadas',
        'Total Solicitudes Admitidas',
        'Tasa Ocupación Promedio (%)',
        'Ratio Demanda/Capacidad Promedio',
        'Ratio Admisión/Capacidad Promedio',
        'Eficiencia Admisión Promedio (%)',
        'Centros Sobredemandados (>1.5x)',
        'Centros Subocupados (<50%)'
    ],
    'Valor': [
        len(centers_activos),
        centers_activos['total_plazas_estimadas'].sum(),
        centers_activos['total_matriculados'].sum(),
        centers_activos['total_max_matriculados'].sum(),
        centers_activos['total_solicitudes_presentadas'].sum(),
        centers_activos['total_solicitudes_admitidas'].sum(),
        centers_activos['tasa_ocupacion_centro'].mean() * 100,
        centers_activos['ratio_demanda_centro'].mean(),
        centers_activos['ratio_admision_capacidad_centro'].mean(),
        centers_activos['eficiencia_admision_centro'].mean() * 100,
        (centers_activos['ratio_demanda_centro'] > 1.5).sum(),
        (centers_activos['tasa_ocupacion_centro'] < 0.5).sum()
    ]
})

display(stats_ocupacion.round(2))


📊 ESTADÍSTICAS DE OCUPACIÓN - SOLICITUDES VS CAPACIDAD


Unnamed: 0,Métrica,Valor
0,Centros Educativos Activos,1464.0
1,Total Plazas Estimadas,131610.08
2,Total Estudiantes Matriculados,516659.0
3,Total Estudiantes Max Matriculados,560364.0
4,Total Solicitudes Presentadas,123055.0
5,Total Solicitudes Admitidas,140266.33
6,Tasa Ocupación Promedio (%),91.53
7,Ratio Demanda/Capacidad Promedio,1.32
8,Ratio Admisión/Capacidad Promedio,1.34
9,Eficiencia Admisión Promedio (%),80.02


In [6]:
# === CENTROS CON MAYOR PRESIÓN DE DEMANDA ===
print("\n🔥 CENTROS CON MAYOR PRESIÓN DE DEMANDA (Top 15)")
print("Ratio Demanda/Capacidad más alto")
print("="*70)

top_demanda = centers_activos.nlargest(15, 'ratio_demanda_centro')[
    ['center_name', 'ciclos_activos', 'total_solicitudes_presentadas', 'total_plazas_estimadas',
     'ratio_demanda_centro', 'eficiencia_admision_centro']
].copy()

top_demanda.columns = ['Centro', 'Ciclos', 'Solicitudes', 'Plazas Est.', 'Ratio Demanda', 'Eficiencia %']
top_demanda['Ratio Demanda'] = top_demanda['Ratio Demanda'].round(2)
top_demanda['Eficiencia %'] = (top_demanda['Eficiencia %'] * 100).round(1)

display(top_demanda)



🔥 CENTROS CON MAYOR PRESIÓN DE DEMANDA (Top 15)
Ratio Demanda/Capacidad más alto


Unnamed: 0,Centro,Ciclos,Solicitudes,Plazas Est.,Ratio Demanda,Eficiencia %
808,El Tren de la Fresa,1,474,38.333333,12.37,25.3
24,El Pilar,1,385,38.333333,10.04,29.9
1190,Rosa,1,223,24.0,9.29,30.5
162,Vallehermoso,1,224,29.333333,7.64,35.3
538,Puerta del Ángel,1,279,38.0,7.34,40.5
206,Arcoiris,1,274,38.333333,7.15,40.9
255,Rayuela,1,400,61.0,6.56,44.5
629,Rocio Durcal,1,387,59.666667,6.49,47.0
441,Shantala,1,247,38.333333,6.44,50.2
347,La Marazuela,1,162,25.333333,6.39,42.0


In [7]:
# === CENTROS CON MAYOR OCUPACIÓN ===
print("\n📈 CENTROS CON MAYOR OCUPACIÓN (Top 15)")
print("Tasa de ocupación más alta")
print("="*70)

top_ocupacion = centers_activos.nlargest(15, 'tasa_ocupacion_centro')[
    ['center_name', 'ciclos_activos', 'total_matriculados', 'total_max_matriculados', 'total_plazas_estimadas',
     'tasa_ocupacion_centro', 'ratio_demanda_centro']
].copy()

top_ocupacion.columns = ['Centro', 'Ciclos', 'Matriculados', 'Total Max Matriculados', 'Plazas Est.', 'Ocupación %', 'Ratio Demanda']
top_ocupacion['Ocupación %'] = (top_ocupacion['Ocupación %'] * 100).round(1)
top_ocupacion['Ratio Demanda'] = top_ocupacion['Ratio Demanda'].round(2)

display(top_ocupacion)



📈 CENTROS CON MAYOR OCUPACIÓN (Top 15)
Tasa de ocupación más alta


Unnamed: 0,Centro,Ciclos,Matriculados,Total Max Matriculados,Plazas Est.,Ocupación %,Ratio Demanda
15,Jimena Menendez Pidal,1,639,639,159.75,100.0,1.17
45,Victoria Kent,1,387,387,96.75,100.0,1.05
72,Isaac Albéniz,2,178,178,37.666667,100.0,0.53
83,Pippi Langstrump,1,116,116,38.666667,100.0,5.92
88,El Cervatillo Dormilón,1,12,12,4.0,100.0,3.25
97,El Trébol,1,52,52,17.333333,100.0,3.23
125,Miguel Delibes,1,545,545,136.25,100.0,1.01
128,Mariano José de Larra,1,579,579,144.75,100.0,1.49
131,Humanes,1,605,605,151.25,100.0,0.94
132,Miguel Hernández,1,418,418,104.5,100.0,0.69


In [8]:
# === ANÁLISIS POR CICLOS EDUCATIVOS ===
print("\n📚 ANÁLISIS POR CICLOS - OCUPACIÓN Y DEMANDA")
print("="*55)

cycle_summary = []
for cycle, config in cycle_config.items():
    # Centros que ofrecen este ciclo
    cycle_centros = centers_activos[centers_activos[f'{cycle}_activo'] == 1]

    if len(cycle_centros) > 0:
        # Métricas agregadas del ciclo usando columnas corregidas
        total_max_matriculados = cycle_centros[f'{cycle}_max_matriculados'].sum()
        total_matriculados_objetivo = cycle_centros[f'{cycle}_matriculados_objetivo'].sum()
        total_plazas = cycle_centros[f'{cycle}_plazas_estimadas'].sum()
        total_solicitudes = cycle_centros[f'{cycle}_solicitudes_presentadas'].sum()
        total_admitidas = cycle_centros[f'{cycle}_solicitudes_admitidas_corregidas'].sum()

        # Transiciones para primaria
        total_transiciones = 0
        if cycle == 'primaria':
            total_transiciones = cycle_centros[f'{cycle}_transiciones_infantil'].sum()

        # Calcular promedios
        tasa_ocupacion_promedio = cycle_centros[f'{cycle}_tasa_ocupacion'].mean()
        ratio_demanda_promedio = cycle_centros[f'{cycle}_ratio_demanda'].mean()
        ratio_admision_promedio = cycle_centros[f'{cycle}_ratio_admision_capacidad'].mean()
        eficiencia_promedio = cycle_centros[f'{cycle}_eficiencia_admision'].mean()

        cycle_summary.append({
            'Ciclo': config['name'],
            'Centros': len(cycle_centros),
            'Max Matriculados': total_max_matriculados,
            'Matriculados 2022-23': total_matriculados_objetivo,
            'Plazas Est.': total_plazas,
            'Solicitudes': total_solicitudes,
            'Admitidas': total_admitidas,
            'Transiciones': total_transiciones,
            'Ocupación %': tasa_ocupacion_promedio * 100,
            'Ratio Demanda': ratio_demanda_promedio,
            'Ratio Admisión': ratio_admision_promedio,
            'Eficiencia %': eficiencia_promedio * 100
        })

cycle_summary_df = pd.DataFrame(cycle_summary)
display(cycle_summary_df.round(1))



📚 ANÁLISIS POR CICLOS - OCUPACIÓN Y DEMANDA


Unnamed: 0,Ciclo,Centros,Max Matriculados,Matriculados 2022-23,Plazas Est.,Solicitudes,Admitidas,Transiciones,Ocupación %,Ratio Demanda,Ratio Admisión,Eficiencia %
0,Infantil I,426,35749,31332,11916.3,41750,30406.0,0.0,82.8,3.3,2.4,70.3
1,Infantil II,827,107083,94437,35694.3,30363,26641.0,0.0,87.5,0.8,0.7,89.5
2,Primaria,811,244603,229423,40767.2,8758,49844.3,46132.3,93.4,0.2,1.2,51.0
3,ESO,352,172929,161467,43232.2,42184,33375.0,0.0,90.7,0.9,0.7,76.4


In [9]:
# === EJEMPLOS DE CÁLCULO DE PLAZAS ESTIMADAS ===
print("\n🔍 EJEMPLOS DE CÁLCULO DE PLAZAS ESTIMADAS (Top 5 por plazas)")
print("Usando máximo de (matriculados + admitidos) ÷ años entre todos los años")
print("="*80)

# Seleccionar los 5 centros con más plazas estimadas para mostrar ejemplos
top_capacity_centers = centers_activos.nlargest(5, 'total_plazas_estimadas')

ejemplos_calculo = []
for _, center in top_capacity_centers.iterrows():
    center_ejemplo = {
        'Centro': center['center_name'],
        'Total Plazas Est.': center['total_plazas_estimadas']
    }

    # Mostrar cálculo para cada ciclo activo
    detalles_ciclos = []
    for cycle, config in cycle_config.items():
        if center[f'{cycle}_activo'] == 1:
            max_mat = center[f'{cycle}_max_matriculados']
            max_adm = center[f'{cycle}_max_admitidos']
            max_total = center[f'{cycle}_max_total_estudiantes']
            año_max = center[f'{cycle}_año_max']
            plazas = center[f'{cycle}_plazas_estimadas']
            años_perm = config['años_permanencia']

            detalle = f"{config['name']}: ({max_mat} mat. + {max_adm} adm.) = {max_total} ({año_max}) ÷ {años_perm} años = {plazas:.1f} plazas"
            detalles_ciclos.append(detalle)

    center_ejemplo['Cálculo Detallado'] = ' | '.join(detalles_ciclos)
    ejemplos_calculo.append(center_ejemplo)

ejemplos_df = pd.DataFrame(ejemplos_calculo)
for _, ejemplo in ejemplos_df.iterrows():
    print(f"\n🏫 {ejemplo['Centro']}")
    print(f"   Total Plazas Estimadas: {ejemplo['Total Plazas Est.']:.1f}")
    print(f"   Cálculo: {ejemplo['Cálculo Detallado']}")



🔍 EJEMPLOS DE CÁLCULO DE PLAZAS ESTIMADAS (Top 5 por plazas)
Usando máximo de (matriculados + admitidos) ÷ años entre todos los años

🏫 Joaquín Costa
   Total Plazas Estimadas: 294.0
   Cálculo: Infantil II: (435 mat. + 151 adm.) = 435 (2021-2022) ÷ 3 años = 145.0 plazas | Primaria: (894 mat. + 1 adm.) = 894 (2020-2021) ÷ 6 años = 149.0 plazas

🏫 La Luna
   Total Plazas Estimadas: 277.0
   Cálculo: Infantil II: (275 mat. + 75 adm.) = 275 (2020-2021) ÷ 3 años = 91.7 plazas | Primaria: (491 mat. + 0 adm.) = 491 (2024-2025) ÷ 6 años = 81.8 plazas | ESO: (414 mat. + 49 adm.) = 414 (2024-2025) ÷ 4 años = 103.5 plazas

🏫 El Espinillo
   Total Plazas Estimadas: 263.8
   Cálculo: ESO: (1055 mat. + 191 adm.) = 1055 (2023-2024) ÷ 4 años = 263.8 plazas

🏫 Maestro Rodrigo
   Total Plazas Estimadas: 262.1
   Cálculo: Infantil II: (230 mat. + 75 adm.) = 230 (2020-2021) ÷ 3 años = 76.7 plazas | Primaria: (562 mat. + 5 adm.) = 562 (2024-2025) ÷ 6 años = 93.7 plazas | ESO: (367 mat. + 15 adm.) = 367 (

In [10]:
# === CENTROS CON CORRECCIÓN DE PRIMARIA ===
print("\n🔄 CENTROS CON TRANSICIONES AUTOMÁTICAS INFANTIL II → PRIMARIA")
print("="*65)

centros_con_transiciones = centers_activos[
    centers_activos['primaria_transiciones_infantil'] > 0
].copy()

if len(centros_con_transiciones) > 0:
    transiciones_detalle = centros_con_transiciones[
        ['center_name', 'primaria_matriculados_objetivo', 'primaria_solicitudes_admitidas',
         'primaria_transiciones_infantil', 'primaria_solicitudes_admitidas_corregidas']
    ].copy()

    transiciones_detalle.columns = [
        'Centro', 'Matriculados Primaria', 'Admisiones Solicitudes',
        'Transiciones Infantil II', 'Total Admisiones Corregidas'
    ]

    # Mostrar los primeros 10
    display(transiciones_detalle.head(10).round(1))

    print(f"\n📊 Resumen de transiciones:")
    print(f"   • Centros con transiciones: {len(centros_con_transiciones)}")
    print(f"   • Total transiciones automáticas: {centros_con_transiciones['primaria_transiciones_infantil'].sum():.1f}")
    print(f"   • Promedio transiciones por centro: {centros_con_transiciones['primaria_transiciones_infantil'].mean():.1f}")
else:
    print("No se encontraron centros con transiciones automáticas")



🔄 CENTROS CON TRANSICIONES AUTOMÁTICAS INFANTIL II → PRIMARIA


Unnamed: 0,Centro,Matriculados Primaria,Admisiones Solicitudes,Transiciones Infantil II,Total Admisiones Corregidas
3,Gabriela Mistral,273,2,65.3,67.3
4,CEIP San Sebastián,226,4,60.3,64.3
5,Palomeras Bajas,300,6,66.0,72.0
7,Ntra. Sra. de Valvanera,292,3,63.0,66.0
10,Dámaso Alonso,152,8,33.3,41.3
11,El Vellón,107,2,29.3,31.3
12,El Parque,398,4,83.0,87.0
14,Pío Baroja,301,5,55.7,60.7
17,Gonzalo de Berceo,322,4,58.0,62.0
18,Ramón Linacero,239,2,39.7,41.7



📊 Resumen de transiciones:
   • Centros con transiciones: 826
   • Total transiciones automáticas: 46527.7
   • Promedio transiciones por centro: 56.3


In [11]:
# === ANÁLISIS DE EFICIENCIA POR CENTRO ===
print("\n⚡ ANÁLISIS DE EFICIENCIA - ADMISIÓN VS CAPACIDAD")
print("="*60)

# Clasificar centros por eficiencia
def clasificar_eficiencia(ratio_admision):
    if ratio_admision >= 1.0:
        return "Sobrecapacidad"
    elif ratio_admision >= 0.8:
        return "Alta eficiencia"
    elif ratio_admision >= 0.5:
        return "Eficiencia media"
    else:
        return "Baja eficiencia"

centers_activos['clasificacion_eficiencia'] = centers_activos['ratio_admision_capacidad_centro'].apply(clasificar_eficiencia)

eficiencia_resumen = centers_activos['clasificacion_eficiencia'].value_counts()
eficiencia_porcentajes = (eficiencia_resumen / len(centers_activos) * 100).round(1)

eficiencia_stats = pd.DataFrame({
    'Clasificación': eficiencia_resumen.index,
    'Centros': eficiencia_resumen.values,
    'Porcentaje': eficiencia_porcentajes.values
})

print("Distribución de eficiencia de centros:")
display(eficiencia_stats)

print("\n✅ ANÁLISIS DE OCUPACIÓN EDUCATIVA COMPLETADO")
print("="*60)



⚡ ANÁLISIS DE EFICIENCIA - ADMISIÓN VS CAPACIDAD
Distribución de eficiencia de centros:


Unnamed: 0,Clasificación,Centros,Porcentaje
0,Sobrecapacidad,764,52.2
1,Alta eficiencia,448,30.6
2,Eficiencia media,220,15.0
3,Baja eficiencia,32,2.2



✅ ANÁLISIS DE OCUPACIÓN EDUCATIVA COMPLETADO


In [12]:
# === ANÁLISIS DE COBERTURA EDUCATIVA POR MUNICIPIO ===
print("\n🏛️ ANÁLISIS DE COBERTURA EDUCATIVA MUNICIPAL")
print("Validación de capacidad vs necesidades demográficas")
print("="*70)

def load_demographic_data():
    """Carga datos demográficos para el análisis de cobertura"""
    demographics = pd.read_csv('../downloads/normalizacion/municipality_demographics.csv')

    # Mapeo de rangos de edad a ciclos educativos
    age_to_cycle_mapping = {
        '0-4': ['infantil_i_ciclo', 'infantil_ii_ciclo'],  # 0-2 y 3-5
        '5-9': ['infantil_ii_ciclo', 'primaria'],         # 3-5 y 6-11
        '10-14': ['primaria', 'eso'],                      # 6-11 y 12-15
        '15-19': ['eso']                                   # 12-15
    }

    return demographics, age_to_cycle_mapping

def analyze_municipal_coverage(data, centers_df, cycle_config):
    """Analiza la cobertura educativa por municipio"""

    # Cargar datos demográficos
    demographics, age_mapping = load_demographic_data()

    # Obtener relación centro-municipio
    edu_municipality = data['edu_municipality']
    municipalities = data['municipality']

    # Usar el año más reciente disponible para demografía
    latest_year = demographics['year'].max()
    demographics_latest = demographics[demographics['year'] == latest_year].copy()

    print(f"📊 Usando datos demográficos del año: {latest_year}")
    print(f"   • Municipios con datos demográficos: {demographics_latest['id_secondary_municipality'].nunique()}")

    # Análisis por municipio
    municipal_analysis = []

    # Obtener municipios únicos que tienen centros educativos
    municipios_con_centros = edu_municipality['id_municipality'].unique()

    for municipality_id in municipios_con_centros:
        # Información del municipio
        muni_info = municipalities[municipalities['id'] == municipality_id]
        if muni_info.empty:
            continue

        muni_info = muni_info.iloc[0]
        muni_secondary_id = muni_info['id_secondary']

        # Obtener datos demográficos del municipio
        muni_demographics = demographics_latest[
            demographics_latest['id_secondary_municipality'] == muni_secondary_id
        ].copy()

        if muni_demographics.empty:
            continue  # Saltar municipios sin datos demográficos

        # Obtener centros educativos del municipio
        centros_municipio = edu_municipality[
            edu_municipality['id_municipality'] == municipality_id
        ]['id_education'].unique()

        # Filtrar centros activos en nuestro análisis
        centros_activos_municipio = centers_df[
            centers_df['id_education'].isin(centros_municipio)
        ].copy()

        if centros_activos_municipio.empty:
            continue  # Saltar municipios sin centros activos

        # Inicializar datos del municipio
        municipal_data = {
            'id_municipality': municipality_id,
            'municipality_name': muni_info['name'],
            'total_centers': len(centros_activos_municipio),
            'total_population_0_19': 0
        }

        # Calcular población total por grupos de edad relevantes
        for _, demo_row in muni_demographics.iterrows():
            age_range = demo_row['range']
            population = demo_row['total']

            if age_range in ['0-4', '5-9', '10-14', '15-19']:
                municipal_data['total_population_0_19'] += population
                municipal_data[f'population_{age_range}'] = population

        # Análisis por ciclo educativo
        for cycle in ['infantil_i_ciclo', 'infantil_ii_ciclo', 'primaria', 'eso']:
            config = cycle_config[cycle]

            # Sumar capacidad de todos los centros del municipio para este ciclo
            cycle_capacity = centros_activos_municipio[f'{cycle}_plazas_estimadas'].sum()
            cycle_max_matriculados = centros_activos_municipio[f'{cycle}_max_matriculados'].sum()
            cycle_solicitudes = centros_activos_municipio[f'{cycle}_solicitudes_presentadas'].sum()
            cycle_admitidos = centros_activos_municipio[f'{cycle}_solicitudes_admitidas_corregidas'].sum()

            # Centros que ofrecen este ciclo
            centros_con_ciclo = centros_activos_municipio[
                centros_activos_municipio[f'{cycle}_activo'] == 1
            ]
            num_centros_ciclo = len(centros_con_ciclo)

            municipal_data.update({
                f'{cycle}_capacity': cycle_capacity,
                f'{cycle}_max_matriculados': cycle_max_matriculados,
                f'{cycle}_solicitudes': cycle_solicitudes,
                f'{cycle}_admitidos': cycle_admitidos,
                f'{cycle}_num_centers': num_centros_ciclo,
                f'{cycle}_centers_names': ', '.join(centros_con_ciclo['center_name'].tolist()) if num_centros_ciclo > 0 else 'Ninguno'
            })

        # Calcular estimaciones de necesidad educativa por ciclo
        # Basado en población por edad y años de permanencia en cada ciclo

        # Infantil I (0-2 años): aproximadamente 3/5 de la población 0-4
        pop_0_4 = municipal_data.get('population_0-4', 0)
        estimated_need_infantil_i = (pop_0_4 * 3) / 5  # 3 años de los 5 años del rango 0-4

        # Infantil II (3-5 años): aproximadamente 2/5 de la población 0-4 + 1/5 de la población 5-9
        pop_5_9 = municipal_data.get('population_5-9', 0)
        estimated_need_infantil_ii = (pop_0_4 * 2) / 5 + (pop_5_9 * 1) / 5

        # Primaria (6-11 años): aproximadamente 4/5 de la población 5-9 + 2/5 de la población 10-14
        pop_10_14 = municipal_data.get('population_10-14', 0)
        estimated_need_primaria = (pop_5_9 * 4) / 5 + (pop_10_14 * 2) / 5

        # ESO (12-15 años): aproximadamente 3/5 de la población 10-14 + 1/5 de la población 15-19
        pop_15_19 = municipal_data.get('population_15-19', 0)
        estimated_need_eso = (pop_10_14 * 3) / 5 + (pop_15_19 * 1) / 5

        # Guardar estimaciones de necesidad
        needs = {
            'infantil_i_ciclo': estimated_need_infantil_i,
            'infantil_ii_ciclo': estimated_need_infantil_ii,
            'primaria': estimated_need_primaria,
            'eso': estimated_need_eso
        }

        # Calcular indicadores de cobertura por ciclo
        total_estimated_need = 0
        total_capacity = 0
        cycles_with_need = 0
        cycles_covered = 0

        for cycle, estimated_need in needs.items():
            capacity = municipal_data[f'{cycle}_capacity']

            # Ratio de cobertura (capacidad / necesidad estimada)
            coverage_ratio = (capacity / estimated_need) if estimated_need > 0 else float('inf') if capacity > 0 else 0

            # ¿Está cubierto este ciclo? (ratio >= 0.8, permitiendo 20% de margen)
            is_covered = coverage_ratio >= 0.8 if estimated_need > 0 else capacity > 0

            municipal_data.update({
                f'{cycle}_estimated_need': estimated_need,
                f'{cycle}_coverage_ratio': coverage_ratio,
                f'{cycle}_is_covered': is_covered,
                f'{cycle}_deficit': max(0, estimated_need - capacity)
            })

            if estimated_need > 0:
                cycles_with_need += 1
                total_estimated_need += estimated_need
                total_capacity += capacity
                if is_covered:
                    cycles_covered += 1

        # Métricas agregadas del municipio
        overall_coverage_ratio = (total_capacity / total_estimated_need) if total_estimated_need > 0 else 0
        coverage_percentage = (cycles_covered / cycles_with_need * 100) if cycles_with_need > 0 else 0

        municipal_data.update({
            'total_estimated_need': total_estimated_need,
            'total_capacity': total_capacity,
            'overall_coverage_ratio': overall_coverage_ratio,
            'cycles_with_need': cycles_with_need,
            'cycles_covered': cycles_covered,
            'coverage_percentage': coverage_percentage,
            'is_fully_covered': cycles_covered == cycles_with_need and cycles_with_need > 0,
            'total_deficit': max(0, total_estimated_need - total_capacity)
        })

        municipal_analysis.append(municipal_data)

    return pd.DataFrame(municipal_analysis)

# Ejecutar análisis de cobertura municipal
print("⏳ Procesando análisis de cobertura municipal...")
municipal_coverage_df = analyze_municipal_coverage(data, centers_df, cycle_config)

print(f"✅ Análisis completado para {len(municipal_coverage_df)} municipios")
print(f"   • Municipios con cobertura completa: {municipal_coverage_df['is_fully_covered'].sum()}")
print(f"   • Municipios con déficit: {(municipal_coverage_df['total_deficit'] > 0).sum()}")



🏛️ ANÁLISIS DE COBERTURA EDUCATIVA MUNICIPAL
Validación de capacidad vs necesidades demográficas
⏳ Procesando análisis de cobertura municipal...
📊 Usando datos demográficos del año: 2024
   • Municipios con datos demográficos: 179
✅ Análisis completado para 179 municipios
   • Municipios con cobertura completa: 25
   • Municipios con déficit: 122


In [13]:
# === ESTADÍSTICAS DE COBERTURA MUNICIPAL ===
print("\n📈 ESTADÍSTICAS DE COBERTURA EDUCATIVA MUNICIPAL")
print("="*65)

# Estadísticas generales
coverage_stats = pd.DataFrame({
    'Métrica': [
        'Municipios Analizados',
        'Población Total 0-19 años',
        'Necesidad Educativa Estimada',
        'Capacidad Total Disponible',
        'Ratio Cobertura Promedio',
        'Municipios con Cobertura Completa',
        'Municipios con Déficit Educativo',
        'Déficit Total Estimado (plazas)',
        'Cobertura Promedio (%)',
        'Municipios sin Infantil I',
        'Municipios sin ESO'
    ],
    'Valor': [
        len(municipal_coverage_df),
        municipal_coverage_df['total_population_0_19'].sum(),
        municipal_coverage_df['total_estimated_need'].sum(),
        municipal_coverage_df['total_capacity'].sum(),
        municipal_coverage_df['overall_coverage_ratio'].mean(),
        municipal_coverage_df['is_fully_covered'].sum(),
        (municipal_coverage_df['total_deficit'] > 0).sum(),
        municipal_coverage_df['total_deficit'].sum(),
        municipal_coverage_df['coverage_percentage'].mean(),
        (municipal_coverage_df['infantil_i_ciclo_num_centers'] == 0).sum(),
        (municipal_coverage_df['eso_num_centers'] == 0).sum()
    ]
})

display(coverage_stats.round(2))



📈 ESTADÍSTICAS DE COBERTURA EDUCATIVA MUNICIPAL


Unnamed: 0,Métrica,Valor
0,Municipios Analizados,179.0
1,Población Total 0-19 años,1336662.0
2,Necesidad Educativa Estimada,1031788.4
3,Capacidad Total Disponible,151771.58
4,Ratio Cobertura Promedio,2.35
5,Municipios con Cobertura Completa,25.0
6,Municipios con Déficit Educativo,122.0
7,Déficit Total Estimado (plazas),890325.98
8,Cobertura Promedio (%),29.47
9,Municipios sin Infantil I,24.0


In [14]:
# === MUNICIPIOS CON MAYOR DÉFICIT EDUCATIVO ===
print("\n🚨 MUNICIPIOS CON MAYOR DÉFICIT EDUCATIVO (Top 15)")
print("Necesidades no cubiertas por la capacidad actual")
print("="*70)

deficit_municipios = municipal_coverage_df[municipal_coverage_df['total_deficit'] > 0].copy()
top_deficit = deficit_municipios.nlargest(15, 'total_deficit')[
    ['municipality_name', 'total_population_0_19', 'total_estimated_need',
     'total_capacity', 'total_deficit', 'coverage_percentage', 'cycles_covered', 'cycles_with_need']
].copy()

top_deficit['deficit_percentage'] = (top_deficit['total_deficit'] / top_deficit['total_estimated_need'] * 100).round(1)

print("Columnas: Población 0-19, Necesidad Estimada, Capacidad, Déficit, % Cobertura, Ciclos Cubiertos/Total")
display(top_deficit.round(1))



🚨 MUNICIPIOS CON MAYOR DÉFICIT EDUCATIVO (Top 15)
Necesidades no cubiertas por la capacidad actual
Columnas: Población 0-19, Necesidad Estimada, Capacidad, Déficit, % Cobertura, Ciclos Cubiertos/Total


Unnamed: 0,municipality_name,total_population_0_19,total_estimated_need,total_capacity,total_deficit,coverage_percentage,cycles_covered,cycles_with_need,deficit_percentage
168,Madrid,574787,446539.0,37720.2,408818.8,0.0,0,4,91.6
166,Getafe,38730,30583.6,5467.0,25116.6,0.0,0,4,82.1
170,Móstoles,39218,30706.0,5700.4,25005.6,0.0,0,4,81.4
155,Alcalá de Henares,37603,28267.8,3317.7,24950.1,0.0,0,4,88.3
165,Fuenlabrada,36616,27528.8,5202.1,22326.7,0.0,0,4,81.1
167,Leganés,35846,27410.8,5343.8,22067.1,0.0,0,4,80.5
171,Parla,32389,25647.4,4931.7,20715.7,0.0,0,4,80.8
157,Alcorcón,32215,24433.4,3761.3,20672.1,0.0,0,4,84.6
177,Torrejón de Ardoz,29171,22810.2,3940.8,18869.4,0.0,0,4,82.7
156,Alcobendas,25756,19860.0,2479.3,17380.7,0.0,0,4,87.5


In [15]:
# === ANÁLISIS POR CICLO EDUCATIVO ===
print("\n📚 ANÁLISIS DE COBERTURA POR CICLO EDUCATIVO")
print("="*55)

cycles_analysis = []
for cycle in ['infantil_i_ciclo', 'infantil_ii_ciclo', 'primaria', 'eso']:
    config = cycle_config[cycle]

    # Municipios que tienen este ciclo
    municipios_con_ciclo = municipal_coverage_df[
        municipal_coverage_df[f'{cycle}_num_centers'] > 0
    ]

    # Estadísticas del ciclo
    total_need = municipal_coverage_df[f'{cycle}_estimated_need'].sum()
    total_capacity = municipal_coverage_df[f'{cycle}_capacity'].sum()
    municipios_cubiertos = municipal_coverage_df[f'{cycle}_is_covered'].sum()
    deficit_total = municipal_coverage_df[f'{cycle}_deficit'].sum()

    cycles_analysis.append({
        'Ciclo': config['name'],
        'Municipios con Oferta': len(municipios_con_ciclo),
        'Necesidad Total': total_need,
        'Capacidad Total': total_capacity,
        'Municipios Cubiertos': municipios_cubiertos,
        'Déficit Total': deficit_total,
        'Ratio Cobertura': total_capacity / total_need if total_need > 0 else 0,
        '% Municipios Cubiertos': municipios_cubiertos / len(municipal_coverage_df) * 100
    })

cycles_df = pd.DataFrame(cycles_analysis)
display(cycles_df.round(2))



📚 ANÁLISIS DE COBERTURA POR CICLO EDUCATIVO


Unnamed: 0,Ciclo,Municipios con Oferta,Necesidad Total,Capacidad Total,Municipios Cubiertos,Déficit Total,Ratio Cobertura,% Municipios Cubiertos
0,Infantil I,155,158213.4,12819.67,28,145593.07,0.08,15.64
1,Infantil II,179,170823.0,38924.33,61,134105.2,0.23,34.08
2,Primaria,179,407447.2,44543.67,47,364598.43,0.11,26.26
3,ESO,179,295304.8,55517.25,75,248568.85,0.19,41.9


In [16]:
# === MUNICIPIOS SIN OFERTA EDUCATIVA POR CICLO ===
print("\n❌ MUNICIPIOS SIN OFERTA EDUCATIVA POR CICLO")
print("="*50)

for cycle in ['infantil_i_ciclo', 'infantil_ii_ciclo', 'primaria', 'eso']:
    config = cycle_config[cycle]

    municipios_sin_oferta = municipal_coverage_df[
        (municipal_coverage_df[f'{cycle}_num_centers'] == 0) &
        (municipal_coverage_df[f'{cycle}_estimated_need'] > 0)
    ].copy()

    if len(municipios_sin_oferta) > 0:
        print(f"\n🔴 {config['name']} - {len(municipios_sin_oferta)} municipios sin oferta:")
        top_sin_oferta = municipios_sin_oferta.nlargest(10, f'{cycle}_estimated_need')[
            ['municipality_name', f'{cycle}_estimated_need', 'total_centers']
        ]
        print("   Top 10 por necesidad estimada:")
        for _, row in top_sin_oferta.iterrows():
            print(f"   • {row['municipality_name']}: {row[f'{cycle}_estimated_need']:.0f} estudiantes estimados, {row['total_centers']} centros totales")



❌ MUNICIPIOS SIN OFERTA EDUCATIVA POR CICLO

🔴 Infantil I - 24 municipios sin oferta:
   Top 10 por necesidad estimada:
   • Moralzarzal: 298 estudiantes estimados, 3 centros totales
   • Morata de Tajuña: 191 estudiantes estimados, 2 centros totales
   • Talamanca de Jarama: 117 estudiantes estimados, 1 centros totales
   • Valdetorres de Jarama: 107 estudiantes estimados, 1 centros totales
   • Quijorna: 94 estudiantes estimados, 4 centros totales
   • Valdilecha: 89 estudiantes estimados, 1 centros totales
   • Navas del Rey: 89 estudiantes estimados, 1 centros totales
   • Villaconejos: 83 estudiantes estimados, 3 centros totales
   • Pelayos de la Presa: 82 estudiantes estimados, 2 centros totales
   • Navacerrada: 69 estudiantes estimados, 3 centros totales


In [17]:
# === RESUMEN EJECUTIVO DE COBERTURA ===
print("\n🎯 RESUMEN EJECUTIVO - COBERTURA EDUCATIVA MUNICIPAL")
print("="*65)

# Clasificación de municipios por nivel de cobertura
excelente = municipal_coverage_df[municipal_coverage_df['coverage_percentage'] >= 100]
buena = municipal_coverage_df[(municipal_coverage_df['coverage_percentage'] >= 75) & (municipal_coverage_df['coverage_percentage'] < 100)]
regular = municipal_coverage_df[(municipal_coverage_df['coverage_percentage'] >= 50) & (municipal_coverage_df['coverage_percentage'] < 75)]
deficiente = municipal_coverage_df[municipal_coverage_df['coverage_percentage'] < 50]

print(f"📊 CLASIFICACIÓN POR NIVEL DE COBERTURA:")
print(f"   🟢 Excelente (100%): {len(excelente)} municipios")
print(f"   🟡 Buena (75-99%): {len(buena)} municipios")
print(f"   🟠 Regular (50-74%): {len(regular)} municipios")
print(f"   🔴 Deficiente (<50%): {len(deficiente)} municipios")

print(f"\n🎯 INDICADORES CLAVE:")
print(f"   • Cobertura promedio regional: {municipal_coverage_df['coverage_percentage'].mean():.1f}%")
print(f"   • Ratio capacidad/necesidad: {municipal_coverage_df['overall_coverage_ratio'].mean():.2f}")
print(f"   • Déficit educativo total: {municipal_coverage_df['total_deficit'].sum():.0f} plazas")
print(f"   • Población estudiantil analizada: {municipal_coverage_df['total_population_0_19'].sum():.0f} personas")

# Municipios críticos que requieren atención inmediata
criticos = municipal_coverage_df[
    (municipal_coverage_df['coverage_percentage'] < 50) &
    (municipal_coverage_df['total_population_0_19'] > 100)
]

if len(criticos) > 0:
    print(f"\n🚨 MUNICIPIOS CRÍTICOS (>100 hab. y <50% cobertura): {len(criticos)}")
    for _, municipio in criticos.head(5).iterrows():
        print(f"   • {municipio['municipality_name']}: {municipio['coverage_percentage']:.1f}% cobertura, {municipio['total_population_0_19']:.0f} hab. 0-19 años")

print(f"\n✅ Análisis de cobertura educativa municipal completado")
print(f"💡 Los municipios pueden usar estos datos para planificar expansión educativa")



🎯 RESUMEN EJECUTIVO - COBERTURA EDUCATIVA MUNICIPAL
📊 CLASIFICACIÓN POR NIVEL DE COBERTURA:
   🟢 Excelente (100%): 25 municipios
   🟡 Buena (75-99%): 21 municipios
   🟠 Regular (50-74%): 14 municipios
   🔴 Deficiente (<50%): 119 municipios

🎯 INDICADORES CLAVE:
   • Cobertura promedio regional: 29.5%
   • Ratio capacidad/necesidad: 2.35
   • Déficit educativo total: 890326 plazas
   • Población estudiantil analizada: 1336662 personas

🚨 MUNICIPIOS CRÍTICOS (>100 hab. y <50% cobertura): 119
   • Zarzalejo: 25.0% cobertura, 397 hab. 0-19 años
   • Torres de la Alameda: 0.0% cobertura, 1649 hab. 0-19 años
   • Chinchón: 0.0% cobertura, 1084 hab. 0-19 años
   • Ciempozuelos: 0.0% cobertura, 5349 hab. 0-19 años
   • Daganzo de Arriba: 0.0% cobertura, 2800 hab. 0-19 años

✅ Análisis de cobertura educativa municipal completado
💡 Los municipios pueden usar estos datos para planificar expansión educativa



# 📊 DOCUMENTACIÓN COMPLETA - ANÁLISIS EDUCATIVO MUNICIPAL

## 🎯 **OBJETIVO DEL ANÁLISIS**
Este notebook realiza un análisis integral de la capacidad educativa vs. las necesidades demográficas de los municipios, validando si los centros educativos asignados pueden cubrir la demanda poblacional por ciclos educativos.

---

## 📚 **CONFIGURACIÓN DE CICLOS EDUCATIVOS**

### Ciclos Analizados y Rangos de Edad:
| Ciclo | Edad | Años de Permanencia | Descripción |
|-------|------|-------------------|-------------|
| **Infantil I** | 0-2 años | 3 años | Educación inicial temprana |
| **Infantil II** | 3-5 años | 3 años | Educación preescolar |
| **Primaria** | 6-11 años | 6 años | Educación primaria obligatoria |
| **ESO** | 12-15 años | 4 años | Educación secundaria obligatoria |

---

## 🧮 **FÓRMULAS Y CÁLCULOS PRINCIPALES**

### 1. **Estimación de Plazas por Centro Educativo**

**Fórmula Base:**
```
Plazas Estimadas = MAX(Matriculados + Admitidos) ÷ Años de Permanencia
```

**Explicación:**
- Se toma el **máximo histórico** de estudiantes (matriculados + admitidos) entre todos los años disponibles
- Se divide por los años de permanencia del ciclo para estimar la capacidad anual de nuevos ingresos
- **Ejemplo:** Si un centro tuvo máximo 180 estudiantes de primaria y la permanencia es 6 años → 180÷6 = 30 plazas anuales

### 2. **Corrección para Transiciones Automáticas (Primaria)**

**Fórmula:**
```
Solicitudes Admitidas Corregidas = Solicitudes Admitidas + Transiciones Automáticas
Transiciones Automáticas = MAX(Plazas Infantil II del mismo centro)
```

**Justificación:**
- Los estudiantes de Infantil II del mismo centro tienen prioridad automática para Primaria
- No aparecen en las solicitudes de admisión porque es transición interna

### 3. **Indicadores de Ocupación por Centro**

#### **Tasa de Ocupación:**
```
Tasa de Ocupación = Matriculados Actuales ÷ Máximo Histórico Matriculados
```
- **Interpretación:** % de uso de la capacidad histórica máxima del centro

#### **Ratio de Demanda:**
```
Ratio de Demanda = Solicitudes Presentadas ÷ Plazas Estimadas
```
- **Interpretación:** 
  - `> 1.5`: Centro sobredemandado
  - `0.8-1.5`: Demanda equilibrada
  - `< 0.8`: Demanda baja

#### **Eficiencia de Admisión:**
```
Eficiencia de Admisión = Solicitudes Admitidas ÷ Solicitudes Presentadas
```
- **Interpretación:** % de solicitudes que logran ser admitidas

---

## 🏛️ **ANÁLISIS DE COBERTURA MUNICIPAL**

### 4. **Estimación de Necesidades Demográficas**

**Mapeo Población → Necesidades Educativas:**

#### **Infantil I (0-2 años):**
```
Necesidad Estimada = (Población 0-4 años × 3) ÷ 5
```
- **Lógica:** 3 de los 5 años del rango 0-4 corresponden a Infantil I

#### **Infantil II (3-5 años):**
```
Necesidad Estimada = (Población 0-4 años × 2) ÷ 5 + (Población 5-9 años × 1) ÷ 5
```
- **Lógica:** 2 años del rango 0-4 + 1 año del rango 5-9

#### **Primaria (6-11 años):**
```
Necesidad Estimada = (Población 5-9 años × 4) ÷ 5 + (Población 10-14 años × 2) ÷ 5
```
- **Lógica:** 4 años del rango 5-9 + 2 años del rango 10-14

#### **ESO (12-15 años):**
```
Necesidad Estimada = (Población 10-14 años × 3) ÷ 5 + (Población 15-19 años × 1) ÷ 5
```
- **Lógica:** 3 años del rango 10-14 + 1 año del rango 15-19

### 5. **Indicadores de Cobertura Municipal**

#### **Ratio de Cobertura por Ciclo:**
```
Ratio de Cobertura = Capacidad Total del Municipio ÷ Necesidad Estimada
```
- **Interpretación:**
  - `≥ 1.0`: Cobertura completa
  - `0.8-0.99`: Cobertura aceptable (margen 20%)
  - `< 0.8`: Déficit de cobertura

#### **Porcentaje de Cobertura Municipal:**
```
% Cobertura = (Ciclos Cubiertos ÷ Ciclos con Necesidad) × 100
```
- Un ciclo está "cubierto" si su ratio de cobertura ≥ 0.8

#### **Déficit Educativo:**
```
Déficit = MAX(0, Necesidad Estimada - Capacidad Disponible)
```
- Número de plazas faltantes para cubrir la demanda

---

## 📈 **INTERPRETACIÓN DE RESULTADOS**

### **Clasificación de Centros Educativos:**

| Clasificación | Ratio Admisión/Capacidad | Interpretación |
|---------------|---------------------------|----------------|
| **Sobrecapacidad** | ≥ 1.0 | Admiten más estudiantes que su capacidad estimada |
| **Alta Eficiencia** | 0.8 - 0.99 | Utilizan bien su capacidad disponible |
| **Eficiencia Media** | 0.5 - 0.79 | Pueden mejorar el uso de su capacidad |
| **Baja Eficiencia** | < 0.5 | Subutilizan significativamente su capacidad |

### **Clasificación de Municipios:**

| Nivel | % Cobertura | Descripción | Acción Recomendada |
|-------|-------------|-------------|-------------------|
| **🟢 Excelente** | 100% | Todos los ciclos cubiertos | Mantener y optimizar |
| **🟡 Buena** | 75-99% | Mayoría de ciclos cubiertos | Reforzar ciclos deficitarios |
| **🟠 Regular** | 50-74% | Cobertura parcial | Plan de expansión educativa |
| **🔴 Deficiente** | < 50% | Cobertura insuficiente | Intervención prioritaria |

---

## 🎯 **CASOS DE USO Y APLICACIONES**

### **Para Administraciones Municipales:**
1. **Planificación Educativa:** Identificar dónde construir nuevos centros
2. **Asignación de Recursos:** Priorizar inversiones en municipios críticos
3. **Evaluación de Políticas:** Medir el impacto de la expansión educativa

### **Para Centros Educativos:**
1. **Optimización de Capacidad:** Identificar oportunidades de crecimiento
2. **Análisis de Demanda:** Entender patrones de solicitudes
3. **Planificación de Personal:** Ajustar recursos según ocupación

### **Para Familias:**
1. **Elección de Residencia:** Considerar disponibilidad educativa
2. **Planificación Familiar:** Anticipar necesidades educativas futuras

---

## ⚠️ **LIMITACIONES Y CONSIDERACIONES**

### **Limitaciones del Análisis:**
1. **Datos Históricos:** Los cálculos se basan en patrones pasados que pueden cambiar
2. **Movilidad Estudiantil:** No considera estudiantes que cruzan fronteras municipales
3. **Preferencias Familiares:** Asume distribución uniforme de preferencias educativas
4. **Factores Socioeconómicos:** No considera variables de accesibilidad económica

### **Supuestos del Modelo:**
1. **Permanencia Completa:** Asume que estudiantes completan todo el ciclo
2. **Distribución Etaria Uniforme:** Asume distribución pareja dentro de rangos de edad
3. **Capacidad Constante:** No considera variaciones estacionales o de recursos

---

## 🔍 **METODOLOGÍA DE VALIDACIÓN**

### **Controles de Calidad Aplicados:**
1. **Consistencia Temporal:** Verificación de datos entre años
2. **Validación Cruzada:** Comparación entre fuentes (admisiones vs. matrícula)
3. **Rangos Razonables:** Verificación de valores atípicos
4. **Completitud de Datos:** Identificación de municipios sin datos demográficos

### **Indicadores de Fiabilidad:**
- **Cobertura de Datos:** 179.0% de municipios con datos completos
- **Años Analizados:** 2021-2023
- **Centros Validados:** 1464 centros con datos consistentes

---

## 📊 **RESUMEN EJECUTIVO DE HALLAZGOS**

### **Principales Conclusiones:**
1. **Cobertura Regional:** 29.5% de cobertura promedio
2. **Municipios Críticos:** 119 requieren atención inmediata
3. **Déficit Total:** 890326 plazas educativas necesarias
4. **Población Analizada:** 1,336,662 personas de 0-19 años

### **Recomendaciones Estratégicas:**
1. **Prioridad Alta:** Municipios con >100 habitantes y <50% cobertura
2. **Ciclos Críticos:** Primaria (364598), ESO (248569) requieren expansión prioritaria
3. **Optimización:** 32 centros pueden aumentar eficiencia

---

## 🛠️ **HERRAMIENTAS Y TECNOLOGÍAS UTILIZADAS**

- **Python 3.x** con pandas, numpy, matplotlib, seaborn
- **Jupyter Notebook** para análisis interactivo
- **Datos Oficiales** de educación y demografía municipal
- **Metodología Estadística** descriptiva y de estimación

---

*📅 Análisis generado el: Agosto 2025*
*📍 Región: Comunidad de Madrid*
*🔄 Última actualización de datos: 2024*


📖 Documentación completa generada
💡 Esta documentación incluye todas las fórmulas, metodología e interpretación de resultados
