# Análisis Profesional de Titulación en la Región de Los Ríos (2007-2024)

> **Fuente de datos:** Este análisis utiliza información y datasets extraídos de la plataforma oficial [Mi Futuro](https://www.mifuturo.cl/), portal del Ministerio de Educación de Chile.

Este notebook presenta un análisis exhaustivo y visualmente profesional sobre la evolución de las titulaciones en la Región de Los Ríos, Chile, entre 2007 y 2024. Se emplean visualizaciones inspiradas en The Economist, priorizando la accesibilidad, claridad y rigor analítico.

---

## 1. Preparación del entorno de análisis

Para el análisis y visualización de los datos se utilizan las librerías `pandas` y `plotly`. Estas herramientas permiten una manipulación eficiente de datos y la creación de gráficos interactivos y de alta calidad, ideales para estudios educativos y de tendencias temporales.


In [1]:
# Importar librerías para análisis y visualización de datos
import pandas as pd
import plotly.graph_objects as go
import plotly.express as px

---

## 2. Carga y exploración de datos de titulaciones totales

Se cargan los datos limpios de titulaciones totales por año desde un archivo CSV. Es fundamental trabajar con datos consistentes y bien estructurados para garantizar la validez del análisis. A continuación, se muestra una vista previa del dataset y se describe su estructura.

In [2]:
# Cargar datos de titulaciones totales por año
df_total = pd.read_csv('../data/clean/titulacion_los_rios_total.csv')
df_total.head()

Unnamed: 0,Año,Titulación Total
0,2007,1757
1,2008,1800
2,2009,2310
3,2010,1846
4,2011,2329


---

## 3. Visualización: Evolución anual de titulaciones totales

A continuación se presenta un gráfico de líneas que muestra la evolución del total de titulaciones en la región. El diseño sigue el estilo de The Economist, con una paleta accesible y etiquetas claras para facilitar la interpretación de tendencias y posibles hitos.

In [None]:
# Visualización profesional de la evolución anual de titulaciones totales
fig = go.Figure()
fig.add_trace(go.Scatter(
    x=df_total['Año'],
    y=df_total['Titulación Total'],
    mode='lines+markers+text',
    line=dict(color='#d62728', width=3),
    marker=dict(size=7, color='#d62728'),
    text=df_total['Titulación Total'].apply(lambda x: f'{x:,}'),
    textposition=[
        'bottom center' if year in [2008, 2010, 2012, 2020] else 'top center' 
        for year in df_total['Año']
    ],
    textfont=dict(family='Georgia, serif', size=10, color='#1e293b'),
    name='Titulaciones',
    hovertemplate='<b>Año %{x}</b><br>Titulaciones: %{y:,}<extra></extra>'
) )
fig.update_layout(
    title=dict(
        text='<b>Evolución de Titulaciones en Los Ríos (2007-2024)</b><br><sub>Número total de profesionales titulados por año</sub>',
        x=0,
        font=dict(size=20, family='Georgia, serif', color='#1e293b')
    ),
    xaxis=dict(
        title='',
        showgrid=False,
        tickfont=dict(family='Georgia, serif', size=12),
        linecolor='#d1d5db',
        tickcolor='#d1d5db',
        range=[2006.5, 2024.5],
        tickmode='array',
        tickvals=list(range(2007, 2025)),
        ticktext=[str(year) for year in range(2007, 2025)]
    ),
    yaxis=dict(
        title='',
        showgrid=True,
        gridcolor='#f3f4f6',
        gridwidth=1,
        tickfont=dict(family='Georgia, serif', size=12),
        linecolor='#d1d5db',
        tickcolor='#d1d5db',
        tickformat=',',
        range=[0, 6000]
    ),
    plot_bgcolor='white',
    paper_bgcolor='white',
    font=dict(family='Georgia, serif', color='#1e293b'),
    showlegend=False,a
    width=900,
    height=500,
    margin=dict(l=80, r=80, t=100, b=60)
 )
fig.show()

---

## 4. Carga y exploración de datos por tipo de programa

Para comprender la diversificación de la oferta educativa, se cargan los datos de titulaciones diferenciados por tipo de programa: Pregrado, Posgrado y Postítulo. Analizar estos subgrupos permite identificar tendencias y cambios en la formación profesional regional.

In [4]:
# Cargar datos de titulaciones por tipo de programa
df_tipo = pd.read_csv('../data/clean/titulacion_los_rios_tipo.csv')
df_tipo.head()

Unnamed: 0,Año,Pregrado,Posgrado,Postítulo
0,2007,1523,113,121
1,2008,1761,6,33
2,2009,1964,153,193
3,2010,1585,157,142
4,2011,2033,154,142


---

## 5. Visualización: Titulaciones por tipo de programa

El siguiente gráfico compara la evolución de las titulaciones según el tipo de programa. Se emplean colores accesibles y una leyenda clara para facilitar la interpretación de las diferencias y tendencias entre Pregrado, Posgrado y Postítulo.

In [5]:
# Visualización profesional de titulaciones por tipo de programa
colores = {
    'Pregrado': '#0072B2',
    'Posgrado': '#D55E00',
    'Postítulo': '#009E73'
}
fig_tipo = go.Figure()
for i, tipo in enumerate(['Pregrado', 'Posgrado', 'Postítulo']):
    if tipo == 'Pregrado':
        textpositions = ['bottom center' if (año == 2020) else 'top center' for año in df_tipo['Año']]
    else:
        textpositions = ['top center'] * len(df_tipo['Año'])
    fig_tipo.add_trace(go.Scatter(
        x=df_tipo['Año'],
        y=df_tipo[tipo],
        mode='markers+lines+text',
        line=dict(color=colores[tipo], width=3),
        marker=dict(size=10, color=colores[tipo], symbol='circle'),
        text=df_tipo[tipo].apply(lambda x: f'{x:,}'),
        textposition=textpositions,
        textfont=dict(family='Georgia, serif', size=9, color=colores[tipo]),
        name=tipo,
        legendgroup=tipo,
        showlegend=False,
        legendrank=i,
        hovertemplate='<b>%{fullData.name}</b>: %{y:,}<extra></extra>'
) )
    fig_tipo.add_trace(go.Scatter(
        x=[None],
        y=[None],
        mode='markers',
        marker=dict(size=11, color=colores[tipo], symbol='circle', line=dict(width=0)),
        name=tipo,
        legendgroup=tipo,
        showlegend=True,
        legendrank=i,
        hoverinfo='skip'
) )
fig_tipo.update_layout(
    title=dict(
        text='<b>Evolución de Titulaciones por Tipo en Los Ríos (2007-2024)</b>',
        x=0,
        font=dict(size=20, family='Georgia, serif', color='#1e293b')
    ),
    xaxis=dict(
        title='',
        showgrid=False,
        tickfont=dict(family='Georgia, serif', size=12),
        linecolor='#d1d5db',
        tickcolor='#d1d5db',
        range=[2006.5, 2024.5],
        tickmode='array',
        tickvals=list(range(2007, 2025)),
        ticktext=[str(year) for year in range(2007, 2025)]
    ),
    yaxis=dict(
        title='',
        showgrid=True,
        gridcolor='#f3f4f6',
        gridwidth=1,
        tickfont=dict(family='Georgia, serif', size=12),
        linecolor='#d1d5db',
        tickcolor='#d1d5db',
        tickformat=',',
        range=[0, 5200]
    ),
    plot_bgcolor='white',
    paper_bgcolor='white',
    font=dict(family='Georgia, serif', color='#1e293b'),
    showlegend=True,
    legend=dict(
        orientation="h",
        yanchor="top",
        y=1.05,
        xanchor="right",
        x=1,
        font=dict(family='Georgia, serif', size=13),
        bgcolor='rgba(0,0,0,0)',
        bordercolor=None,
        borderwidth=0,
        itemwidth=30,
        itemsizing='constant',
        traceorder='normal',
        title_text='',
        valign='middle',
        entrywidth=60,
        entrywidthmode='pixels'
    ),
    width=1100,
    height=700,
    margin=dict(l=80, r=80, t=120, b=100),
    hovermode='x unified'
 )
fig_tipo.show()

---

## 6. Carga y exploración de datos por sexo

El análisis de titulaciones por sexo permite evaluar la equidad de género en la educación superior regional. Se cargan los datos diferenciados por sexo y se muestra una vista previa del dataset.

In [6]:
# Cargar datos de titulaciones por sexo
df_sexo = pd.read_csv('../data/clean/titulacion_los_rios_sexo.csv')
df_sexo.head()

Unnamed: 0,Año,Hombre,Mujer
0,2007,876,881
1,2008,773,1027
2,2009,1025,1285
3,2010,892,954
4,2011,1006,1309


---

## 7. Visualización: Titulaciones por sexo

El siguiente gráfico compara la evolución de titulaciones entre hombres y mujeres. Se utiliza una paleta accesible y una leyenda personalizada para facilitar la comparación y el análisis de tendencias de paridad o brecha de género.

In [7]:
# Visualización profesional de titulaciones por sexo
colores_sexo = {
    'Hombre': '#0072B2',
    'Mujer': '#D55E00'
}
fig_sexo = go.Figure()
hombre_abajo = [2007, 2010, 2012, 2016, 2020]
for sexo in ['Hombre', 'Mujer']:
    if sexo == 'Hombre':
        textpositions = ['bottom center' if año in hombre_abajo else 'top center' for año in df_sexo['Año']]
    elif sexo == 'Mujer':
        textpositions = ['bottom center' if año == 2020 else 'top center' for año in df_sexo['Año']]
    fig_sexo.add_trace(go.Scatter(
        x=df_sexo['Año'],
        y=df_sexo[sexo],
        mode='lines+markers+text',
        line=dict(color=colores_sexo[sexo], width=3),
        marker=dict(size=6, color=colores_sexo[sexo]),
        text=df_sexo[sexo].apply(lambda x: f'{x:,}'),
        textposition=textpositions,
        textfont=dict(family='Georgia, serif', size=9, color=colores_sexo[sexo]),
        name=sexo,
        showlegend=False,
        hovertemplate=f'<b>{sexo}</b>: %{{y:,}}<extra></extra>'
    ))
    fig_sexo.add_trace(go.Scatter(
        x=[None],
        y=[None],
        mode='markers',
        marker=dict(size=11, color=colores_sexo[sexo], symbol='circle', line=dict(width=0)),
        name=sexo,
        showlegend=True,
        hoverinfo='skip'
    ))
fig_sexo.update_layout(
    title=dict(
        text='<b>Evolución de Titulaciones por Sexo en Los Ríos (2007-2024)</b>',
        x=0,
        font=dict(size=20, family='Georgia, serif', color='#1e293b')
    ),
    xaxis=dict(
        title='',
        showgrid=False,
        tickfont=dict(family='Georgia, serif', size=12),
        linecolor='#d1d5db',
        tickcolor='#d1d5db',
        range=[2006.5, 2024.5],
        tickmode='array',
        tickvals=list(range(2007, 2025)),
        ticktext=[str(year) for year in range(2007, 2025)]
    ),
    yaxis=dict(
        title='',
        showgrid=True,
        gridcolor='#f3f4f6',
        gridwidth=1,
        tickfont=dict(family='Georgia, serif', size=12),
        linecolor='#d1d5db',
        tickcolor='#d1d5db',
        tickformat=',',
        range=[0, 3200]
    ),
    plot_bgcolor='white',
    paper_bgcolor='white',
    font=dict(family='Georgia, serif', color='#1e293b'),
    showlegend=True,
    legend=dict(
        orientation="h",
        yanchor="top",
        y=1.05,
        xanchor="right",
        x=1,
        font=dict(family='Georgia, serif', size=12),
        bgcolor='rgba(0,0,0,0)',
        bordercolor=None,
        borderwidth=0,
        itemwidth=30,
        itemsizing='constant',
        traceorder='normal',
        title_text='',
        valign='middle',
        entrywidth=60,
        entrywidthmode='pixels'
    ),
    width=1100,
    height=700,
    margin=dict(l=80, r=80, t=120, b=60),
    hovermode='x unified'
)
fig_sexo.show()

---

## 8. Resumen estadístico y principales hallazgos

Se presentan indicadores clave del período analizado: totales, promedios, máximos, mínimos y crecimiento acumulado. Este resumen permite identificar tendencias, hitos y oportunidades para la toma de decisiones en política educativa y planificación regional.

In [9]:
# Resumen estadístico y hallazgos clave
print("=== RESUMEN ESTADÍSTICO ===")
print(f"Período analizado: {df_total['Año'].min()} - {df_total['Año'].max()}")
print(f"Total de titulaciones en el período: {df_total['Titulación Total'].sum():,}")
print(f"Promedio anual: {df_total['Titulación Total'].mean():.0f} titulaciones")
print(f"Año con más titulaciones: {df_total.loc[df_total['Titulación Total'].idxmax(), 'Año']} ({df_total['Titulación Total'].max():,} titulaciones)")
print(f"Año con menos titulaciones: {df_total.loc[df_total['Titulación Total'].idxmin(), 'Año']} ({df_total['Titulación Total'].min():,} titulaciones)")

# Calcular crecimiento
crecimiento_total = ((df_total['Titulación Total'].iloc[-1] / df_total['Titulación Total'].iloc[0]) - 1) * 100
print(f"Crecimiento total (2007-2024): {crecimiento_total:.1f}%")

# Tabla resumen por quinquenios
df_total['Quinquenio'] = pd.cut(df_total['Año'], 
                         bins=[2006, 2010, 2015, 2020, 2024], 
                         labels=['2007-2010', '2011-2015', '2016-2020', '2021-2024'])
quinquenio_summary = df_total.groupby('Quinquenio', observed=False)['Titulación Total'].agg(['sum', 'mean']).round(0)
quinquenio_summary.columns = ['Total Titulaciones', 'Promedio Anual']
print("\n=== RESUMEN POR PERÍODOS ===")
print(quinquenio_summary)

=== RESUMEN ESTADÍSTICO ===
Período analizado: 2007 - 2024
Total de titulaciones en el período: 59,170
Promedio anual: 3287 titulaciones
Año con más titulaciones: 2024 (5,098 titulaciones)
Año con menos titulaciones: 2007 (1,757 titulaciones)
Crecimiento total (2007-2024): 190.2%

=== RESUMEN POR PERÍODOS ===
            Total Titulaciones  Promedio Anual
Quinquenio                                    
2007-2010                 7713          1928.0
2011-2015                13756          2751.0
2016-2020                18208          3642.0
2021-2024                19493          4873.0


---

## Conclusión

El análisis de la titulación en la Región de Los Ríos revela un crecimiento sostenido en la formación de profesionales durante el período 2007-2024, con un marcado predominio de los programas de pregrado y una tendencia creciente hacia la paridad de género. Estos resultados reflejan la consolidación del sistema educativo regional y su capacidad de adaptación a los desafíos sociales y económicos, posicionando a Los Ríos como un referente en el desarrollo de capital humano en el sur de Chile.