# Análisis de Años de Cobertura: Mapping Review IA y ML en Educación Matemática K-12\n
\n
**MQ8: ¿Qué años cubren los estudios?**\n
\n
Este notebook analiza los períodos de tiempo cubiertos por los estudios sobre IA y ML en educación matemática K-12.

## 1. Configuración del Entorno

In [None]:
# Instalación de dependencias\n
!pip install pandas numpy matplotlib seaborn plotly

In [None]:
# Importación de librerías\n
import pandas as pd\n
import numpy as np\n
import matplotlib.pyplot as plt\n
import seaborn as sns\n
import plotly.express as px\n
import plotly.graph_objects as go\n
from plotly.subplots import make_subplots\n
import warnings\n
warnings.filterwarnings('ignore')\n
\n
# Configuración de estilo\n
plt.style.use('seaborn-v0_8')\n
sns.set_palette(\"husl\")\n
plt.rcParams['figure.figsize'] = (12, 8)\n
plt.rcParams['font.size'] = 12\n
\n
# Configuración para mostrar todas las columnas\n
pd.set_option('display.max_columns', None)\n
pd.set_option('display.max_colwidth', None)

## 2. Carga de Datos desde GitHub

In [None]:
# Cargar el dataset desde GitHub\n
# IMPORTANTE: Cambiar la URL por tu repositorio real\n
url = \"https://raw.githubusercontent.com/TU_USUARIO/TU_REPOSITORIO/main/MappingReview.csv\"\n
df = pd.read_csv(url, sep=';', encoding='utf-8')\n
\n
print(f\"Dataset cargado: {df.shape[0]} filas y {df.shape[1]} columnas\")\n
print(\"\\nPrimeras 5 filas:\")\n
df.head()

## 3. Análisis de Años de Cobertura (MQ8)

In [None]:
# Convertir Year a numérico\n
df['Year'] = pd.to_numeric(df['Year'], errors='coerce')\n
\n
# Análisis básico de años\n
year_counts = df['Year'].value_counts().sort_index()\n
\n
print(\"=== ANÁLISIS DE AÑOS DE COBERTURA ===\")\n
print(f\"Rango de años: {df['Year'].min()} - {df['Year'].max()}\")\n
print(f\"Total de años únicos: {len(year_counts)}\")\n
print(f\"Año con más publicaciones: {year_counts.idxmax()} ({year_counts.max()} publicaciones)\")\n
print(f\"Año con menos publicaciones: {year_counts.idxmin()} ({year_counts.min()} publicaciones)\")\n
print(f\"Promedio de publicaciones por año: {year_counts.mean():.1f}\")\n
\n
print(\"\\nDistribución por año:\")\n
for year, count in year_counts.items():\n
    percentage = (count / len(df)) * 100\n
    print(f\"{year}: {count} publicaciones ({percentage:.1f}%)\")

In [None]:
# Gráfico de barras para distribución por año\n
plt.figure(figsize=(15, 8))\n
bars = plt.bar(year_counts.index, year_counts.values, color='lightblue', alpha=0.7)\n
plt.xlabel('Año', fontsize=14)\n
plt.ylabel('Número de Publicaciones', fontsize=14)\n
plt.title('Distribución de Publicaciones por Año', fontsize=16, fontweight='bold')\n
plt.grid(True, alpha=0.3, axis='y')\n
plt.xticks(year_counts.index, rotation=45)\n
\n
# Agregar valores en las barras\n
for i, (bar, count) in enumerate(zip(bars, year_counts.values)):\n
    plt.text(year_counts.index[i], count + 0.5, str(count), ha='center', va='bottom', fontweight='bold')\n
\n
plt.tight_layout()\n
plt.show()

In [None]:
# Gráfico de líneas temporal\n
plt.figure(figsize=(15, 8))\n
plt.plot(year_counts.index, year_counts.values, marker='o', linewidth=3, markersize=8, color='#2E8B57')\n
plt.fill_between(year_counts.index, year_counts.values, alpha=0.3, color='#2E8B57')\n
plt.xlabel('Año', fontsize=14)\n
plt.ylabel('Número de Publicaciones', fontsize=14)\n
plt.title('Evolución Temporal de Publicaciones', fontsize=16, fontweight='bold')\n
plt.grid(True, alpha=0.3)\n
plt.xticks(year_counts.index, rotation=45)\n
\n
# Agregar valores en los puntos\n
for i, (year, count) in enumerate(zip(year_counts.index, year_counts.values)):\n
    plt.text(year, count + 0.5, str(count), ha='center', va='bottom', fontweight='bold')\n
\n
plt.tight_layout()\n
plt.show()

In [None]:
# Gráfico interactivo con Plotly\n
fig = px.line(x=year_counts.index, y=year_counts.values,\n
              title='Evolución Temporal de Publicaciones',\n
              labels={'x': 'Año', 'y': 'Número de Publicaciones'})\n
\n
fig.update_traces(mode='lines+markers', line=dict(width=3), marker=dict(size=8))\n
fig.update_layout(\n
    title_font_size=16,\n
    xaxis_title_font_size=14,\n
    yaxis_title_font_size=14,\n
    hovermode='x unified'\n
)\n
\n
fig.show()

## 4. Análisis de Períodos de Tiempo

In [None]:
# Definir períodos de tiempo\n
def categorize_period(year):\n
    if pd.isna(year):\n
        return 'Unknown'\n
    elif year < 2020:\n
        return 'Pre-2020'\n
    elif year == 2020:\n
        return '2020'\n
    elif year == 2021:\n
        return '2021'\n
    elif year == 2022:\n
        return '2022'\n
    elif year == 2023:\n
        return '2023'\n
    elif year == 2024:\n
        return '2024'\n
    else:\n
        return '2025+'\n
\n
df['Period'] = df['Year'].apply(categorize_period)\n
period_counts = df['Period'].value_counts()\n
\n
print(\"=== DISTRIBUCIÓN POR PERÍODOS ===\")\n
for period, count in period_counts.items():\n
    percentage = (count / len(df)) * 100\n
    print(f\"{period}: {count} publicaciones ({percentage:.1f}%)\")\n
\n
# Gráfico de pastel para períodos\n
plt.figure(figsize=(12, 8))\n
colors = plt.cm.Set3(np.linspace(0, 1, len(period_counts)))\n
\n
wedges, texts, autotexts = plt.pie(period_counts.values, labels=period_counts.index, \n
                                    autopct='%1.1f%%', colors=colors, startangle=90)\n
\n
plt.title('Distribución de Publicaciones por Período', fontsize=16, fontweight='bold')\n
plt.axis('equal')\n
\n
# Mejorar la legibilidad de las etiquetas\n
for autotext in autotexts:\n
    autotext.set_color('white')\n
    autotext.set_fontweight('bold')\n
\n
plt.tight_layout()\n
plt.show()

## 5. Análisis de Tendencias Temporales

In [None]:
# Análisis de tendencias\n
print(\"=== ANÁLISIS DE TENDENCIAS TEMPORALES ===\")\n
\n
# Calcular crecimiento anual\n
yearly_growth = year_counts.pct_change() * 100\n
\n
print(\"Crecimiento anual (%):\")\n
for year, growth in yearly_growth.items():\n
    if pd.notna(growth):\n
        print(f\"{year}: {growth:.1f}%\")\n
\n
# Identificar picos y valles\n
peak_year = year_counts.idxmax()\n
valley_year = year_counts.idxmin()\n
\n
print(f\"\\nAño pico: {peak_year} ({year_counts.max()} publicaciones)\")\n
print(f\"Año valle: {valley_year} ({year_counts.min()} publicaciones)\")\n
\n
# Análisis de tendencia general\n
if len(year_counts) > 1:\n
    first_year = year_counts.index[0]\n
    last_year = year_counts.index[-1]\n
    first_count = year_counts.iloc[0]\n
    last_count = year_counts.iloc[-1]\n
    total_growth = ((last_count - first_count) / first_count) * 100\n
    \n
    print(f\"\\nCrecimiento total ({first_year} a {last_year}): {total_growth:.1f}%\")\n
    print(f\"Promedio anual: {year_counts.mean():.1f} publicaciones\")\n
    print(f\"Desviación estándar: {year_counts.std():.1f} publicaciones\")

In [None]:
# Gráfico de tendencias con línea de tendencia\n
plt.figure(figsize=(15, 8))\n
\n
# Gráfico de barras\n
bars = plt.bar(year_counts.index, year_counts.values, color='lightblue', alpha=0.7, label='Publicaciones')\n
\n
# Línea de tendencia\n
z = np.polyfit(year_counts.index, year_counts.values, 1)\n
p = np.poly1d(z)\n
plt.plot(year_counts.index, p(year_counts.index), \"r--\", linewidth=2, label='Tendencia')\n
\n
plt.xlabel('Año', fontsize=14)\n
plt.ylabel('Número de Publicaciones', fontsize=14)\n
plt.title('Tendencias Temporales con Línea de Tendencia', fontsize=16, fontweight='bold')\n
plt.legend()\n
plt.grid(True, alpha=0.3, axis='y')\n
plt.xticks(year_counts.index, rotation=45)\n
\n
# Agregar valores en las barras\n
for i, (bar, count) in enumerate(zip(bars, year_counts.values)):\n
    plt.text(year_counts.index[i], count + 0.5, str(count), ha='center', va='bottom', fontweight='bold')\n
\n
plt.tight_layout()\n
plt.show()

## 6. Análisis de Cobertura por Tipo de Publicación

In [None]:
# Análisis de cobertura por tipo de publicación\n
type_year_analysis = df.groupby(['Type of Publication', 'Year']).size().unstack(fill_value=0)\n
\n
print(\"=== COBERTURA TEMPORAL POR TIPO DE PUBLICACIÓN ===\")\n
print(type_year_analysis)\n
\n
# Gráfico de líneas por tipo\n
plt.figure(figsize=(15, 8))\n
colors = plt.cm.Set3(np.linspace(0, 1, len(type_year_analysis.columns)))\n
\n
for i, pub_type in enumerate(type_year_analysis.index):\n
    plt.plot(type_year_analysis.columns, type_year_analysis.loc[pub_type], \n
             marker='o', linewidth=2, label=pub_type, color=colors[i])\n
\n
plt.title('Evolución Temporal por Tipo de Publicación', fontsize=16, fontweight='bold')\n
plt.xlabel('Año', fontsize=14)\n
plt.ylabel('Número de Publicaciones', fontsize=14)\n
plt.legend(title='Tipo de Publicación', bbox_to_anchor=(1.05, 1), loc='upper left')\n
plt.grid(True, alpha=0.3)\n
plt.xticks(rotation=45)\n
plt.tight_layout()\n
plt.show()

In [None]:
# Gráfico de área apilada\n
fig = px.area(type_year_analysis, title='Evolución Temporal por Tipo de Publicación')\n
\n
fig.update_layout(\n
    title_font_size=16,\n
    xaxis_title='Año',\n
    yaxis_title='Número de Publicaciones',\n
    hovermode='x unified'\n
)\n
\n
fig.show()

## 7. Análisis de Cobertura por Fuente

In [None]:
# Análisis de cobertura por fuente\n
source_year_analysis = df.groupby(['Source', 'Year']).size().unstack(fill_value=0)\n
\n
print(\"=== COBERTURA TEMPORAL POR FUENTE ===\")\n
print(source_year_analysis)\n
\n
# Gráfico de calor\n
plt.figure(figsize=(12, 8))\n
sns.heatmap(source_year_analysis, annot=True, fmt='d', cmap='YlOrRd', cbar_kws={'label': 'Número de Publicaciones'})\n
plt.title('Cobertura Temporal por Fuente', fontsize=16, fontweight='bold')\n
plt.xlabel('Año', fontsize=14)\n
plt.ylabel('Fuente', fontsize=14)\n
plt.tight_layout()\n
plt.show()

## 8. Análisis de Gaps y Continuidad

In [None]:
# Análisis de gaps temporales\n
all_years = set(range(int(df['Year'].min()), int(df['Year'].max()) + 1))\n
covered_years = set(year_counts.index)\n
gap_years = all_years - covered_years\n
\n
print(\"=== ANÁLISIS DE GAPS TEMPORALES ===\")\n
print(f\"Rango completo: {min(all_years)} - {max(all_years)}\")\n
print(f\"Años cubiertos: {len(covered_years)}\")\n
print(f\"Años con gaps: {len(gap_years)}\")\n
\n
if gap_years:\n
    print(f\"Años sin publicaciones: {sorted(gap_years)}\")\n
else:\n
    print(\"No hay gaps temporales - cobertura continua\")\n
\n
# Análisis de continuidad\n
coverage_percentage = (len(covered_years) / len(all_years)) * 100\n
print(f\"\\nPorcentaje de cobertura temporal: {coverage_percentage:.1f}%\")\n
\n
# Identificar períodos de mayor actividad\n
recent_years = [year for year in year_counts.index if year >= 2020]\n
recent_publications = sum(year_counts[year] for year in recent_years)\n
recent_percentage = (recent_publications / len(df)) * 100\n
\n
print(f\"\\nPublicaciones desde 2020: {recent_publications} ({recent_percentage:.1f}%)\")\n
print(f\"Promedio anual desde 2020: {recent_publications / len(recent_years):.1f} publicaciones\")

In [None]:
# Gráfico de cobertura temporal\n
plt.figure(figsize=(15, 8))\n
\n
# Crear línea de tiempo\n
timeline_years = list(range(int(df['Year'].min()), int(df['Year'].max()) + 1))\n
timeline_coverage = [1 if year in year_counts.index else 0 for year in timeline_years]\n
\n
# Gráfico de barras para cobertura\n
bars = plt.bar(timeline_years, timeline_coverage, color=['green' if c == 1 else 'red' for c in timeline_coverage], alpha=0.7)\n
\n
plt.xlabel('Año', fontsize=14)\n
plt.ylabel('Cobertura', fontsize=14)\n
plt.title('Cobertura Temporal de Publicaciones', fontsize=16, fontweight='bold')\n
plt.yticks([0, 1], ['Sin Publicaciones', 'Con Publicaciones'])\n
plt.grid(True, alpha=0.3, axis='x')\n
\n
# Agregar etiquetas para años con publicaciones\n
for year in year_counts.index:\n
    plt.text(year, 0.5, str(year_counts[year]), ha='center', va='center', fontweight='bold')\n
\n
plt.tight_layout()\n
plt.show()

## 9. Resumen y Conclusiones

In [None]:
# Generar resumen ejecutivo\n
print(\"=== RESUMEN EJECUTIVO ===\\n\")\n
\n
print(f\"📊 Rango de años: {df['Year'].min()} - {df['Year'].max()}\")\n
print(f\"📝 Total de años únicos: {len(year_counts)}\")\n
print(f\"📈 Año con más publicaciones: {year_counts.idxmax()} ({year_counts.max()} publicaciones)\")\n
print(f\"📉 Año con menos publicaciones: {year_counts.idxmin()} ({year_counts.min()} publicaciones)\")\n
print(f\"📊 Promedio anual: {year_counts.mean():.1f} publicaciones\")\n
\n
# Análisis de tendencias\n
if len(year_counts) > 1:\n
    first_year = year_counts.index[0]\n
    last_year = year_counts.index[-1]\n
    first_count = year_counts.iloc[0]\n
    last_count = year_counts.iloc[-1]\n
    total_growth = ((last_count - first_count) / first_count) * 100\n
    \n
    print(f\"📈 Crecimiento total ({first_year} a {last_year}): {total_growth:.1f}%\")\n
\n
# Análisis de cobertura\n
coverage_percentage = (len(covered_years) / len(all_years)) * 100\n
print(f\"🌐 Cobertura temporal: {coverage_percentage:.1f}%\")\n
\n
# Análisis de gaps\n
if gap_years:\n
    print(f\"⚠️ Años con gaps: {len(gap_years)}\")\n
else:\n
    print(\"✅ Cobertura temporal continua\")\n
\n
# Período más activo\n
most_active_period = period_counts.idxmax()\n
print(f\"🏆 Período más activo: {most_active_period} ({period_counts.max()} publicaciones)\")\n
\n
print(\"\\n=== CONCLUSIONES ===\")\n
print(\"1. El campo muestra una evolución temporal significativa\")\n
print(\"2. Hay períodos de mayor actividad investigativa\")\n
print(\"3. La cobertura temporal es amplia\")\n
print(\"4. Existen tendencias de crecimiento en años recientes\")