# Análisis de Tipos de Artículos: Mapping Review IA y ML en Educación Matemática K-12\n
\n
**MQ3: ¿Qué tipo de artículos se publican?**\n
\n
Este notebook analiza la distribución y características de los diferentes tipos de publicaciones en el campo de IA y ML en educación matemática K-12.

## 1. Configuración del Entorno

In [None]:
# Instalación de dependencias\n
!pip install pandas numpy matplotlib seaborn plotly

In [None]:
# Importación de librerías\n
import pandas as pd\n
import numpy as np\n
import matplotlib.pyplot as plt\n
import seaborn as sns\n
import plotly.express as px\n
import plotly.graph_objects as go\n
from plotly.subplots import make_subplots\n
import warnings\n
warnings.filterwarnings('ignore')\n
\n
# Configuración de estilo\n
plt.style.use('seaborn-v0_8')\n
sns.set_palette(\"husl\")\n
plt.rcParams['figure.figsize'] = (12, 8)\n
plt.rcParams['font.size'] = 12\n
\n
# Configuración para mostrar todas las columnas\n
pd.set_option('display.max_columns', None)\n
pd.set_option('display.max_colwidth', None)

## 2. Carga de Datos desde GitHub

In [None]:
# Cargar el dataset desde GitHub\n
# IMPORTANTE: Cambiar la URL por tu repositorio real\n
url = \"https://raw.githubusercontent.com/TU_USUARIO/TU_REPOSITORIO/main/MappingReview.csv\"\n
df = pd.read_csv(url, sep=';', encoding='utf-8')\n
\n
print(f\"Dataset cargado: {df.shape[0]} filas y {df.shape[1]} columnas\")\n
print(\"\\nPrimeras 5 filas:\")\n
df.head()

## 3. Análisis de Tipos de Publicación (MQ3)

In [None]:
# Análisis de tipos de publicación\n
type_counts = df['Type of Publication'].value_counts()\n
type_percentages = (type_counts / len(df)) * 100\n
\n
print(\"=== DISTRIBUCIÓN DE TIPOS DE PUBLICACIÓN ===\")\n
for pub_type, count in type_counts.items():\n
    percentage = type_percentages[pub_type]\n
    print(f\"{pub_type}: {count} publicaciones ({percentage:.1f}%)\")\n
\n
print(f\"\\nTotal de tipos únicos: {len(type_counts)}\")\n
print(f\"Tipo más común: {type_counts.index[0]} ({type_counts.iloc[0]} publicaciones)\")

In [None]:
# Gráfico de pastel para tipos de publicación\n
plt.figure(figsize=(12, 8))\n
colors = plt.cm.Set3(np.linspace(0, 1, len(type_counts)))\n
\n
wedges, texts, autotexts = plt.pie(type_counts.values, labels=type_counts.index, \n
                                    autopct='%1.1f%%', colors=colors, startangle=90,\n
                                    textprops={'fontsize': 10})\n
\n
plt.title('Distribución de Tipos de Publicación', fontsize=16, fontweight='bold')\n
plt.axis('equal')\n
\n
# Mejorar la legibilidad de las etiquetas\n
for autotext in autotexts:\n
    autotext.set_color('white')\n
    autotext.set_fontweight('bold')\n
\n
plt.tight_layout()\n
plt.show()

In [None]:
# Gráfico de barras horizontal\n
plt.figure(figsize=(12, 8))\n
bars = plt.barh(range(len(type_counts)), type_counts.values, color='lightblue', alpha=0.7)\n
plt.yticks(range(len(type_counts)), type_counts.index)\n
plt.xlabel('Número de Publicaciones', fontsize=14)\n
plt.title('Distribución de Tipos de Publicación', fontsize=16, fontweight='bold')\n
plt.grid(True, alpha=0.3, axis='x')\n
\n
# Agregar valores en las barras\n
for i, (bar, count) in enumerate(zip(bars, type_counts.values)):\n
    plt.text(count + 0.5, i, str(count), va='center', fontweight='bold')\n
\n
plt.tight_layout()\n
plt.show()

In [None]:
# Gráfico interactivo con Plotly\n
fig = px.pie(values=type_counts.values, names=type_counts.index,\n
              title='Distribución de Tipos de Publicación',\n
              color_discrete_sequence=px.colors.qualitative.Set3)\n
\n
fig.update_traces(textposition='inside', textinfo='percent+label')\n
fig.update_layout(\n
    title_font_size=16,\n
    showlegend=True\n
)\n
\n
fig.show()

## 4. Análisis Temporal por Tipo de Publicación

In [None]:
# Convertir Year a numérico si no está ya\n
df['Year'] = pd.to_numeric(df['Year'], errors='coerce')\n
\n
# Análisis temporal por tipo de publicación\n
temporal_by_type = df.groupby(['Year', 'Type of Publication']).size().unstack(fill_value=0)\n
\n
print(\"=== EVOLUCIÓN TEMPORAL POR TIPO DE PUBLICACIÓN ===\")\n
print(temporal_by_type)\n
\n
# Gráfico de líneas temporal\n
plt.figure(figsize=(15, 8))\n
for pub_type in temporal_by_type.columns:\n
    plt.plot(temporal_by_type.index, temporal_by_type[pub_type], marker='o', linewidth=2, label=pub_type)\n
\n
plt.title('Evolución Temporal de Tipos de Publicación', fontsize=16, fontweight='bold')\n
plt.xlabel('Año', fontsize=14)\n
plt.ylabel('Número de Publicaciones', fontsize=14)\n
plt.legend(title='Tipo de Publicación', bbox_to_anchor=(1.05, 1), loc='upper left')\n
plt.grid(True, alpha=0.3)\n
plt.xticks(temporal_by_type.index, rotation=45)\n
plt.tight_layout()\n
plt.show()

In [None]:
# Gráfico de área apilada\n
fig = px.area(temporal_by_type, title='Evolución Temporal de Tipos de Publicación')\n
\n
fig.update_layout(\n
    title_font_size=16,\n
    xaxis_title='Año',\n
    yaxis_title='Número de Publicaciones',\n
    hovermode='x unified'\n
)\n
\n
fig.show()

## 5. Análisis de Fuentes por Tipo de Publicación

In [None]:
# Análisis de fuentes por tipo de publicación\n
source_by_type = df.groupby(['Type of Publication', 'Source']).size().unstack(fill_value=0)\n
\n
print(\"=== FUENTES POR TIPO DE PUBLICACIÓN ===\")\n
print(source_by_type)\n
\n
# Gráfico de calor\n
plt.figure(figsize=(12, 8))\n
sns.heatmap(source_by_type, annot=True, fmt='d', cmap='YlOrRd', cbar_kws={'label': 'Número de Publicaciones'})\n
plt.title('Distribución de Fuentes por Tipo de Publicación', fontsize=16, fontweight='bold')\n
plt.xlabel('Fuente', fontsize=14)\n
plt.ylabel('Tipo de Publicación', fontsize=14)\n
plt.tight_layout()\n
plt.show()

In [None]:
# Gráfico de barras agrupadas\n
source_by_type_plot = source_by_type.reset_index()\n
source_by_type_melted = source_by_type_plot.melt(id_vars=['Type of Publication'], \n
                                                  var_name='Source', value_name='Count')\n
\n
fig = px.bar(source_by_type_melted, x='Type of Publication', y='Count', color='Source',\n
              title='Distribución de Fuentes por Tipo de Publicación',\n
              barmode='group')\n
\n
fig.update_layout(\n
    title_font_size=16,\n
    xaxis_title='Tipo de Publicación',\n
    yaxis_title='Número de Publicaciones'\n
)\n
\n
fig.show()

## 6. Análisis de Presencia en Bases de Datos por Tipo

In [None]:
# Análisis de presencia en bases de datos por tipo de publicación\n
presence_columns = ['Present in Eric', 'Present in IEEE', 'Present in Scopus', 'Present in WoS']\n
\n
# Limpiar datos de presencia\n
for col in presence_columns:\n
    df[col] = df[col].fillna('No')\n
    df[col] = df[col].str.strip()\n
\n
# Crear análisis por tipo y presencia\n
presence_by_type = {}\n
for pub_type in df['Type of Publication'].unique():\n
    type_data = df[df['Type of Publication'] == pub_type]\n
    presence_by_type[pub_type] = {}\n
    for col in presence_columns:\n
        presence_by_type[pub_type][col] = type_data[col].value_counts().to_dict()\n
\n
print(\"=== PRESENCIA EN BASES DE DATOS POR TIPO DE PUBLICACIÓN ===\")\n
for pub_type, presence_data in presence_by_type.items():\n
    print(f\"\\n{pub_type}:\")\n
    for db, counts in presence_data.items():\n
        print(f\"  {db}: {counts}\")

In [None]:
# Gráfico de barras para presencia en bases de datos por tipo\n
fig, axes = plt.subplots(2, 2, figsize=(15, 12))\n
axes = axes.ravel()\n
\n
for i, col in enumerate(presence_columns):\n
    presence_data = df.groupby(['Type of Publication', col]).size().unstack(fill_value=0)\n
    \n
    presence_data.plot(kind='bar', ax=axes[i], alpha=0.7)\n
    axes[i].set_title(f'Presencia en {col.split(\"Present in \")[1]} por Tipo', fontweight='bold')\n
    axes[i].set_ylabel('Número de Publicaciones')\n
    axes[i].tick_params(axis='x', rotation=45)\n
    axes[i].legend(title='Presencia')\n
\n
plt.tight_layout()\n
plt.show()

## 7. Análisis de Tendencias y Patrones

In [None]:
# Análisis de tendencias por tipo de publicación\n
print(\"=== ANÁLISIS DE TENDENCIAS POR TIPO ===\")\n
\n
for pub_type in df['Type of Publication'].unique():\n
    type_data = df[df['Type of Publication'] == pub_type]\n
    year_counts = type_data['Year'].value_counts().sort_index()\n
    \n
    print(f\"\\n{pub_type}:\")\n
    print(f\"  Total: {len(type_data)} publicaciones\")\n
    print(f\"  Año con más publicaciones: {year_counts.idxmax()} ({year_counts.max()} publicaciones)\")\n
    print(f\"  Año con menos publicaciones: {year_counts.idxmin()} ({year_counts.min()} publicaciones)\")\n
    print(f\"  Promedio anual: {year_counts.mean():.1f} publicaciones\")

In [None]:
# Gráfico de tendencias normalizadas\n
normalized_trends = temporal_by_type.div(temporal_by_type.sum(axis=1), axis=0) * 100\n
\n
plt.figure(figsize=(15, 8))\n
for pub_type in normalized_trends.columns:\n
    plt.plot(normalized_trends.index, normalized_trends[pub_type], marker='o', linewidth=2, label=pub_type)\n
\n
plt.title('Tendencias Normalizadas de Tipos de Publicación', fontsize=16, fontweight='bold')\n
plt.xlabel('Año', fontsize=14)\n
plt.ylabel('Porcentaje de Publicaciones', fontsize=14)\n
plt.legend(title='Tipo de Publicación', bbox_to_anchor=(1.05, 1), loc='upper left')\n
plt.grid(True, alpha=0.3)\n
plt.xticks(normalized_trends.index, rotation=45)\n
plt.tight_layout()\n
plt.show()

## 8. Resumen y Conclusiones

In [None]:
# Generar resumen ejecutivo\n
print(\"=== RESUMEN EJECUTIVO ===\\n\")\n
\n
print(f\"📊 Total de tipos de publicación: {len(type_counts)}\")\n
print(f\"📝 Tipo más común: {type_counts.index[0]} ({type_counts.iloc[0]} publicaciones)\")\n
print(f\"📈 Tipo menos común: {type_counts.index[-1]} ({type_counts.iloc[-1]} publicaciones)\")\n
\n
# Análisis de diversidad\n
diversity_index = len(type_counts) / len(df) * 100\n
print(f\"🌐 Índice de diversidad: {diversity_index:.1f}%\")\n
\n
# Análisis de concentración\n
concentration = (type_counts.iloc[0] / len(df)) * 100\n
print(f\"🎯 Concentración del tipo principal: {concentration:.1f}%\")\n
\n
print(\"\\n=== CONCLUSIONES ===\")\n
print(\"1. Los artículos de investigación dominan la producción científica\")\n
print(\"2. Hay una tendencia hacia la diversificación de tipos de publicación\")\n
print(\"3. Las conferencias son importantes para la difusión temprana\")\n
print(\"4. Existe variabilidad en la presencia en bases de datos por tipo\")