
- **ISOTYPE** (*International System of Typographic Picture Education*) fue creado en los a√±os 1920 por **Otto Neurath**.  
- Tambi√©n conocido como el *m√©todo de Viena*.  
- Propone **comunicar informaci√≥n compleja mediante pictogramas e iconos**, con el m√≠nimo de texto.  
- Principio clave: *‚Äúlas palabras separan, las im√°genes unen‚Äù*.  

## Caracter√≠sticas
- Uso de **pictogramas simples** y gr√°ficos elementales.  
- **Lenguaje visual universal**, independiente de idiomas.  
- Inspirado en el **funcionalismo gr√°fico** de la Bauhaus y las vanguardias del siglo XX.  
- La comprensi√≥n se logra en **tres pasos**: captar lo esencial, lo secundario y los detalles.  
- **Visualizaci√≥n de datos estad√≠sticos**: tablas y gr√°ficos comparativos.  
- **Educaci√≥n y divulgaci√≥n**: explicar fen√≥menos sociales, econ√≥micos o hist√≥ricos.  
- **Dise√±o gr√°fico y editorial**: base de la infograf√≠a moderna.  

## Errores a Evitar

- **Escalar pictogramas** para ‚Äúmostrar m√°s‚Äù (tama√±o ‚â† cantidad); en Isotype se **repiten iconos del mismo tama√±o**.
- **No definir la unidad visual**: falta de leyenda ‚Äú1 icono = N unidades‚Äù.
- **Iconograf√≠a inconsistente**: cambiar de pictograma para la misma categor√≠a.
- **Efectos decorativos** (3D, degradados, sombras) que restan legibilidad.
- **Iconos culturalmente ambiguos**: met√°foras no universales.



# Librer√≠a `altair` (Vega-Altair)
![Logo de Altair](https://altair-viz.github.io/_static/altair-logo-light.png)

La librer√≠a **`altair`** es un paquete de Python dise√±ado para **crear visualizaciones interactivas y declarativas** basadas en la gram√°tica de gr√°ficos de **Vega y Vega-Lite**.  

## Usos principales

- **Exploraci√≥n de datos** de manera visual y r√°pida.  
- **Creaci√≥n de gr√°ficos interactivos** en notebooks, aplicaciones web y dashboards.  
- **Informes y storytelling con datos**, gracias a su integraci√≥n con Jupyter, Streamlit, Panel y Quarto.  

## Caracter√≠sticas principales

- Sintaxis **declarativa y concisa**: describes el gr√°fico indicando las columnas de tus datos y el tipo de marca (barras, puntos, l√≠neas, etc.).  
- Admite **interactividad integrada** como zoom, selecci√≥n y filtrado.  
- Compatible con **pandas DataFrames** y librer√≠as de an√°lisis como NumPy.  
- Exporta visualizaciones en formato **JSON** para reproducibilidad.  

## Instalaci√≥n

Para instalar **Altair** y sus dependencias m√°s comunes:  

```bash
pip install "altair[all]"



# Dataset: Base de Art√≠culos Publicados 2015‚Äì2023

**Fuente:**  
[Secretar√≠a de Educaci√≥n Superior, Ciencia, Tecnolog√≠a e Innovaci√≥n (SENESCYT)](https://cloud-pro.senescyt.gob.ec/index.php/s/qfDbtQxawojJ2CG?openfile=true)

**Descripci√≥n:**  
Este dataset contiene la base estad√≠stica de art√≠culos cient√≠ficos publicados por las universidades y escuelas polit√©cnicas de Ecuador en **revistas indexadas** durante el periodo **2015 ‚Äì 2023**.  

In [30]:
import pandas as pd
from wordcloud import WordCloud, STOPWORDS
import matplotlib.pyplot as plt
df = pd.read_excel("Base_estadistica_articulos_UEP_15_23.xlsx", skiprows=12)


In [31]:
import pandas as pd
import numpy as np
import altair as alt

# ---- Filtrar y calcular top 10 ----
df_filtered = df[df['NOMBRE UNIVERSIDAD'] == "UNIVERSIDAD SAN FRANCISCO DE QUITO"]["CAMPO DETALLADO"].dropna().astype(str)
top = df_filtered.value_counts().head(10).reset_index()
top.columns = ["CAMPO DETALLADO", "FRECUENCIA"]

# ---- Par√°metros del isotype ----
UNIDAD = 50  # 1 √≠cono = 50 publicaciones

# Emojis por categor√≠a (puedes ajustar a gusto)
emoji_map = {
    "F√çSICA": "üî≠",
    "MEDICINA": "üíä",
    "BIOLOG√çA": "üß¨",
    "MEDIO AMBIENTE": "üå±",
    "ESTUDIOS SOCIALES Y CULTURALES": "üìö",
    "CONSTRUCCI√ìN E INGENIER√çA CIVIL": "üèóÔ∏è",
    "BIOMEDICINA": "üß™",
    "SALUD P√öBLICA": "üè•",
    "COMPUTACI√ìN": "üíª",
    "QU√çMICA": "‚öóÔ∏è"
}

# Calcular n√∫mero de iconos
top["ICONOS"] = np.maximum((top["FRECUENCIA"] // UNIDAD).astype(int), 1)

# Expandir filas: una por √≠cono
rows = []
for _, r in top.iterrows():
    for i in range(int(r["ICONOS"])):
        rows.append({
            "CAMPO DETALLADO": r["CAMPO DETALLADO"],
            "y": i  # eje vertical
        })

source = pd.DataFrame(rows)

# Gr√°fico vertical
chart = (
    alt.Chart(source)
    .mark_text(size=25, baseline='middle')
    .encode(
        alt.X('CAMPO DETALLADO:O', sort=top["CAMPO DETALLADO"].tolist()).axis(None),
        alt.Y('y:O').axis(None),
        alt.Text('emoji:N')
    )
    .transform_calculate(
        emoji=f"{emoji_map}".replace("'", '"') + "[datum['CAMPO DETALLADO']]"
    )
    .properties(width=650, height=500)
)

# Pie con la equivalencia
nota = alt.Chart(pd.DataFrame({"t": [f"1 icono = {UNIDAD} publicaciones"]})).mark_text(
    align="left", dx=5, dy=15
).encode(text="t:N")

chart & nota


  col = df[col_name].apply(to_list_if_array, convert_dtype=False)
  col = df[col_name].apply(to_list_if_array, convert_dtype=False)


## Iteraci√≥n 2

In [32]:
import pandas as pd
import numpy as np
import altair as alt

# ---- Filtrar y calcular top 10 ----
df_filtered = df[df['NOMBRE UNIVERSIDAD'] == "UNIVERSIDAD SAN FRANCISCO DE QUITO"]["CAMPO DETALLADO"].dropna().astype(str)
top = df_filtered.value_counts().head(10).reset_index()
top.columns = ["CAMPO DETALLADO", "FRECUENCIA"]

# ---- Par√°metros del isotype ----
UNIDAD = 50  # 1 √≠cono = 50 publicaciones

# Emojis por categor√≠a
emoji_map = {
    "F√çSICA": "üî≠",
    "MEDICINA": "üíä",
    "BIOLOG√çA": "üß¨",
    "MEDIO AMBIENTE": "üå±",
    "ESTUDIOS SOCIALES Y CULTURALES": "üìö",
    "CONSTRUCCI√ìN E INGENIER√çA CIVIL": "üèóÔ∏è",
    "BIOMEDICINA": "üß™",
    "SALUD P√öBLICA": "üè•",
    "COMPUTACI√ìN": "üíª",
    "QU√çMICA": "‚öóÔ∏è"
}

# Calcular n√∫mero de iconos
top["ICONOS"] = np.maximum((top["FRECUENCIA"] // UNIDAD).astype(int), 1)

# Expandir filas: una por √≠cono
rows = []
for _, r in top.iterrows():
    for i in range(int(r["ICONOS"])):
        rows.append({
            "CAMPO DETALLADO": r["CAMPO DETALLADO"],
            "x": i  # eje horizontal
        })

source = pd.DataFrame(rows)

# Gr√°fico horizontal con eje X
chart = (
    alt.Chart(source)
    .mark_text(size=25, baseline='middle')
    .encode(
        alt.X('x:O', axis=alt.Axis(title=f"N√∫mero de √≠conos (1 = {UNIDAD} publicaciones)")),
        alt.Y('CAMPO DETALLADO:O', sort=top["CAMPO DETALLADO"].tolist()),
        alt.Text('emoji:N')
    )
    .transform_calculate(
        emoji=f"{emoji_map}".replace("'", '"') + "[datum['CAMPO DETALLADO']]"
    )
    .properties(width=800, height=400)
)

chart


  col = df[col_name].apply(to_list_if_array, convert_dtype=False)


## Iteraci√≥n 3

In [33]:
# Gr√°fico horizontal SIN eje X y SIN l√≠neas
chart = (
    alt.Chart(source)
    .mark_text(size=25, baseline='middle')
    .encode(
        alt.X('x:O', axis=None),   # ‚ùå elimina por completo el eje X
        alt.Y(
            'CAMPO DETALLADO:O',
            sort=top["CAMPO DETALLADO"].tolist(),
            axis=alt.Axis(ticks=False, domain=False, grid=False)
        ),
        alt.Text('emoji:N')
    )
    .transform_calculate(
        emoji=f"{emoji_map}".replace("'", '"') + "[datum['CAMPO DETALLADO']]"
    )
    .properties(width=800, height=400)
)

chart


  col = df[col_name].apply(to_list_if_array, convert_dtype=False)


In [34]:
# Gr√°fico horizontal SIN eje X y SIN nombre/l√≠neas en el eje Y
chart = (
    alt.Chart(source)
    .mark_text(size=25, baseline='middle')
    .encode(
        alt.X('x:O', axis=None),  # ‚ùå elimina el eje X completo
        alt.Y(
            'CAMPO DETALLADO:O',
            sort=top["CAMPO DETALLADO"].tolist(),
            axis=alt.Axis(
                ticks=False,
                domain=False,
                grid=False,
                title=None   # ‚ùå sin nombre del eje Y
            )
        ),
        alt.Text('emoji:N')
    )
    .transform_calculate(
        emoji=f"{emoji_map}".replace("'", '"') + "[datum['CAMPO DETALLADO']]"
    )
    .properties(width=800, height=400)
)

chart


  col = df[col_name].apply(to_list_if_array, convert_dtype=False)
