# Diapositiva 1: ¿Qué es GloVe?

**GloVe** (Global Vectors for Word Representation) es un algoritmo de aprendizaje no supervisado desarrollado en Stanford en 2014 para obtener representaciones vectoriales densas de palabras.

GloVe aprende vectores de palabras que reflejan **relaciones semánticas lineales** en el espacio vectorial. Por ejemplo, en el espacio embebido:

\[
\text{vec}("rey") - \text{vec}("hombre") + \text{vec}("mujer") \approx \text{vec}("reina")
\]

GloVe se basa en estadísticas globales de coocurrencia de palabras en grandes corpus como Wikipedia y Gigaword.

# Diapositiva 2: Matriz de coocurrencia

GloVe comienza construyendo una matriz \( X_{ij} \) de coocurrencia donde cada celda representa cuántas veces la palabra \( j \) aparece en el contexto de la palabra \( i \).

Ejemplo simplificado:

|        | perro | gato | hueso | correr |
|--------|-------|------|--------|--------|
| **perro** |   0   |  5   |   9    |   2    |
| **gato**  |   5   |  0   |   2    |   1    |
| **hueso** |   9   |  2   |   0    |   0    |

La ventana de contexto puede ser simétrica o asimétrica y afecta la construcción de esta matriz.

# Diapositiva 3: Función objetivo del modelo

GloVe aprende vectores \( w_i \) y \( \tilde{w}_j \) de palabras (palabra central y de contexto), junto con sesgos \( b_i \) y \( \tilde{b}_j \), que satisfacen:

\[
w_i^\top \cdot \tilde{w}_j + b_i + \tilde{b}_j \approx \log(X_{ij})
\]

El modelo busca que el producto punto entre vectores se aproxime al logaritmo del número de coocurrencias entre las palabras.

# Diapositiva 4: Función de pérdida

La función de pérdida que GloVe minimiza es:

\[
J = \sum_{i,j=1}^{V} f(X_{ij}) \left(w_i^\top \tilde{w}_j + b_i + \tilde{b}_j - \log X_{ij} \right)^2
\]

Donde:
- \( f(x) \) es una función de ponderación que controla la contribución de cada par de palabras.
- \( f(x) = (x / x_{max})^\alpha \) para \( x < x_{max} \), y \( f(x) = 1 \) para \( x \ge x_{max} \)
- Esto evita que las coocurrencias raras dominen el entrenamiento.

# Diapositiva 5: Comparación con Word2Vec

| Característica         | GloVe (Global Vectors)            | Word2Vec                      |
|------------------------|-----------------------------------|-------------------------------|
| Fundamento             | Conteo de coocurrencias globales  | Predicción basada en contexto |
| Método de entrenamiento| Matriz precomputada + regresión   | Entrenamiento directo         |
| Objetivo               | Aproximar \( \log(X_{ij}) \)   | Maximizar prob. condicional   |
| Ventajas               | Eficiencia, relaciones lineales   | Precisión contextual          |

GloVe es más eficiente en corpus grandes donde ya se pueden contar las coocurrencias. Word2Vec se adapta mejor a flujos de datos dinámicos.

# Diapositiva 6: Uso práctico de GloVe

## Con spaCy (modelo mediano):
```python
import spacy
nlp = spacy.load("en_core_web_md")
doc = nlp("rey reina")
print(doc[0].vector)
```

## Con Gensim (archivo GloVe original convertido):
```python
from gensim.models import KeyedVectors
model = KeyedVectors.load_word2vec_format("glove.6B.100d.txt", binary=False, no_header=True)
model.similarity("king", "queen")
```

También puedes convertir archivos GloVe con `gensim.scripts.glove2word2vec`.

# Diapositiva 7: ¿Por qué usar GloVe?

- Representaciones densas y bajas en dimensionalidad.
- Preservan relaciones semánticas y sintácticas.
- Eficientes para tareas de NLP como:
  - Clasificación de texto
  - Detección de similitud semántica
  - Análisis de sentimientos
- Fáciles de integrar como embeddings preentrenados.

GloVe es una excelente opción para representar texto cuando el contexto dinámico no es esencial.