<a href="https://colab.research.google.com/github/davidlealo/sic_ai_2025_jun/blob/main/04pln/clase_29.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


# üìò Visualizar textos en TensorFlow Projector: Paso a Paso en Google Colab

Este tutorial explica c√≥mo transformar textos (por ejemplo, art√≠culos constitucionales) en vectores para ser visualizados en [https://projector.tensorflow.org](https://projector.tensorflow.org).

---

## üîπ Paso 1: Cargar tus textos

Simulamos una lista de art√≠culos constitucionales:

```python
textos = [
    "Art√≠culo 1: Chile es una rep√∫blica democr√°tica, fundada en la soberan√≠a popular.",
    "Art√≠culo 2: La soberan√≠a reside en el pueblo de Chile.",
    "Art√≠culo 3: El Estado se organiza en tres poderes independientes.",
    "Art√≠culo 4: La Constituci√≥n garantiza la igualdad ante la ley.",
    "Art√≠culo 5: El medio ambiente debe ser protegido por el Estado.",
]
```

---

## üîπ Paso 2: Instalar librer√≠as necesarias

Usamos `sentence-transformers` para generar buenos embeddings multiling√ºes:

```python
!pip install -q sentence-transformers
```

---

## üîπ Paso 3: Convertir los textos a vectores (embeddings)

```python
from sentence_transformers import SentenceTransformer
import pandas as pd

# Cargar modelo multiling√ºe
modelo = SentenceTransformer('distiluse-base-multilingual-cased')

# Crear los vectores
vectores = modelo.encode(textos)

# Guardamos los textos como etiquetas para visualizaci√≥n
etiquetas = textos
```

---

## üîπ Paso 4: Guardar archivos `.tsv`

```python
# Guardar los vectores en vectors.tsv
pd.DataFrame(vectores).to_csv("vectors.tsv", sep="\t", header=False, index=False)

# Guardar los textos originales como metadatos
pd.DataFrame(etiquetas).to_csv("metadata.tsv", sep="\t", header=False, index=False)
```

---

## üîπ Paso 5: Descargar los archivos a tu computador

Puedes usar el explorador de archivos lateral en Colab o ejecutar:

```python
from google.colab import files
files.download("vectors.tsv")
files.download("metadata.tsv")
```

---

## üîπ Paso 6: Cargar en TensorFlow Projector

1. Ir a: [https://projector.tensorflow.org/](https://projector.tensorflow.org/)
2. Hacer clic en ‚Äú**Load**‚Äù
3. Subir:
   - `vectors.tsv` como **Tensor**
   - `metadata.tsv` como **Metadata**
4. Explorar con **PCA, t-SNE o UMAP**, y buscar similitudes entre textos.

---

## ‚úÖ Opcional: Leer textos desde archivo `.txt` o `.csv`

Si tienes los art√≠culos en un archivo `constitucion.txt` (una l√≠nea por art√≠culo), haz:

```python
# Subir archivo
from google.colab import files
uploaded = files.upload()

# Leer textos desde el archivo
with open("constitucion.txt", encoding="utf-8") as f:
    textos = [line.strip() for line in f if line.strip()]
```

---

## üéâ ¬°Listo!
Ahora puedes explorar tus textos en un espacio sem√°ntico con TensorFlow Projector.
