<a href="https://colab.research.google.com/github/apchavezr/-Analisis_Grandes_Volumenes_Datos/blob/main/BigData_HuggingFace_TextClassification.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


# Clasificación de Texto con Transformers de Hugging Face

Este notebook complementa la unidad *Fundamentos conceptuales y tipos de datos en entornos Big Data*, explorando cómo aplicar modelos de lenguaje avanzados para clasificar textos no estructurados. En este caso, se utilizará un modelo preentrenado de la biblioteca `transformers` para realizar análisis de sentimientos.

### Objetivo
Clasificar comentarios ciudadanos simulados como positivos o negativos usando un modelo de Transformers preentrenado por Hugging Face.

### Contexto
Este tipo de análisis puede ser aplicado, por ejemplo, a textos de participación ciudadana recolectados en plataformas como Bogotá Abierta, para detectar percepciones sobre políticas públicas.


In [1]:

!pip install -q transformers
!pip install -q torch


[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m363.4/363.4 MB[0m [31m2.9 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m13.8/13.8 MB[0m [31m74.8 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m24.6/24.6 MB[0m [31m59.4 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m883.7/883.7 kB[0m [31m17.5 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m664.8/664.8 MB[0m [31m2.0 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m211.5/211.5 MB[0m [31m5.9 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m56.3/56.3 MB[0m [31m12.7 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m127.9/127.9 MB[0m [31m7.5 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

In [5]:

from transformers import pipeline

# Cargar el pipeline de análisis de sentimientos en español
classifier = pipeline("sentiment-analysis", model="nlptown/bert-base-multilingual-uncased-sentiment")

# Comentarios simulados de participación ciudadana
comentarios = [
    "Estoy muy satisfecho con la nueva ciclovía en la carrera 7ma.",
    "El servicio de salud ha sido deficiente y lento.",
    "Gracias por implementar más zonas verdes en mi barrio.",
    "La recolección de basuras ha empeorado en las últimas semanas."
]

from transformers import pipeline

# Cargar el pipeline de análisis de sentimientos en español
classifier = pipeline("sentiment-analysis", model="nlptown/bert-base-multilingual-uncased-sentiment")

# Comentarios simulados de participación ciudadana
comentarios = [
    "Estoy muy satisfecho con la nueva ciclovía en la carrera 7ma.",
    "El servicio de salud ha sido deficiente y lento.",
    "Gracias por implementar más zonas verdes en mi barrio.",
    "La recolección de basuras ha empeorado en las últimas semanas."
]

# Clasificación de sentimientos
for comentario in comentarios:
    resultado = classifier(comentario)[0]
    print(f"Texto: {comentario}\n→ Sentimiento: {resultado['label']} (Confianza: {round(resultado['score'], 2)})\n")


Device set to use cpu
Device set to use cpu


Texto: Estoy muy satisfecho con la nueva ciclovía en la carrera 7ma.
→ Sentimiento: 5 stars (Confianza: 0.7)

Texto: El servicio de salud ha sido deficiente y lento.
→ Sentimiento: 2 stars (Confianza: 0.45)

Texto: Gracias por implementar más zonas verdes en mi barrio.
→ Sentimiento: 5 stars (Confianza: 0.55)

Texto: La recolección de basuras ha empeorado en las últimas semanas.
→ Sentimiento: 2 stars (Confianza: 0.29)




### Reflexión

La clasificación automática de texto es una herramienta útil para extraer **valor** de los datos no estructurados. En este ejemplo, se demuestra cómo utilizar un modelo de Transformers para **identificar patrones de sentimiento**, lo cual puede ser útil para evaluar la opinión ciudadana en procesos participativos.

**Aplicaciones prácticas en Colombia:**
- Análisis de retroalimentación en redes sociales sobre temas de salud, movilidad o seguridad.
- Evaluación de opiniones en encuestas abiertas o plataformas como Bogotá Abierta.
- Soporte a estrategias de comunicación institucional basadas en percepción ciudadana.

---

**Vs relacionadas del Big Data:**
- **Variedad**, al trabajar con texto libre como fuente de datos.
- **Valor**, al obtener conocimiento útil para la toma de decisiones desde opiniones subjetivas.

