# Taller Festi STEM

**Autor:** Jazna Meza Hidalgo

**Correo Electrónico:** ja.meza@profesor.duoc.cl

**Fecha de Creación:** Agosto de 2025

**Versión:** 1.0  

---

## Descripción

Este notebook contiene la generación de un asistente virutal usando un modelo pre-entrenado de `huggingface`

---

## Requisitos de Software

Este notebook fue desarrollado con Python 3.9. A continuación se listan los módulos necesarios:

- json (2.0.9)
- numpy (2.02)
- transformers (4.55.2)
- gradio (5.42.0)

Para verificar la versión instalada ejecutar usando el siguiente comando, usando la librería de la cual quieres saber la versión:

```bash
import pandas as pd
print(pd.__version__)
````

In [None]:
!pip install transformers



In [None]:
import json
import gradio as gr
import numpy as np

from transformers import pipeline
from functools import partial

# Modelo

In [None]:
# Modelo de QA (Question-Answering) entrenado en español
qa = pipeline("question-answering", model="mrm8488/bert-base-spanish-wwm-cased-finetuned-spa-squad2-es")

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/465 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/439M [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/439M [00:00<?, ?B/s]

Some weights of the model checkpoint at mrm8488/bert-base-spanish-wwm-cased-finetuned-spa-squad2-es were not used when initializing BertForQuestionAnswering: ['bert.pooler.dense.bias', 'bert.pooler.dense.weight']
- This IS expected if you are initializing BertForQuestionAnswering from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForQuestionAnswering from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


tokenizer_config.json:   0%|          | 0.00/135 [00:00<?, ?B/s]

vocab.txt: 0.00B [00:00, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

Device set to use cpu


# Ejemplo 1

In [None]:
# Contexto en español
contexto = """
La Inteligencia Artificial (IA) es un área de la informática que busca que las máquinas
puedan realizar tareas que normalmente requieren inteligencia humana,
como comprender lenguaje, reconocer imágenes o tomar decisiones.
Un asistente virtual es un programa de IA que interactúa con las personas,
respondiendo preguntas o realizando tareas simples.
"""

# Preguntas
preguntas = [
    "¿Qué es la inteligencia artificial?",
    "¿Qué es un asistente virtual?",
    "¿Qué tareas puede realizar la IA?"
]
# Puntajes
scores = []

for p in preguntas:
  respuesta = qa(question=p, context=contexto)
  print(f"❓ {p}\n👉 {respuesta['answer']}\n")
  scores.append(respuesta['score'])


❓ ¿Qué es la inteligencia artificial?
👉 un área de la informática

❓ ¿Qué es un asistente virtual?
👉 un programa de IA

❓ ¿Qué tareas puede realizar la IA?
👉 comprender lenguaje, reconocer imágenes o tomar decisiones



In [None]:
scores

[0.6713969707489014, 0.36923813819885254, 0.1671142578125]

# Ejemplo 2 - Historia universal

In [None]:
# Contexto en español
contexto_historia_universal = """
La Revolución Francesa fue un proceso social y político que se desarrolló en Francia entre 1789 y 1799.
Se caracterizó por la caída de la monarquía absoluta, el fin de los privilegios de la nobleza y el clero,
y la proclamación de los derechos del hombre y del ciudadano.
Uno de los acontecimientos más importantes fue la toma de la Bastilla el 14 de julio de 1789,
que simbolizó el inicio de la lucha popular contra el Antiguo Régimen.
Finalmente, este proceso abrió el camino para la aparición de Napoleón Bonaparte en la escena política europea.

"""

# Preguntas
preguntas_historia = [
    "¿En qué año comenzó la Revolución Francesa?",
    "¿Qué simbolizó la toma de la Bastilla?",
    "¿Quién surgió como figura política tras la Revolución Francesa?"
]

# Puntajes
scores_historia = []

for p in preguntas_historia:
  respuesta = qa(question=p, context=contexto_historia_universal)
  print(f"❓ {p}\n👉 {respuesta['answer']}\n")
  scores_historia.append(respuesta['score'])


❓ ¿En qué año comenzó la Revolución Francesa?
👉 1789

❓ ¿Qué simbolizó la toma de la Bastilla?
👉 el inicio de la lucha popular contra el Antiguo Régimen

❓ ¿Quién surgió como figura política tras la Revolución Francesa?
👉 Napoleón Bonaparte



In [None]:
scores_historia

[0.4533329904079437, 0.5643883347511292, 0.9146406329236925]

# Preguntas ```fuera de contexto```

In [None]:
pregunta_fuera_contexto = "¿De qué color es la luna?"
respuesta_experimento = qa(question=pregunta_fuera_contexto, context=contexto_historia_universal)
print(f"❓ {pregunta_fuera_contexto}\n👉 {respuesta_experimento['answer']}\n")


❓ ¿De qué color es la luna?
👉 ciudadano



In [None]:
respuesta_experimento['score']

0.23531335592269897

In [None]:
pregunta_fuera_contexto = "¿De qué color es la luna?"
respuesta_experimento = qa(question=pregunta_fuera_contexto, context=contexto)
print(f"❓ {pregunta_fuera_contexto}\n👉 {respuesta_experimento['answer']}\n")

❓ ¿De qué color es la luna?
👉 decisiones



In [None]:
respuesta_experimento['score']

2.8482572815846652e-05

# Entonces ...

In [None]:
pregunta_fuera_contexto = "¿De qué color es la luna?"
respuesta_experimento = qa(question=pregunta_fuera_contexto, context=contexto_historia_universal)
if respuesta_experimento['score'] >= 0.3:
  print(f"❓ {pregunta_fuera_contexto}\n👉 {respuesta_experimento['answer']}\n")
else:
  print(f"❓ {pregunta_fuera_contexto}\n👉 Lo siento, no tengo información sobre eso en mi contexto histórico.\n")

❓ ¿De qué color es la luna?
👉 Lo siento, no tengo información sobre eso en mi contexto histórico.



# Ejemplo mejorado

In [None]:
!wget https://raw.githubusercontent.com/JaznaLaProfe/TallerFeriaSTEM/master/data/historia_universal.json

--2025-08-24 03:07:27--  https://raw.githubusercontent.com/JaznaLaProfe/TallerFeriaSTEM/master/data/historia_universal.json
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.108.133, 185.199.109.133, 185.199.110.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.108.133|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 2301 (2.2K) [text/plain]
Saving to: ‘historia_universal.json’


2025-08-24 03:07:27 (23.9 MB/s) - ‘historia_universal.json’ saved [2301/2301]



In [None]:
# ------------------------
# Cargar el JSON de historia universal
# ------------------------
with open("historia_universal.json", "r", encoding="utf-8") as f:
    dataset = json.load(f)

# Extraer párrafos de todos los contextos
contextos = []
for contexto in dataset["contexts"]:
  contextos.append(contexto)

# ------------------------
# Función de QA buscando en todos los contextos
# ------------------------
def responder_pregunta(pregunta : str, contexts : np.array, qa):
    respuestas = []
    for context in contexts:
        try:
            result = qa(question=pregunta, context=context)
            respuestas.append(result)
        except:
            continue

    if not respuestas:
        return "No encontré una respuesta en el contexto."

    # Ordenar por score y devolver la mejor
    mejor = sorted(respuestas, key=lambda x: x["score"], reverse=True)[0]
    # Verificar el nivel de confianza
    if mejor["score"] < 0.4:
        return "No encontré una respuesta en el contexto."

    return f"📖 Respuesta: {mejor['answer']} ✅ Confianza: {mejor['score']:.2f}"



In [None]:
responder_pregunta("¿En qué año comenzó la Revolución Francesa?", contextos, qa)

'📖 Respuesta: 1789 ✅ Confianza: 0.45'

In [None]:
responder_pregunta("¿En qué año comenzó la segunda guerra mundial?", contextos, qa)

'📖 Respuesta: 1939 y 1945 ✅ Confianza: 0.62'

In [None]:
responder_pregunta("¿En qué año terminó la segunda guerra mundial?", contextos, qa)

'📖 Respuesta: 1945 ✅ Confianza: 0.94'

In [None]:
responder_pregunta("¿Cuáles son las civilizaciones antiguas?", contextos, qa)

'No encontré una respuesta en el contexto.'

In [None]:
responder_pregunta("¿Cuál fue el aporte de Roma?", contextos, qa)

'No encontré una respuesta en el contexto.'

In [None]:
responder_pregunta("¿Quién fue el principal personaje de la revolución francesa?", contextos, qa)

'📖 Respuesta: Napoleón Bonaparte ✅ Confianza: 0.76'

In [None]:
# ------------------------
# 4. Interfaz con Gradio
# ------------------------
fn_con_qa = partial(responder_pregunta, contexts=contextos, qa=qa)
with gr.Blocks() as demo:
    gr.Markdown("# 🤖 Asistente de Historia Universal")
    gr.Markdown("Haz una pregunta sobre Revolución Francesa, Guerras Mundiales, Civilizaciones Antiguas y más.")

    with gr.Row():
        pregunta = gr.Textbox(label="Escribe tu pregunta aquí")

    boton = gr.Button("Responder")
    salida = gr.Textbox(label="Respuesta", interactive=False)

    boton.click(fn=fn_con_qa, inputs=[pregunta], outputs=salida)


demo.launch()


It looks like you are running Gradio on a hosted Jupyter notebook, which requires `share=True`. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://80ecf8f25a66a33f08.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


