In [1]:
from transformers import pipeline, AutoModelForQuestionAnswering, AutoTokenizer

def cargar_modelo_qa_español():
    """
    Carga un modelo de Question-Answering preentrenado para español
    """
    # Usamos un modelo multilingüe que funciona bien con español
    nombre_modelo = "mrm8488/distill-bert-base-spanish-wwm-cased-finetuned-spa-squad2-es"

    # Cargamos el tokenizer y el modelo
    tokenizer = AutoTokenizer.from_pretrained(nombre_modelo)
    modelo = AutoModelForQuestionAnswering.from_pretrained(nombre_modelo)

    # Creamos el pipeline de QA
    qa_pipeline = pipeline(
        "question-answering",
        model=modelo,
        tokenizer=tokenizer
    )

    return qa_pipeline

In [2]:
def responder_pregunta(qa_pipeline, contexto, pregunta):
    """
    Obtiene la respuesta a una pregunta dado un contexto
    """
    respuesta = qa_pipeline({
        'question': pregunta,
        'context': contexto
    })

    return respuesta

In [3]:
# Ejemplo de uso
if __name__ == "__main__":
    # Cargamos el modelo
    print("Cargando modelo de QA en español...")
    qa_pipeline = cargar_modelo_qa_español()

    # Definimos un contexto de ejemplo
    contexto = """
    Miguel de Cervantes Saavedra fue un novelista, poeta y dramaturgo español.
    Es ampliamente considerado como la máxima figura de la literatura española.
    Fue el autor de El ingenioso hidalgo Don Quijote de la Mancha,
    que muchos críticos consideran la primera novela moderna y una de las
    mejores obras de la literatura universal. Cervantes nació en Alcalá de Henares en 1547
    y murió en Madrid en 1616.
    """

    # Hacemos algunas preguntas
    preguntas = [
        "¿Quién fue Miguel de Cervantes?",
        "¿Cuál es la obra más famosa de Cervantes?",
        "¿Dónde nació Cervantes?",
        "¿En qué año murió Cervantes?"
    ]

    print("\n--- RESULTADOS ---")
    for pregunta in preguntas:
        respuesta = responder_pregunta(qa_pipeline, contexto, pregunta)
        print(f"\nPregunta: {pregunta}")
        print(f"Respuesta: {respuesta['answer']}")
        print(f"Puntuación: {respuesta['score']:.4f}")

Cargando modelo de QA en español...


The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


tokenizer_config.json:   0%|          | 0.00/135 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/465 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/242k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/439M [00:00<?, ?B/s]

Some weights of the model checkpoint at mrm8488/distill-bert-base-spanish-wwm-cased-finetuned-spa-squad2-es were not used when initializing BertForQuestionAnswering: ['bert.pooler.dense.bias', 'bert.pooler.dense.weight']
- This IS expected if you are initializing BertForQuestionAnswering from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForQuestionAnswering from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Device set to use cpu



--- RESULTADOS ---




model.safetensors:   0%|          | 0.00/439M [00:00<?, ?B/s]


Pregunta: ¿Quién fue Miguel de Cervantes?
Respuesta: novelista, poeta y dramaturgo español
Puntuación: 0.2837

Pregunta: ¿Cuál es la obra más famosa de Cervantes?
Respuesta: Don Quijote de la Mancha
Puntuación: 0.8958

Pregunta: ¿Dónde nació Cervantes?
Respuesta: Alcalá de Henares
Puntuación: 0.8967

Pregunta: ¿En qué año murió Cervantes?
Respuesta: 1616
Puntuación: 0.9222
