# 5 - Respuesta a Preguntas (Question Answering)

<br>
<br>

<img src="https://raw.githubusercontent.com/Hack-io-AI/ai_images/main/qa.webp" style="width:400px;"/>

<h1>Tabla de Contenidos<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#1---Modelos-de-respuesta-a-preguntas-(QA)" data-toc-modified-id="1---Modelos-de-respuesta-a-preguntas-(QA)-1">1 - Modelos de respuesta a preguntas (QA)</a></span></li><li><span><a href="#2---Pipeline-de-Transformers-para-QA" data-toc-modified-id="2---Pipeline-de-Transformers-para-QA-2">2 - Pipeline de Transformers para QA</a></span></li><li><span><a href="#3---Usando-el-modelo-QA" data-toc-modified-id="3---Usando-el-modelo-QA-3">3 - Usando el modelo QA</a></span><ul class="toc-item"><li><span><a href="#3.1-Tokenizador" data-toc-modified-id="3.1-Tokenizador-3.1">3.1 Tokenizador</a></span></li><li><span><a href="#3.2---Modelo-QA" data-toc-modified-id="3.2---Modelo-QA-3.2">3.2 - Modelo QA</a></span></li><li><span><a href="#3.3-Resumen-funcional" data-toc-modified-id="3.3-Resumen-funcional-3.3">3.3 Resumen funcional</a></span></li></ul></li><li><span><a href="#4---Ejemplo-con-más-contexto" data-toc-modified-id="4---Ejemplo-con-más-contexto-4">4 - Ejemplo con más contexto</a></span></li><li><span><a href="#5---Otro-modelo-QA" data-toc-modified-id="5---Otro-modelo-QA-5">5 - Otro modelo QA</a></span></li></ul></div>

## 1 - Modelos de respuesta a preguntas (QA)

El QA (Question Answering) es un campo del NLP que se enfoca en la construcción de sistemas capaces de responder preguntas formuladas en lenguaje natural. Estos sistemas buscan proporcionar respuestas precisas y directas a preguntas basadas en una variedad de fuentes de datos, incluyendo textos escritos, bases de datos, internet, etc...

Tipos de QA:

1. **QA Basado en Retriever/Extractor**: 

Este tipo de sistema primero recupera un conjunto de documentos o pasajes que son relevantes para la pregunta y luego extrae la respuesta de ese conjunto. Ejemplos comunes incluyen respuestas que son fragmentos exactos de texto extraídos de un documento fuente.

2. **QA Generativo**: 

A diferencia de simplemente extraer respuestas, los sistemas generativos pueden componer respuestas más fluidas y en formato natural. Utilizan técnicas de comprensión del lenguaje y generación de texto para formular respuestas que no necesariamente aparecen textualmente en las fuentes de datos.

3. **QA Basado en Conocimiento**:

Estos sistemas utilizan bases de datos estructuradas o conocimientos codificados para responder preguntas. Son útiles en dominios específicos donde las respuestas requieren razonamiento basado en hechos conocidos o datos relacionados.

4. **QA Basado en Contexto**:

Algunos sistemas de QA pueden tener en cuenta el contexto adicional o el historial de la conversación para entender y responder preguntas de manera más efectiva. Esto es común en asistentes virtuales y chatbots.


Tecnologías utilizadas en QA:

+ Modelos Transformers: Tecnologías como BERT (Bidirectional Encoder Representations from Transformers) y GPT (Generative Pretrained Transformer) han revolucionado el campo de QA al proporcionar una profunda comprensión del contexto y la habilidad de generar respuestas precisas.

+ Búsqueda y Extracción de Información: Algoritmos avanzados de recuperación de información para buscar rápidamente grandes cantidades de datos y encontrar los fragmentos más relevantes.

+ Redes Neuronales y Deep Learning: Redes neuronales especializadas que pueden entender y procesar el lenguaje natural para interpretar preguntas y generar respuestas adecuadas.


Aplicaciones:

+ Asistentes Virtuales: Como Siri, Alexa y Google Assistant, que utilizan QA para responder preguntas de los usuarios.

+ Soporte al Cliente: Automatización de respuestas a preguntas frecuentes de clientes en sitios web y aplicaciones.

+ Educación y e-Learning: Sistemas de tutoría virtual que proporcionan respuestas y explicaciones a estudiantes.

+ Análisis de Datos y BI: Herramientas que permiten a los usuarios hacer preguntas sobre datos empresariales y recibir respuestas en forma de análisis o visualizaciones.

En el hub de [modelos](https://huggingface.co/models?sort=trending) de Hugging Face buscaremos [modelos QA en español](https://huggingface.co/models?pipeline_tag=question-answering&sort=trending&search=spanish). Existen modelos en varios lenguajes, aunque la mayoría de ellos están en inglés. Vamos a probar algunos modelos en castellano y luego en inglés.

El primer modelo que probaremos es `mrm8488/bert-base-spanish-wwm-cased-finetuned-spa-squad2-es`, aquí el [link](https://huggingface.co/mrm8488/bert-base-spanish-wwm-cased-finetuned-spa-squad2-es). Este modelo está basado en [BETO](https://huggingface.co/ignacio-ave/beto-sentiment-analysis-spanish), un modelo de análisis de sentimiento en castellano basado en BERT, y ajustado con el dataset [SQuAD-es-v2.0](https://github.com/ccasimiro88/TranslateAlignRetrieve) para problemas de QA. Veamos como funciona.

## 2 - Pipeline de Transformers para QA

Ya hemos visto que usar el pipeline es la manera más fácil de usar los modelos de Hugging Face. Tan solo tenemos que definir la tarea y el modelo y podemos usar nuestro modelo. Vamos a probar el pipeline con este modelo de respuesta a preguntas:

In [1]:
# logging para quitar warnings de actualización de pesos del modelo

from transformers import logging

logging.set_verbosity_error()

In [2]:
# importamos desde la librería transformers el pipeline

from transformers import pipeline

In [3]:
# definimos la tarea y el modelo

tarea = 'question-answering'  

modelo = 'mrm8488/bert-base-spanish-wwm-cased-finetuned-spa-squad2-es'

In [4]:
# iniciamos el modelo QA, los modelos se descargan en local, en este caso son unos 440Mb

qa_pipe = pipeline(task=tarea, model=modelo)

Para usar los modelos de QA, le tenemos que dar al modelo tanto el contexto como la pregunta. Esto lo podemos hacer de dos maneras. Podemos crear un diccionario cuyas keys sean `question` y `context`, donde los valores sean las respectivas strings. También podemos darle cada una de las strings como argumentos de entrada por separado:

In [5]:
# definimos contexto y pregunta

contexto = 'El español es el segundo idioma más hablado del mundo con más de 442 millones de hablantes'

pregunta = '¿Cuántas personas hablan español?'

In [6]:
# creamos el diccionario con las keys necesarias: context y question

prompt = {'context': contexto,
          'question': pregunta}

In [7]:
# llamada al pipeline con el diccionario

qa_pipe(prompt)

{'score': 0.252778023481369, 'start': 65, 'end': 77, 'answer': '442 millones'}

In [8]:
# llamada al pipeline con argumentos de entrada

qa_pipe(context=contexto, question=pregunta)

{'score': 0.252778023481369, 'start': 65, 'end': 77, 'answer': '442 millones'}

Se puede ver que ambas salidas son idénticas, así que podemos usar el pipeline como más nos guste, ya sea contruyendo el diccionario primero o pasándole directamente los argumentos de entrada a la función.

La respuesta del pipeline es un diccionario con las siguietes keys:

+ score: Probabilidad asociada a la respuesta.
+ start: Indice del caracter de inicio de la respuesta, en la versión tokenizada de la entrada.
+ end: Indice del caracter final de la respuesta, en la versión tokenizada de la entrada.
+ answer: Respuesta a la pregunta.

## 3 - Usando el modelo QA

Vamos a usar ahora el tokenizador y el modelo QA directamente. Ya vimos que el uso del modelo de esta manera es un poco más complicado, pero nos permite crear una salida con la forma que nosotros queramos. Veamos se usa:

In [9]:
# importamos los objetos tokenizador y modelo de QA

from transformers import AutoTokenizer, AutoModelForQuestionAnswering

### 3.1 Tokenizador

Convertimos la pregunta y contexto a un vector:

In [10]:
# con este objeto vectorizamos las palabras

tokenizador = AutoTokenizer.from_pretrained(modelo)

In [11]:
# descripcion del objeto

tokenizador

BertTokenizerFast(name_or_path='mrm8488/bert-base-spanish-wwm-cased-finetuned-spa-squad2-es', vocab_size=31002, model_max_length=1000000000000000019884624838656, is_fast=True, padding_side='right', truncation_side='right', special_tokens={'unk_token': '[UNK]', 'sep_token': '[SEP]', 'pad_token': '[PAD]', 'cls_token': '[CLS]', 'mask_token': '[MASK]'}, clean_up_tokenization_spaces=True),  added_tokens_decoder={
	0: AddedToken("[MASK]", rstrip=False, lstrip=False, single_word=False, normalized=False, special=True),
	1: AddedToken("[PAD]", rstrip=False, lstrip=False, single_word=False, normalized=False, special=True),
	3: AddedToken("[UNK]", rstrip=False, lstrip=False, single_word=False, normalized=False, special=True),
	4: AddedToken("[CLS]", rstrip=False, lstrip=False, single_word=False, normalized=False, special=True),
	5: AddedToken("[SEP]", rstrip=False, lstrip=False, single_word=False, normalized=False, special=True),
}

In [12]:
# creación del vector

vector = tokenizador(pregunta, contexto, return_tensors='pt')

In [13]:
vector

{'input_ids': tensor([[    4,  1067, 14578,  1858, 10219, 30062,  1101,  1064,     5,  1040,
         30062,  1101,  1058,  1040,  2740,  8134,  2437,  7856,  1072,  1863,
          1051,  2437,  1008,  4974, 30973,  2439,  1008, 10219,  1205,     5]]), 'token_type_ids': tensor([[0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
         1, 1, 1, 1, 1, 1]]), 'attention_mask': tensor([[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
         1, 1, 1, 1, 1, 1]])}

In [14]:
# tokens generados

tokens = vector.tokens()

tokens

['[CLS]',
 '¿',
 'cuantas',
 'personas',
 'hablan',
 'espan',
 '##ol',
 '?',
 '[SEP]',
 'el',
 'espan',
 '##ol',
 'es',
 'el',
 'segundo',
 'idioma',
 'mas',
 'hablado',
 'del',
 'mundo',
 'con',
 'mas',
 'de',
 '44',
 '##2',
 'millones',
 'de',
 'hablan',
 '##tes',
 '[SEP]']

In [15]:
# nº de tokens

len(tokens)

30

### 3.2 - Modelo QA

Usamos el modelo QA con el vector que acabamos de sacar del tokenizador:

In [16]:
# inicializacion del modelo QA

modelo_qa = AutoModelForQuestionAnswering.from_pretrained(modelo)

In [17]:
# descripcion del objeto

modelo_qa

BertForQuestionAnswering(
  (bert): BertModel(
    (embeddings): BertEmbeddings(
      (word_embeddings): Embedding(31002, 768, padding_idx=1)
      (position_embeddings): Embedding(512, 768)
      (token_type_embeddings): Embedding(2, 768)
      (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True)
      (dropout): Dropout(p=0.1, inplace=False)
    )
    (encoder): BertEncoder(
      (layer): ModuleList(
        (0-11): 12 x BertLayer(
          (attention): BertAttention(
            (self): BertSelfAttention(
              (query): Linear(in_features=768, out_features=768, bias=True)
              (key): Linear(in_features=768, out_features=768, bias=True)
              (value): Linear(in_features=768, out_features=768, bias=True)
              (dropout): Dropout(p=0.1, inplace=False)
            )
            (output): BertSelfOutput(
              (dense): Linear(in_features=768, out_features=768, bias=True)
              (LayerNorm): LayerNorm((768,), eps=1e-12, elem

El modelo `BertForQuestionAnswering` es una configuración especializada de BERT (Bidirectional Encoder Representations from Transformers) diseñada específicamente para tareas de QA. Este modelo es capaz de predecir las posiciones de inicio y fin de la respuesta en un texto dado, basado en una pregunta formulada. Vamos a desglosar los componentes clave de esta configuración del modelo para entender mejor cómo funciona:

1. BertModel: La base del modelo que proporciona las principales capacidades de procesamiento del lenguaje.
    + BertEmbeddings: Se encarga de convertir los tokens de entrada en vectores de características, que son representaciones densas y entrenables. Incluye:
        + word_embeddings: Mapea cada token a un vector de 768 dimensiones.
        + position_embeddings: Añade información de la posición de cada token dentro de la secuencia para mantener la noción del orden de las palabras.
        + token_type_embeddings: Diferencia entre varios tipos de tokens, por ejemplo, entre la pregunta y el contexto en QA.
        + LayerNorm y Dropout: Estos son mecanismos para normalizar y prevenir el sobreajuste durante el entrenamiento.


2. BertEncoder: Contiene múltiples capas de atención y transformaciones lineales para procesar las embeddings. Cada BertLayer realiza lo siguiente:
    + BertAttention: Maneja la atención auto-dirigida que permite al modelo prestar atención a diferentes partes de la entrada basándose en la pregunta.
        + BertSelfAttention: Utiliza transformaciones lineales (query, key, value) para generar las puntuaciones de atención y combina los resultados de acuerdo con estas puntuaciones.
    + BertSelfOutput y BertOutput: Estas subunidades procesan la salida del mecanismo de atención y luego la combinan con la entrada original de la capa (conexión residual), seguida de normalización y dropout.
    + BertIntermediate y BertOutput: Amplían y luego contraen las dimensiones de las características, respectivamente, y aplican la función de activación GELU en el proceso.


3. qa_outputs: Una capa lineal específica que toma la salida final de cada token desde el último encoder de BERT y la proyecta a un espacio de 2 dimensiones. Estas dos dimensiones representan las puntuaciones de cada token siendo el inicio y el fin de la respuesta. Por ejemplo, para un par de tokens en una entrada, esta capa determinará qué tan probable es que cada token sea el inicio o el fin de la respuesta a la pregunta formulada.




Funcionamiento del modelo QA:

+ Preparación: El texto de entrada se divide en tokens, y se añaden tokens especiales de BERT para marcar el inicio y el fin, así como para separar la pregunta del contexto.

+ Procesamiento: El texto tokenizado pasa a través del modelo BERT, donde se aprende a prestar atención a las partes relevantes del texto relacionadas con la pregunta.

+ Predicción de Respuesta: La última capa, qa_outputs, asigna puntuaciones a cada token indicando la probabilidad de que sean el inicio o el fin de la respuesta.

In [18]:
# resultado del modelo QA al darle el vector

resultado = modelo_qa(**vector)

resultado

QuestionAnsweringModelOutput(loss=None, start_logits=tensor([[  2.8641,  -7.7706,  -7.9311,  -7.2602,  -6.4896,  -7.1135, -10.0911,
          -7.0915,  -3.6097,  -0.8238,  -0.8169,  -7.1940,  -3.6554,  -3.0292,
          -1.4876,  -3.0732,  -3.2169,  -3.3532,  -3.2956,  -2.6370,   1.2541,
           5.7786,  -0.6602,   6.2068,  -1.4530,   1.7676,  -0.7707,   0.3704,
          -3.1695,  -3.6097]], grad_fn=<CloneBackward0>), end_logits=tensor([[ 2.8809, -7.5637, -6.8085, -5.1097, -6.2580, -8.3626, -5.9074, -6.4824,
         -3.3196, -2.3541, -5.4132, -2.3080, -4.3779, -4.9579, -3.5450, -3.0491,
         -1.4967, -1.5142, -3.5586, -1.3229, -0.6540, -1.5289,  0.0847, -0.1411,
          2.2514,  5.3837,  5.2996, -1.5660,  3.9766, -3.3192]],
       grad_fn=<CloneBackward0>), hidden_states=None, attentions=None)

El resultado del modelo tiene cinco atributos:

+ loss: Representa la pérdida calculada durante el entrenamiento del modelo. La pérdida es un indicador de rendimiento del modelo, donde un valor más bajo indica un mejor rendimiento. loss=None nos dice que el modelo se usa en modo de inferencia, donde no se calcula la pérdida.

+ start_logits: Tensor que contiene las puntuaciones para cada posición del texto como posible inicio de la respuesta.

+ end_logits: Tensor que contiene las puntuaciones para cada posición del texto como posible final de la respuesta.

+ hidden_states: Si se incluyera, representaría los estados ocultos de la salida de cada capa del modelo. Se suelen usar para análisis más detallados y para tareas avanzadas de procesamiento del lenguaje. Son las representaciones intermedias de la entrada que se generan dentro de las capas del modelo durante el proceso de transformación de los datos de entrada a la salida final.

+ attentions: Si se incluyeran, proporcionarían las matrices de atención de cada capa del modelo, que muestran cómo se enfoca el modelo en diferentes partes del texto para hacer sus predicciones. Son útiles para visualizar y entender cómo el modelo procesa y relaciona diferentes partes del texto.

Ahora, para conocer la respuesta, debemos calcular al argumento máximo tanto de start_logits como de end_logits y saber así que posiciones dentro de los tokens ocupa nuestra respuesta, porque eso es lo que hace el modelo, buscar dentro del contexto que parte es la respuesta y nos devuelve su posición.

In [19]:
# posición inicial de la respuesta

indice_inicio = resultado.start_logits.argmax()

indice_inicio

tensor(23)

In [20]:
# posición final de la respuesta

indice_final = resultado.end_logits.argmax()

indice_final

tensor(25)

Podríamos sacar directamente la respuesta desde los tokens, simplemente extrayendo desde la posición 23 a la 26. Sin embargo, recordemos que los tokens tiene algunas entidades separadas. Veamos como sería el proceso:

In [21]:
print(tokens)

['[CLS]', '¿', 'cuantas', 'personas', 'hablan', 'espan', '##ol', '?', '[SEP]', 'el', 'espan', '##ol', 'es', 'el', 'segundo', 'idioma', 'mas', 'hablado', 'del', 'mundo', 'con', 'mas', 'de', '44', '##2', 'millones', 'de', 'hablan', '##tes', '[SEP]']


In [22]:
# respuesta del modelo

tokens[23:26]

['44', '##2', 'millones']

Esta respuesta necesita una transformación para estar correctamante escrita. Hay otra manera de obtener la respuesta del modelo. El vector que sale del tokenizador puede ser convertido de vuelta en texto, sería el texto completo que entra en el modelo. Simplemente filtrado dicho vector y dándoselo al tokenizador de vuelta tendríamos perfectamente escrita nuestra respuesta:

In [23]:
# tensor que sale del tokenizador y entra al modelo, representa todo el texto

vector.input_ids[0]

tensor([    4,  1067, 14578,  1858, 10219, 30062,  1101,  1064,     5,  1040,
        30062,  1101,  1058,  1040,  2740,  8134,  2437,  7856,  1072,  1863,
         1051,  2437,  1008,  4974, 30973,  2439,  1008, 10219,  1205,     5])

In [24]:
# de vector a texto con el tokenizador

tokenizador.decode(vector.input_ids[0])

'[CLS] ¿ cuantas personas hablan espanol? [SEP] el espanol es el segundo idioma mas hablado del mundo con mas de 442 millones de hablantes [SEP]'

In [25]:
# extraemos el pedazo del tensor que corresponde con la respuesta

tensor_respuesta = vector.input_ids[0, indice_inicio : indice_final + 1]

tensor_respuesta

tensor([ 4974, 30973,  2439])

In [26]:
# respuesta en formato texto, skip_special_tokens=True elimina los tokens especiales si los hubiera

tokenizador.decode(tensor_respuesta, skip_special_tokens=True)

'442 millones'

Podemos ver ahora la pérdida (loss) que da el modelo, la métrica de rendimiento del modelo. Para ello importamos `torch` para crear los tensores con las dimensiones adecuadas y a continuación perdirle al modelo QA la pérdida que tiene para la respuesta. Esta pérdida será tanto mejor cuanto más cercana a cero sea la métrica.

In [27]:
# importamos torch

import torch

In [28]:
# respuesta del modelo para ese pedazo del texto (23-25)

respuesta = modelo_qa(**vector, 
                      start_positions=torch.tensor([23]), 
                      end_positions=torch.tensor([25]))

In [29]:
# pérdida

respuesta.loss.item()

0.6877423524856567

### 3.3 Resumen funcional

Vamos a poner todo el código junto en una sola función:

In [30]:
# librerías
import torch
from transformers import AutoTokenizer, AutoModelForQuestionAnswering



def qa(pregunta:str, contexto:str, modelo:str) -> str:
    
    """
    Función para modelo QA.
    
    Params:
    + pregunta: string. Pregunta que queremos hacer al modelo.
    + contexto: string. Texto al cual preguntamos
    + modelo: string. Nombre del modelo que vamos a usar, lo encontraremos el en hub de Hugging Face.
    
    Return:
    Esta función devuelve la respuesta del modelo en formato string.
    """
    
    
    
    # inicio tokenizador
    tokenizador = AutoTokenizer.from_pretrained(modelo)
    
    
    # creación del vector
    vector = tokenizador(pregunta, contexto, return_tensors='pt')
    
    
    # inicializacion del modelo QA
    modelo_qa = AutoModelForQuestionAnswering.from_pretrained(modelo)
    
    
    # resultado del modelo QA al darle el vector
    resultado = modelo_qa(**vector)
    
    
    # posición inicial de la respuesta
    indice_inicio = resultado.start_logits.argmax()
    
    
    # posición final de la respuesta
    indice_final = resultado.end_logits.argmax()
    
    
    # respuesta formato tensor
    tensor_respuesta = vector.input_ids[0, indice_inicio : indice_final + 1]
    
    
    # respuesta en formato texto
    respuesta = tokenizador.decode(tensor_respuesta, skip_special_tokens=True)
    
    return respuesta

In [31]:
# definimos pregunta, contexto y modelo

pregunta = '¿Cuántas personas hablan español?'


contexto = 'El español es el segundo idioma más hablado del mundo con más de 442 millones de hablantes'


modelo = 'mrm8488/bert-base-spanish-wwm-cased-finetuned-spa-squad2-es'

In [32]:
qa(pregunta, contexto, modelo)

'442 millones'

## 4 - Ejemplo con más contexto

Vamos a ver un ejemplo dándole al modelo un contexto con más de una frase. Copiamos un texto del [Canal de Suez](https://es.wikipedia.org/wiki/Canal_de_Suez) del artículo en Wikipedia y realizamos varias preguntas sobre ese texto. Usamos directamente el pipeline:

In [33]:
contexto = '''

El canal de Suez (en árabe, قناة السويس qanat al-Suways) es un canal artificial navegable situado en Egipto, 
que une el mar Mediterráneo con el golfo de Suez, en el mar Rojo, a través del istmo de Suez. 
El canal convirtió a la región del Sinaí en una nueva península, 
constituyendo la frontera entre los continentes de África y Asia. 
Su longitud es de 193 km entre Puerto Saíd, en la ribera mediterránea, y Suez, en la costa del mar Rojo.

Fue impulsado entre 1859 y 1869 por Fernando de Lesseps bajo la dirección del ingeniero 
Louis Maurice Adolphe Linant de Bellefonds. Pertenece a Egipto desde la nacionalización de la 
compañía franco-británica Suez Canal Company en 1956 y la posterior guerra del Sinaí en 1957.
El canal es de vital importancia para el abastecimiento europeo de petróleo y el comercio mundial en general, 
puesto que permite la comunicación entre Europa y el sur de Asia sin rodear el continente africano 
por el cabo de Buena Esperanza.

El canal se inauguró oficialmente el 17 de noviembre de 1869. 
Ofrece a los buques una ruta directa entre el Atlántico Norte y el Índico Norte 
a través del mar Mediterráneo y el mar Rojo, evitando el Atlántico Sur y el Índico Sur y 
reduciendo la distancia del viaje desde el mar Arábigo a Londres en aproximadamente 
8900 kilómetros (5500 mi), o de 10 días a 20 nudos (37 km/h; 23 mph) 
a 8 días a 24 nudos (44 km/h; 28 mph). El canal se extiende desde el extremo septentrional de 
Puerto Saíd hasta el extremo meridional de Port Tewfik, en la ciudad de Suez. 
Su longitud es de 193,30 kilómetros, incluidos los canales de acceso norte y sur. 
En 2020, más de 18 500 barcos atravesaron el canal (una media de 51,5 al día).

El canal original presentaba una vía de agua de un solo carril con lugares de paso en la 
Circunvalación de Ballah y el Gran Lago Amargo. Según los planes de Alois Negrelli, 
no contenía sistemas de esclusas, y el agua del mar fluía libremente por él. 
En general, el agua del canal al norte de los Lagos Amargos fluye hacia el norte en invierno y 
hacia el sur en verano. Al sur de los lagos, la corriente cambia con la marea en Suez.

'''

In [34]:
pregunta = '¿Cuándo se inauguró el canal de Suez?'

qa_pipe(question=pregunta, context=contexto)['answer']

'17 de noviembre de 1869'

In [35]:
pregunta = '¿Cuánto mide el canal?'

qa_pipe(question=pregunta, context=contexto)['answer']

'193 km'

In [36]:
pregunta = '¿Quién construyó el canal?'

qa_pipe(question=pregunta, context=contexto)['answer']

'Fernando de Lesseps'

In [37]:
pregunta = '¿En qué país está el canal?'

qa_pipe(question=pregunta, context=contexto)['answer']

'Egipto'

In [38]:
pregunta = '¿Cuántos barcos atravesaron el canal en 2020 el canal?'

qa_pipe(question=pregunta, context=contexto)['answer']

'18 500'

In [39]:
pregunta = '¿Dónde empieza el canal en el mediterráneo?'

qa_pipe(question=pregunta, context=contexto)['answer']

'Puerto Saíd'

In [40]:
pregunta = '¿Dónde acaba el canal en el mar rojo?'

qa_pipe(question=pregunta, context=contexto)['answer']

'golfo de Suez'

## 5 - Otro modelo QA

Ahora vamos a probar otro modele, esta vez en inglés. El modelo es un [RoBERTa](https://huggingface.co/deepset/roberta-base-squad2) diseñado para QA, tiene un peso aproximado de 500Mb. De nuevo usaremos un artículo de Wikipedia como contexto, está vez de la compañía [Apple Inc](https://en.wikipedia.org/wiki/Apple_Inc.). Usaremos directamente el pipeline igual que hicimos en el ejemplo anterior:

In [41]:
# definimos la tarea y el modelo

tarea = 'question-answering'  

modelo = 'deepset/roberta-base-squad2'   

In [42]:
qa_pipe = pipeline(task=tarea, model=modelo)

In [43]:
contexto = '''

Apple Inc. (formerly Apple Computer, Inc.) is an American multinational corporation and technology 
company headquartered in Cupertino, California, in Silicon Valley. It designs, develops, 
and sells consumer electronics, computer software, and online services. 
Devices include the iPhone, iPad, Mac, Apple Watch, Vision Pro, and Apple TV; 
operating systems include iOS, iPadOS, and macOS; and software applications and services include iTunes, 
iCloud, Apple Music, and Apple TV+.

For most of 2011 to 2024, Apple became the world's largest company by market capitalization until 
Microsoft assumed the position in January 2024. In 2022, Apple was the largest technology company by revenue, 
with US$394.3 billion. As of 2023, Apple was the fourth-largest personal computer vendor by unit sales,
the largest manufacturing company by revenue, and the largest vendor of mobile phones in the world.
It is one of the Big Five American information technology companies, alongside Alphabet 
(the parent company of Google), Amazon, Meta (the parent company of Facebook), and Microsoft.

Apple was founded as Apple Computer Company on April 1, 1976, to produce and market Steve Wozniak's 
Apple I personal computer. The company was incorporated by Wozniak and Steve Jobs in 1977. 
Its second computer, the Apple II, became a best seller as one of the first mass-produced microcomputers. 
Apple introduced the Lisa in 1983 and the Macintosh in 1984, as some of the first computers to 
use a graphical user interface and a mouse. By 1985, the company's internal problems included the high 
cost of its products and power struggles between executives. That year Jobs left Apple to form NeXT, Inc., 
and Wozniak withdrew to other ventures. The market for personal computers expanded and evolved throughout 
the 1990s, and Apple lost considerable market share to the lower-priced Wintel duopoly of the 
Microsoft Windows operating system on Intel-powered PC clones.

In 1997, Apple was weeks away from bankruptcy. To resolve its failed operating system strategy and entice 
Jobs's return, it bought NeXT. Over the next decade, Jobs guided Apple back to profitability through 
several tactics including introducing the iMac, iPod, iPhone, and iPad to critical acclaim, launching the 
"Think different" campaign and other memorable advertising campaigns, opening the Apple Store retail chain, 
and acquiring numerous companies to broaden its product portfolio. Jobs resigned in 2011 for health reasons, 
and died two months later. He was succeeded as CEO by Tim Cook.

Apple has received criticism regarding its contractors' labor practices, its environmental practices, 
and its business ethics, including anti-competitive practices and materials sourcing. 
Nevertheless, it has a large following and a high level of brand loyalty. 
It has been consistently ranked as one of the world's most valuable brands.

Apple became the first publicly traded U.S. company to be valued at over $1 trillion in August 2018, 
then at $2 trillion in August 2020, and at $3 trillion in January 2022. In June 2023, 
it was valued at just over $3 trillion.

'''

In [44]:
pregunta = "Who are Apple's founders?"

qa_pipe(question=pregunta, context=contexto)['answer']

'Wozniak and Steve Jobs'

In [45]:
pregunta = 'When was founded?'

qa_pipe(question=pregunta, context=contexto)['answer']

'1976'

In [46]:
pregunta = 'What are the devices sold by Apple?'

qa_pipe(question=pregunta, context=contexto)['answer']

'iMac, iPod, iPhone, and iPad'

In [47]:
pregunta = 'What is the benefit?'

qa_pipe(question=pregunta, context=contexto)['answer']

'high level of brand loyalty'

In [48]:
pregunta = "What is the company's value in 2018?"

qa_pipe(question=pregunta, context=contexto)['answer']

'over $1 trillion'

In [49]:
pregunta = "What is the company's value in 2023?"

qa_pipe(question=pregunta, context=contexto)['answer']

'$3 trillion'