# Introducción a los Large Language Models (LLMs) usando Python
### Percepción Computacional - Universidad de los Hemisferios
#### Maestría en Inteligencia Artificial Aplicada

## Objetivo:
El objetivo de este taller es introducir a los estudiantes a los conceptos básicos de los large language models (LLMs) y proporcionarles una experiencia práctica utilizando bibliotecas de Hugging Face para trabajar con modelos preentrenados de lenguaje natural.

## Contenido:
1. Introducción a los Large Language Models (LLMs)
2. Configuración del entorno
3. Ejemplos prácticos
4. Ejercicio

## 1. Introducción a los Large Language Models (LLMs)

Los large language models (LLMs) son modelos de inteligencia artificial que han sido entrenados en grandes cantidades de texto para comprender y generar lenguaje natural. Estos modelos pueden realizar una variedad de tareas de procesamiento de lenguaje natural (NLP) como traducción, resumen, generación de texto, respuesta a preguntas, entre otros.

## 2. Configuración del entorno

Para este taller, utilizaremos la biblioteca `transformers` de Hugging Face. Primero, necesitamos instalar las bibliotecas necesarias.


In [16]:
# Instalación de la biblioteca transformers y torch
!pip install transformers
!pip install torch
!pip install tf-keras

Collecting tf-keras
  Downloading tf_keras-2.16.0-py3-none-any.whl.metadata (1.6 kB)
Downloading tf_keras-2.16.0-py3-none-any.whl (1.7 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.7/1.7 MB[0m [31m1.4 MB/s[0m eta [36m0:00:00[0m00:01[0m00:01[0m0m
[?25hInstalling collected packages: tf-keras
Successfully installed tf-keras-2.16.0


Importamos `pipeline` de la librería `transformers`

In [2]:
from transformers import pipeline

  from .autonotebook import tqdm as notebook_tqdm
2024-06-19 19:58:24.031212: I tensorflow/core/platform/cpu_feature_guard.cc:210] This TensorFlow binary is optimized to use available CPU instructions in performance-critical operations.
To enable the following instructions: AVX2 FMA, in other operations, rebuild TensorFlow with the appropriate compiler flags.
Found Intel OpenMP ('libiomp') and LLVM OpenMP ('libomp') loaded at
the same time. Both libraries are known to be incompatible and this
can cause random crashes or deadlocks on Linux when loaded in the
same Python program.
Using threadpoolctl may cause crashes or deadlocks. For more
information and possible workarounds, please see
    https://github.com/joblib/threadpoolctl/blob/master/multiple_openmp.md



## 3. Ejemplos prácticos de carga y uso de modelos preentrenados

### 3.1 Generación de texto (`text-generation`)

Vamos a cargar un modelo preentrenado de Hugging Face y usarlo para generar texto.

In [1]:
# Cargamos un pipeline de generación de texto
generator = pipeline('text-generation', model='gpt2')

# Generamos texto con el modelo cargado
text = generator("Había una vez", max_length=50, num_return_sequences=1)
print(text[0]['generated_text'])

NameError: name 'pipeline' is not defined

Ahora usamos el modelo para la generación de texto mediante prompts

In [23]:
# Ejemplo de generación de texto con diferentes prompts
prompts = [
    "In the future, AI will",
    "The secret to happiness is",
    "The quick brown fox"
]

for prompt in prompts:
    text = generator(prompt, max_length=50, num_return_sequences=1)
    print(f"Prompt: {prompt}")
    print(f"Generated Text: {text[0]['generated_text']}\n")

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Prompt: In the future, AI will
Generated Text: In the future, AI will allow people on both sides of the Atlantic to work together, providing more personalized access for consumers.

"It is still years from when the ability will be there to understand each other," said Paul R. Litt



Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Prompt: The secret to happiness is
Generated Text: The secret to happiness is to avoid getting yourself into the middle of a bunch of ugly fights.


Don't let your life feel like you've taken too much, and use that time to enjoy your time with family and friends.


Focus

Prompt: The quick brown fox
Generated Text: The quick brown fox was the second favorite, after the yellow fox was a favorite with the other two. Though only two people could pick on the second, the white fox and their yellow colleagues did so because of their natural behavior. "Brown foxes



### 3.2 Respuesta a preguntas (`question-answering`)

Podemos usar un pipeline de respuesta a preguntas para encontrar respuestas dentro de un contexto proporcionado.

In [24]:
# Cargamos un pipeline de respuesta a preguntas
qa_pipeline = pipeline('question-answering')

# Definimos el contexto y la pregunta
context = "La Universidad de los Hemisferios es una universidad reconocida por su calidad académica dentro de Ecuador."
question = "¿Qué hacen los estudiantes en la Universidad de los Hemisferios?"

# Obtenemos la respuesta
result = qa_pipeline(question=question, context=context)
print(f"Pregunta: {question}")
print(f"Respuesta: {result['answer']}")

No model was supplied, defaulted to distilbert/distilbert-base-cased-distilled-squad and revision 626af31 (https://huggingface.co/distilbert/distilbert-base-cased-distilled-squad).
Using a pipeline without specifying a model name and revision in production is not recommended.


Pregunta: ¿Qué hacen los estudiantes en la Universidad de los Hemisferios?
Respuesta: Ecuador


### 3.3 Resumen de texto

Usa un modelo preentrenado para generar un resumen de un texto largo.

In [25]:
# Cargamos un pipeline de resumen
summarizer = pipeline('summarization')

# Texto largo para resumir
long_text = """
La inteligencia artificial (IA) se refiere a la simulación de la inteligencia humana en máquinas que están programadas para pensar como humanos y 
imitar sus acciones. El término también se puede aplicar a cualquier máquina que exhiba rasgos asociados con una mente humana como el aprendizaje y 
la resolución de problemas. La característica ideal de la inteligencia artificial es su capacidad para racionalizar y tomar acciones que tengan 
la mejor posibilidad de alcanzar un objetivo específico. Un subconjunto de la inteligencia artificial es el aprendizaje automático, que se refiere a 
la idea de que los sistemas informáticos pueden aprender de datos, identificar patrones y tomar decisiones con una mínima intervención humana.
"""

# Generamos el resumen
summary = summarizer(long_text, max_length=50, min_length=25, do_sample=False)
print("Resumen:")
print(summary[0]['summary_text'])

No model was supplied, defaulted to sshleifer/distilbart-cnn-12-6 and revision a4f8f3e (https://huggingface.co/sshleifer/distilbart-cnn-12-6).
Using a pipeline without specifying a model name and revision in production is not recommended.


### 3.4 Traducción de texto (`translation`)

Usamos un modelo traductor preentrenado de inglés a español

In [None]:
# Cargamos un pipeline de traducción especificando el modelo
translation_pipeline = pipeline('translation', model='Helsinki-NLP/opus-mt-en-es')

# Definimos el texto a traducir
text = "Persistent homology is a method for computing topological features of a space at different spatial resolutions. More persistent features are detected over a wide range of spatial scales and are deemed more likely to represent true features of the underlying space rather than artifacts of sampling, noise, or particular choice of parameters"

# Obtenemos la traducción.
result = translation_pipeline(text)
print(f"Texto original: {text}")
print(f"Traducción: {result[0]['translation_text']}")

### 3.4 Análisis de sentimientos (`sentiment-analysis`)

Ahora usaremos un modelo de análisis de sentimientos para predecir si el texto es positivo o negativo.

In [None]:
# Load the sentiment analysis pipeline
sentiment_analyzer = pipeline("sentiment-analysis")

# Text to analyze sentiment
text = "I'm feeling very happy today because I just got promoted at work! It's such a great day and I'm excited about the new opportunities ahead. However, I'm a bit nervous about the new responsibilities, but overall, I think this is a positive change."

# Perform sentiment analysis
sentiment_result = sentiment_analyzer(text)

# Print the sentiment result
print("Sentiment Analysis Result:")
for result in sentiment_result:
    print(f"Label: {result['label']}, Score: {result['score']}")

In [None]:
from transformers import pipeline
import pandas as pd

# Load a table-question-answering pipeline
table_qa = pipeline("table-question-answering", model="google/tapas-base-finetuned-wtq")

# Create a table as a pandas DataFrame
data = {
    "Name": ["Gaby", "May", "Andre"],
    "Age": ["23", "26", "23"],  # Ensure all entries are strings
    "Interest": ["Persistent Homology", "Numerical Analysis", "Functinal Analysis"]
}
table = pd.DataFrame(data)

# Ensure the table is in the correct format
print("Table:")
print(table)

# Question about the table
question = "What is Gaby interest?"

# Generate the answer
answer = table_qa(table=table, query=question)

# Print the question and the answer
print("Question:", question)
print("Answer:", answer['answer'])

## Tarea en clase:

Ahora usa 3 de las otras posibles tareas disponibles:

**Tiempo estimado:** 15min

Al final del tiempo establecido, 5 estudiantes voluntarios podrán presentar sus tareas al grupo. Por cada estudiante, se realizará un repaso de una pregunta que podría ser incluida en la Evaluación de la Unidad.

- 'audio-classification'
- 'automatic-speech-recognition'
- 'conversational'
- 'depth-estimation'
- 'document-question-answering'
- 'feature-extraction'
- 'fill-mask'
- 'image-classification'
- 'image-feature-extraction'
- 'image-segmentation'
- 'image-to-image'
- 'image-to-text'
- 'mask-generation'
- 'ner', 'object-detection'
- 'question-answering'
- 'sentiment-analysis'
- 'summarization'
- 'table-question-answering'
- 'text-classification'
- 'text-generation'
- 'text-to-audio'
- 'text-to-speech'
- 'text2text-generation'
- 'token-classification'
- 'translation'
- 'video-classification'
- 'visual-question-answering'
- 'vqa'
- 'zero-shot-audio-classification'
- 'zero-shot-classification'
- 'zero-shot-image-classification'
- 'zero-shot-object-detection'
- 'translation_XX_to_YY'