<a href="https://colab.research.google.com/github/Alejandro-sin/Learning-Path-to-AI/blob/master/LLM_OpenSource_Hugging_Face.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Hugging Faces


Hugging Face es una plataforma líder en inteligencia artificial de código abierto. Ofrece un repositorio de modelos, conjuntos de datos y espacios dedicados a la inferencia. Este notebook explora cómo utilizar algunas de las herramientas y modelos disponibles en Hugging Face para diversas tareas de procesamiento de lenguaje natural y generación de contenido multimedia.


In [1]:
!pip install -q transformers datasets diffusers

## Setup

In [2]:
# Use a pipeline as a high-level helper


## AUTH
from google.colab import userdata
from huggingface_hub import login


# TORCH - Diffsuser
import torch
from diffusers import FluxPipeline
from transformers import pipeline
from diffusers import DiffusionPipeline
from datasets import load_dataset

# Display Image and Sound
import soundfile as sf
from IPython.display import Audio, display
from PIL import Image



In [3]:
hf_token = userdata.get('HF')
login(hf_token, add_to_git_credential=True)

## Pipelines


Los pipelines en HugginFace proveen una interfaz de alto nivel para operar con los modelos, y realizar inferencias con los modelos ya entrenados. La idea es revisar algunas de las tareas que podemos hacer con los transformers.

- Analisis de Sentimientos
- Named Entity Recognition
- Preguntas y respuestas con contexto
- Resumen de texto
- Traducción y clasificaión
- Generación de imagenes, audio y video.
- Feature Extraction


### Anlisis de Sentimiento.


Utilizamos un pipeline de análisis de sentimiento para evaluar el tono de un texto. Este pipeline utiliza un modelo preentrenado para clasificar el texto como positivo o negativo.

In [None]:
classifier = pipeline("sentiment-analysis", device="cuda")
result = classifier("""Rainer Maria Rilke is considered one of the most lyrically intense German-language poets.
            His work spans the late 19th and early 20th centuries, bridging the gap between the traditional Romantic era and the rising tide of Modernism.""")
print(result)

No model was supplied, defaulted to distilbert/distilbert-base-uncased-finetuned-sst-2-english and revision 714eb0f (https://huggingface.co/distilbert/distilbert-base-uncased-finetuned-sst-2-english).
Using a pipeline without specifying a model name and revision in production is not recommended.
The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.
Device set to use cuda



### Extracción de Entidades Nombradas (NER)

La extracción de entidades nombradas es una tarea común en el procesamiento de lenguaje natural. Aquí, etiquetamos el texto con diferentes categorías como personas, organizaciones y lugares. También mostramos cómo utilizar un modelo especializado para contextos médicos.


- Si no pasamos un modelo en concreto lo que sucederá es que se usará uno por defecto, en este caso se usó el modelo por defecto para texto en inglés `dbmdz/bert-large-cased-finetuned-conll03-english`

- Podemos usar ejemplos más especializados, por ejemplo para contextos medicos donde el modelo se finetuneo para reconocer estas entidades. `blaze999/Medical-NER`

In [None]:
ner = pipeline("ner", grouped_entities=True, device="cuda")
result = ner("""Barack Obama was the 44th president of the United States""")


In [None]:
print(result)

In [None]:
ner = pipeline("token-classification", model="blaze999/Medical-NER")
result = ner("""A 48 year-old female presented with vaginal bleeding and abnormal Pap smears.
Upon diagnosis of invasive non-keratinizing SCC of the cervix, she underwent a radical hysterectomy with salpingo-oophorectomy
which demonstrated positive spread to the pelvic lymph nodes and the parametrium.
Pathological examination revealed that the tumour also extensively involved the lower uterine segment.""")
print(result)

### Preguntas y Respuestas

Este pipeline permite responder preguntas basadas en un contexto proporcionado. Es útil para tareas de comprensión de lectura y búsqueda de información.

In [None]:
question_answerer = pipeline("question-answering", device="cuda")
result = question_answerer(question="Who was the 44th president of the United States?", context="Barack Obama was the 44th president of the United States.")
print(result)

### Resumenes

Generamos resúmenes de texto utilizando un pipeline de resumen. Esto es útil para condensar información extensa en un formato más manejable.

In [None]:
summarizer = pipeline("summarization", device="cuda")
text = """A knowledge graph, also known as a semantic network, represents a network of real-world entities—such as objects, events,
situations or concepts—and illustrates the relationship between them.
This information is usually stored in a graph database and visualized as a graph structure, prompting the term knowledge “graph.”
"""
summary = summarizer(text, max_length=50, min_length=25, do_sample=False)
print(summary[0]['summary_text'])

Podemos usar generadores también para producir los resultados

In [None]:
text = """A knowledge graph, also known as a semantic network, represents a network of real-world entities—such as objects, events,
    situations or concepts—and illustrates the relationship between them.
    This information is usually stored in a graph database and visualized as a graph structure, prompting the term knowledge “graph.”
"""
summarizer = pipeline("summarization", device="cuda")

def pipeline_generator(text):
  '''
  Función sencilla para resumir texto.

  '''
  sentinel = 0
  while True:
    summary = summarizer(text, max_length=50, min_length=25, do_sample=False)
    if sentinel == 1:
      break
    sentinel += 1
    yield summary[0]['summary_text']

for n in pipeline_generator(text):
  print(n)

### Traducción

Utilizamos modelos de traducción para convertir texto de un idioma a otro. Aquí mostramos ejemplos de traducción de inglés a francés y español.

In [None]:
translator = pipeline("translation_en_to_fr", device="cuda")
result = translator("The Data Scientists were truly amazed by the power and simplicity of the HuggingFace pipeline API.")
print(result[0]['translation_text'])

In [None]:
# All translation models are here: https://huggingface.co/models?pipeline_tag=translation&sort=trending

translator = pipeline("translation_en_to_es", model="Helsinki-NLP/opus-mt-en-es", device="cuda")
result = translator("The Data Scientists were truly amazed by the power and simplicity of the HuggingFace pipeline API.")
print(result[0]['translation_text'])

## Clasificación de Texto

La clasificación de texto permite categorizar texto en diferentes etiquetas. Utilizamos un pipeline de clasificación sin entrenamiento previo para clasificar un texto en categorías como tecnología, deportes y política.

In [None]:
# Reutilicemos el texto de los grafos de conocimiento para clasificar.
classifier = pipeline("zero-shot-classification", device="cuda")
result = classifier(text, candidate_labels=["technology", "sports", "politics"])
print(result)

### Generación de Imágenes

Exploramos la generación de imágenes a partir de texto utilizando modelos de difusión. Estos modelos pueden crear imágenes en estilos artísticos específicos basados en descripciones textuales.


In [None]:
if 1==1:
  image_gen = DiffusionPipeline.from_pretrained(
      "stabilityai/stable-diffusion-2",
      torch_dtype=torch.float16,
      use_safetensors=True,
      variant="fp16"
      ).to("cuda")

  #text = "A reunion of Genius and Maldoror talking each other, in the surreal style of Salvador Dali"
  text = "A lonely person flying and dreaming, in the style of Impresionism of Monet"
  image = image_gen(prompt=text).images[0]
  display(image)
  # image.save("surreal.png")


# Requieres more GPU like A100
if 1==0:
  pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-schnell", torch_dtype=torch.bfloat16).to("cuda")
  generator = torch.Generator(device="cuda").manual_seed(0)
  prompt = "A futuristic class full of students learning AI coding in the surreal style of Salvador Dali"

  # Generate the image using the GPU
  image = pipe(
      prompt,
      guidance_scale=0.0,
      num_inference_steps=4,
      max_sequence_length=256,
      generator=generator
  ).images[0]



In [None]:
image.save("lonely_person.png")

### Generación de Audio

Generamos audio a partir de texto utilizando un modelo de síntesis de voz. Este pipeline convierte texto en habla, permitiendo la creación de contenido auditivo.



In [None]:
if 1==0:
  synthesiser = pipeline("text-to-speech", "microsoft/speecht5_tts", device='cuda')
  embeddings_dataset = load_dataset("Matthijs/cmu-arctic-xvectors", split="validation")
  speaker_embedding = torch.tensor(embeddings_dataset[7306]["xvector"]).unsqueeze(0)
  speech = synthesiser("We cant fail if we learn from it", forward_params={"speaker_embeddings": speaker_embedding})
  sf.write("speech.wav", speech["audio"], samplerate=speech["sampling_rate"])
  Audio("speech.wav")

### Generación de Video

Finalmente, exploramos la generación de video a partir de imágenes. Este proceso requiere más recursos de hardware y es un área emergente en la generación de contenido multimedia.


In [None]:
if 1==0:
  # Esto requiere de mucha más RAM pra ejecutarse
  # Cargar una imagen de ejemplo
  image_path = "/content/lonely_person.png"
  image = Image.open(image_path)

  pipe = DiffusionPipeline.from_pretrained("stabilityai/stable-video-diffusion-img2vid-xt")
  # Ejecutar la generación de video con la imagen de entrada
  output = pipe(image=image)

  # Guardar el primer frame del video generado
  output.images[0].save("output_frame.png")