# HUGGING FACE - INTRODUCCIÓN   

<img src="./img/huggingfacelogo.svg">

[Hugging Face](https://huggingface.co/) se fundó en 2016 con el objetivo de desarrollar una aplicación de chabot. A partir de 2018 comenzó a abrir a la comunidad open source partes de sus modelos NLP, los cuales ganaron popularidad dentro de la comunidad IA.

Gran parte de la fama adquirida por Hugging Face se debe a sus librerías, en concreto [Transformers](https://huggingface.co/docs/transformers/index) (para tratamiento de textos) y [Diffusers](https://huggingface.co/docs/diffusers/index) (para tareas de imagen), facilitando a los desarrolladores importar y trabajar con una gran variedad de modelos pre-entrenados.

## Traductor inglés-castellano usando la librería `Transformers`   

Usando la librería que nos proporciona Hugging Face para trabajar con modelos tipo `Transformers`, en pocas líneas de código se consigue cargar un modelo y crear un *pipeline* en el que se indica que el modelo en cuestión es para una tarea de traducción.    

Un *pipeline* es un 'elemento' que permite simplificar el código sin necesidad de gestionar detalles del modelo a usar.   

Creado el *pipeline*, este se invoca pasándole una frase como parámetro de entrada al modelo que, después de realizar la inferencia, este devuelve la frase traducida como salida.   

Veamos el código en cuestión:

In [None]:
# pip install transformers
# pip install tf-keras 
# pip uninstall keras (para evitar conflictos con tf-keras)
# pip install sentencepiece
# pip install sacremoses
from transformers import pipeline
# Frase original en inglés
frase_en = "I like to play basketball and being a geek"

  from .autonotebook import tqdm as notebook_tqdm
2025-03-15 17:23:49.350448: I external/local_xla/xla/tsl/cuda/cudart_stub.cc:32] Could not find cuda drivers on your machine, GPU will not be used.
2025-03-15 17:23:49.356023: I external/local_xla/xla/tsl/cuda/cudart_stub.cc:32] Could not find cuda drivers on your machine, GPU will not be used.
2025-03-15 17:23:49.372137: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:467] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
E0000 00:00:1742059429.394115   20736 cuda_dnn.cc:8579] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
E0000 00:00:1742059429.400244   20736 cuda_blas.cc:1407] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered
W0000 00:00:1742059429.416981   20736 computation_placer.cc:177] computation placer already

*Pipeline*

In [2]:
pipe = pipeline("translation", model="Helsinki-NLP/opus-mt-en-es")
frase_es = pipe(frase_en)

2025-03-15 17:24:20.955725: E external/local_xla/xla/stream_executor/cuda/cuda_platform.cc:51] failed call to cuInit: INTERNAL: CUDA error: Failed call to cuInit: UNKNOWN ERROR (303)
All model checkpoint layers were used when initializing TFMarianMTModel.

All the layers of TFMarianMTModel were initialized from the model checkpoint at Helsinki-NLP/opus-mt-en-es.
If your task is similar to the task the model of the checkpoint was trained on, you can already use TFMarianMTModel for predictions without further training.
Device set to use 0


Traducción

In [3]:
# Salida de la traducción
print("Traducción: ", frase_es[0]['translation_text'])

Traducción:  Me gusta jugar al baloncesto y ser un friki


## Generación de imágenes con `Diffusers`

En este caso, en lugar de la librería `transformers` , necesitamos utilizar la librería `diffusers` para generar datos similares a los datos con los que se ha entrenado.

Para ello se utiliza el modelo `Stable Diffusion` (una librería estándar de generación de imágenes), y, nuevamente, con unas pocas líneas de código es posible generar una imagen a petición del consumidor:

In [None]:
#pip install diffusers
#pip install torch
from diffusers import DiffusionPipeline
import torch

pipeline = DiffusionPipeline.from_pretrained("sd-legacy/stable-diffusion-v1-5", torch_dtype=torch.float16)
# pipeline.to("cuda") # Para usar GPU
pipeline.to("cpu") # Para usar CPU
pipeline("Una imagen de Batman sin máscara").images[0]

***NOTA***: Dado que este apartado requiere mucho tiempo y mucha capacidad de CPU/GPU se sube este notebook a COLAB