
# Prueba de difusores

Stable Diffusion

Link:  https://huggingface.co/stable-diffusion-v1-5/stable-diffusion-v1-5

Stable Diffusion es un modelo de aprendizaje autom√°tico desarrollado por Runway y LMU M√∫nich‚Äã para generar im√°genes digitales de alta calidad a partir de descripciones en lenguaje natural o est√≠mulos.

Para poder usar las ventajas de Stable Difussion se necesita un procesador que permita realizar operaciones especiales con el modelo, es necesario un acelerador de procesamiento gr√°fico, como el de las tarejetas de aceleraci√≥n gr√°fica para los videojuegos, se debe elegir T4 GPU en el entorno de ejecuci√≥n.

# Herramientas de apoyo

**Transformers** es una librer√≠a que facilita el uso de los modelos largos de lenguajes, sentencepiece es otra herramientaque que permite codificar y decodificar en tokens las consultas que se le hacen a un modelo largo de lenguaje, y accelerate permite detectar autom√°ticamente el tipo de configuraci√≥n distribuida que se tiene disponible en una m√°quina virtual e inicializar√° todos los componentes necesarios para el uso de un modelo largo de lenguaje.

**Difusers** es otra librer√≠a, de hugging face, que es se utiliza como referencia para modelos de difusi√≥n previamente entrenados de √∫ltima generaci√≥n para generar im√°genes, audio e incluso estructuras 3D de mol√©culas.

**IPython**, como librer√≠a, es la arquitectura sobre la cual trabaja un cuaderno de Jupyter, o sea, da la facilidad de interacci√≥n que ya se est√° usa en la herramienta actual... pero se puede usar como liber√≠a tambi√©n para facilitar, en este caso, la muestra de im√°genes desde la ejecuci√≥n de c√≥digos.

In [None]:
# Instalaci√≥n de paquetes de python en la m√°quina virtual
# ü§ó Transformers proporciona APIs para descargar y entrenar f√°cilmente modelos preentrenados de √∫ltima generaci√≥n
!pip install transformers
# Diffusers es la biblioteca que permite manejar datos difusos de modelos de artes preentrenados
!pip install diffusers

# Integrar las herramientas necesarias

Una vez instaladas las herramientas se deben utilizar en los c√≥digos de programaci√≥n, para ello se utilizan las sentencias de import, con la que se agrega la facultad al programa de poder utilizarlas

In [None]:
import torch                                   # Activar computaci√≥n de Tensores con aceleraci√≥n de GPU
from diffusers import StableDiffusionPipeline  # Atajo para usar el modelo de arte pre-entrenados Stable Difussion
from IPython.display import Image              # Se agrega el componente que permite leer y mostrar imagenes

# Descargar el modelo de Stable Diffusion

Para poder usar el modelo se necesita descargarlo desde la web, este proceso tarda un poco, pero es normal, los modelos para IA en la actualidad son grandes.

In [None]:
# Se utilizar√° una variable para que en caso futuro pueda modificarse la ruta o versi√≥n del modelo
model_id = "stable-diffusion-v1-5/stable-diffusion-v1-5"
# Se instancia una variable para indicar la descarga y forma de uso del modelo preentrenado
sd_pipeline = StableDiffusionPipeline.from_pretrained( model_id, torch_dtype=torch.float16 )

Luego de la descarga, hay que indicarle al modelo que tipo de arquitectura de procesamiento debe realizar, como la m√°quina virtual se configur√≥ para que poseea tarjeta gr√°fica especial, se debe indicarle el tipo de aceleraci√≥n que debera utilizar el modelo para generar im√°genes.

In [None]:
# Se le indica que formato de procesador de aceleraci√≥n debe usar para generar las im√°genes
sd_pipeline = sd_pipeline.to( "cuda" )

# Facilitando el uso del modelo Stable Diffusion

Es de gran utilidad crear funciones, dado que facilitan el uso de conjuntos de instrucciones grandes donde utilizaremos pocos valores, valores que se pasar√°n como par√°metros a la funci√≥n, para usar el modelo de Stable Difussion con la tuber√≠a especial, lo bueno ser√≠a enviarle un prompt, pero tambi√©n se le dar√° un prompt negativo para evitar que genere im√°genes de mala calidad o muy extra√±as

In [None]:
# Definir una funci√≥n para indicarle al modelo que nos de una imagen mediante una orden
def obtener_imagen( orden ) :
    # Crear un prompt negativo, una lista de cosas que no queremos que considere para generar una imagen
    lo_que_no_queremos = """
    simple_background,duplicate,low quality,lowest quality,
    bad anatomy,bad proportions,extra digits,lowers,username,
    artist name,error, duplicate,watermark,signature,text,
    extra digit,fewer digits,worst quality,jpeg artifacts,blury
    """
    # Devolver el resultado de la orden directamente con la imagen generada
    return sd_pipeline( orden, negative_prompt = lo_que_no_queremos ).images[0]

# Probando el funcionamiento

Con la funci√≥n ya creada, se debe probar, utilizando un prompot simple, se le indicar√° en una variable que se desea generar y se usar√° la funci√≥n para que devuelva la imagen, la guarde en la m√°quina virtual y luego la muestre

In [None]:
# Se crea una variable con el prompt
prompt = """
Gato pirata en lancha de madera
"""
# Se genera la imagen utilizando la funci√≥n que se prepar√≥ previamente
imagen_generada = obtener_imagen( prompt )
# Guardar la imagen en la m√°quina virtual
imagen_generada.save( "./llama.jpg" )
# Mostrar el contenido del prompt que se us√≥
print( prompt )
# Mostrar la imagen guardada
Image("./llama.jpg")

# Lanz√°ndola a la web

Para permitir que el uso sea mucho m√°s f√°cil, y adem√°s poder compartir con otras personas la creaci√≥n de im√°genes, se puede lograr mediante una aplicaci√≥n web, y para eso se necesita una herramienta para crear ese tipo de aplicaciones

# Instalando la herramienta para crear aplicaciones web

Se necesitar√° una herramienta que facilite crear interfaces amigables de tipo web, y gradio es otra librer√≠a que se puede utilizar para facilitar esa tarea, se instala con el administrador de paquetes pip

In [None]:
# Instalar otro paquete para python en la m√°quina virtual, pero con una versi√≥n espec√≠fica
!pip install gradio==3.48.0

# Integrando las herramientas para la web

Para utilizarla se importar√° como una liber√≠a, pero tambi√©n se necesita otra librer√≠a especial para indicarle que la codificaci√≥n del texto debe ser aceptable y con s√≠mbolos reconocibles en la web (*UTF-8*)

In [None]:
# Importar
import locale        # Librer√≠a de configuraci√≥n formato de car√°cteres para la web
import gradio as gr  # Librer√≠a que facilita la creaci√≥n de aplicaciones web

# Eligiendo la codificaci√≥n de textos de la aplicaci√≥n web

Se debe indicar que se usar√° la codificaci√≥n especial UTF-8 a todos los textos que se generen para ser mostrados y utilizados en las interfaces web.

In [None]:
# Definir la codificaci√≥n de caract√©res a utilizar con el formato UTF-8
locale.getpreferredencoding = lambda: "UTF-8"

# Dise√±ando la interfaz de la aplicaci√≥n web

Para poder crear una interfaz web lo correcto es dise√±ar primero la idea:
* Se necesitar√° inicialmente un espacio (textarea) para poder escribir el prompt de entrada
* Tambi√©n deber√° existir un espacio (imagen) para que se pueda mostrar la imagen generada
* Asingar un t√≠tulo no es mala idea, identificar√° a la aplicaci√≥n web
* Y tambi√©n una descripci√≥n de la aplicaci√≥n para darle elegancia
* Se puede indicar como ser√≠an unos ejemplos de prompt a utiizar

Todos estos elementos ser√°n √∫tiles, pero realmente, lo mas importante es saber a que funci√≥n se le har√° responsable de recibir los valores, y que tambi√©n nos devolver√° una respuesta, la funci√≥n a utilizar ser√° la que se denomin√≥ como **obtener_imagen**

In [None]:
# Dise√±o de la aplicaci√≥n web
# Una variable que definir√° una caja para introducir texto
caja_de_entrada  = gr.Textbox( label = "Escribe Tu Prompt Aqui" )
# Otra variable que definir√° una caja para mostrar texto
caja_de_salida   = gr.Image(   label = "Resultado"              )
# Una variable m√°s para darle un t√≠tulo a la aplicaci√≥n web
titulo_de_mi_app = "Generador de Im√°genes Cheveres"
# Podr√≠a ser √∫til usar una variable para mostrar la descripci√≥n de la aplicaci√≥n
descripcion_app  = "Herramienta para generar im√°genes con Stable Diffusion"
# Un conjunto de ejemplos para poder utilizar como entradas de textos
ejemplos         = [
    "Nave espacial de hormigas exploradoras" ,
    "Barco de conejos cruzando el oc√©ano"
]
# La agrupaci√≥n de todo en una sola interfaz de gradio
interfaz = gr.Interface(
    fn             = obtener_imagen      ,
    inputs         = [ caja_de_entrada ] ,
    outputs        = [ caja_de_salida  ] ,
    title          = titulo_de_mi_app    ,
    description    = descripcion_app     ,
    examples       = ejemplos            ,
    allow_flagging = "never"               # Desaparece un bot√≥n llamado Flag
)

# Utilizando la aplicaci√≥n web

El dise√±o que ya est√° listo debe ser ejecutado y puede ser tambi√©n publicado, la herramienta grado permite utilziar la interfaz creada a travez de un tunel, publicando la interfaz y haciendola accesible a mas usuarios a trav√©s de Internet por lo que brindar√° una url para poder compartirla

In [None]:
#Lanzamiento de la aplicaci√≥n web
interfaz.launch( share = True )

# Finalizando la aplicaci√≥n web

Cuando ya se ha probado la aplicaci√≥n es correcto detener el servicio para que no se desperdicie el tiempo de uso, tanto de las unidades de CPU de Google Colab, como el servicio de publicaci√≥n de la herramienta del tunel al sitio de gradio

In [None]:
# Detener la aplciaci√≥n web
interfaz.close()