# Natasquad Hackathon
Este notebook ha sido realizado para presentarse al hackathon de Natasquad. Para más información dirigirse al [sitio del hackathon](https://hackathon.natasquad.com/)

# Notas importantes

## GPU

El notebook que se le presenta fue realizado y probado utilizando un entorno de ejecución de Google Colab con GPU T4. Verifique que su entorno de ejecución tiene una GPU disponible.

## Dependiente del prompt

Los modelos generativos tienen sus propias limitaciones. El resultado es fuertemente dependiente del prompt y el elemento artístico de la generación puede no ser satisfactorio en todos los casos. Se recomienda hacer un poco de Prompt Engineering para mejores resultados. Usualmente funciona mejor con elementos que puedan tener forma de código QR, los que tienen formas muy específicas suelen presentar peores resultados. Los prompts de *birdview* suelen tener buenos resultados

## Tiempo de ejecución

Se espera que la generación se demore aproximadamente 5 minutos. Ante más pasos se demorará más, pero debido a que por lo menos genera 5 imágenes, la demora mínima sería aproximadamente 2 minutos.

## Idioma

El texto en este notebook se encuentra en español por la naturaleza del hackaton, sin embargo los nombres de variables, comentarios, etc se encuentran en inglés por convenio.

# Descripción del problema 6: QR Code Design

## Introducción

Las IA de generación de imágenes se refieren a una clase de algoritmos de inteligencia artificial conocidos como modelos generativos. Estos modelos se entrenan con grandes cantidades de datos visuales y aprenden a generar nuevas imágenes que imitan la distribución de los datos de entrenamiento. Modelos recientes como Midjourney y Stable Difussion han demostrado una impresionante habilidad para generar imágenes de alta calidad y detalladas, abriendo nuevas posibilidades en una variedad de campos. En este problema los participantes deberán desarrollar un sistema utilizando Inteligencia Artificial generativa para transformar códigos QR estándar en imágenes más estéticamente agradables, preservando al mismo tiempo su funcionalidad.

## Importancia

La generación de imágenes mediante IA puede ser de gran importancia para las empresas en varios sectores. Para los diseñadores, puede servir como una valiosa herramienta de asistencia creativa, generando nuevos conceptos y diseños basados en parámetros y estilos definidos. En el campo del marketing, puede utilizarse para crear contenido visual para campañas publicitarias o para generar variaciones de imágenes de productos para pruebas A/B. Además, la generación de imágenes mediante IA también puede ser útil para la creación de contenido en medios de comunicación y entretenimiento, como videojuegos y películas. La capacidad de generar rápidamente una gran cantidad de imágenes detalladas y realistas puede ahorrar tiempo y recursos, y permitir un grado de personalización y variación que sería difícil de lograr de otra manera.

## Desarrollo del problema técnico

Se quiere desarrollar un sistema utilizando Inteligencia Artificial generativa para transformar códigos QR estándar en imágenes más estéticamente agradables, preservando al mismo tiempo su funcionalidad.

Visión general: Los códigos QR están en todas partes en el entorno digital de hoy, ofreciendo una solución simple de escaneo y uso para acceder a contenido digital. Sin embargo, su diseño carece de atractivo estético y generalmente no se alinea con la marca o el lenguaje de diseño de los materiales en los que se colocan. Este proyecto desafía el desarrollo de un sistema que emplea Inteligencia Artificial generativa para rediseñar códigos QR en imágenes visualmente atractivas que sean congruentes con la marca asociada o el tema de diseño, todo mientras mantiene la funcionalidad del código QR.

El sistema debe generar imágenes de alta calidad que incorporen el código QR de una manera visualmente atractiva, pero que aún permita que el código sea escaneado de manera efectiva.

El sistema debe ofrecer un grado de personalización, permitiendo a los usuarios especificar ciertos aspectos estéticos, como esquemas de colores, elementos gráficos o estilos que se alineen con su marca o el contexto específico en el que se utilizará el código QR.

El sistema debe asegurarse de que los códigos QR resultantes sigan siendo funcionales y compatibles con los lectores de códigos QR estándar.

El sistema debe ser escalable para soportar altos volúmenes de transformaciones de códigos QR y lo suficientemente adaptable para ser integrado en diversas plataformas y aplicaciones digitales.

# Proceso

## Conocimiento previo

La primera vez que escuché del uso de la IA generativa como la solicitada fue a través del canal DotCSV, que siempre resumen lo más actual e interesante de las nuevas tecnologías (Ver [CONTROLAR a Stable Diffusion, más fácil que nunca con ControlNet! (+Tutorial)](https://youtu.be/owHKDZMoWIM))

## Primer acercamiento

Inicialmente mientras esperaba por la API key de [stability.ai](https://stability.ai/) intenté realizar una implementación guíandome por este post que encontré: [How to generate a QR code with Stable Diffusion](https://stable-diffusion-art.com/qr-code/). En general en mi búsqueda encontré varias publicaciones similares, pero esta parecía la mejor.

Se logró alcanzar resultados, pero no eran muy satisfactorios o fáciles de escanear. Obtener algo satisfactorio requería mucho juego con los parámetros y se hacía necesario realizar demasiado cherry picking.

## Con la API Key

Al obtener la API Key se abrieron nuevas posibilidades y probablemente con mejores y mayores recursos que los que ya estaba utilizando.

Sin embargo, aunque la API abrió nuevas puertas y fue bastante fácil implementar una solución, esta tendía a ser demasiado simple para poder ser escaneable, muy poco artística. Esto se debía principalmente a no poder utilizar un modelo de ControNet pre-entrenado.

## La vía final

Paralelamente a las vías anteriores estuve utilizando una IA con LLM para buscar la web y obtener explicaciones (Lo cuál se puede ver en [perplexity.ai](https://www.perplexity.ai/search/8275e2c3-f1fa-4aa7-afa7-bba52d0d74de)). Aunque el código que proveía probaba ser insuficiente o incorrecto, sirvió como guía para entender mejor algunos elementos. Además de eso Perplexity incluye los resultados de las búsquedas que realiza y entre ellos encontré [QR Code AI Art Generator](https://huggingface.co/spaces/huggingface-projects/QR-code-AI-art-generator). Este repositorio sí estaba bastante bien hecho, así que lo cloné y manos a la obra.

Lo mejor que tiene esta nueva vía es que tiene bien planteados los requerimientos, así que se sabe exactamente que instalar para poder usarlo, punto en el que fallaban las vías anteriores. Además de eso referencia un modelo de ControlNet ya pre-entrenado para esta tarea.

Sin embargo tiene algunos elementos faltantes. Tiene demasiados hiperparámetros que cambiar en búsqueda de un mejor resultado. No da un resultado necesariamente escaneable. Para solucionar estos problemas se investigaron los hiperparámetros y se escogió el que más parece afectar el equilibrio entre artístico y escaneable, y utilizándolo para buscar la imagen más artística posible que sea escaneable. Así que esto funciona out of the box.

Sin embargo esta solución tuvo también su problemática: Funcionaba demasiado bien; las imágenes eran muy artísticas y eran escaneables pero en muchos casos con elevada dificultad, dependiendo del lector utilizado. Así que se decidió devolver la imagen más artística junto con algunas que prioricen prioricen más la legibilidad del código QR, para que el usuario escoja la que considere mejor.

Es una solución además modificable. Se le puede cambiar fácilmente el modelo de Stable Diffusion a utilizar, así como el de ControlNet. Sin embargo funciona bastante bien sin mucha complicación, pudiera decirse que es apta para el uso por usuarios.

# ¿Qué es Stable Diffusion y ControlNet?

## Stable Diffusion

Stable Diffusion es un modelo de aprendizaje automático de código abierto para generar imágenes digitales de alta calidad a partir de descripciones en lenguaje natural o estímulos (prompts en inglés). El modelo se puede usar para diferentes tareas, como la generación de traducciones de imagen a imagen guiadas por mensajes de texto y la mejora de imágenes, entre muchas más.

## ControlNet

ControlNet es una red neuronal que controla un modelo pre-entrenado de difusión de imágenes (e.g. Stable Diffusion). Su función es permitir la introducción de una imagen de condicionado, que puede ser utilizada para manipular la generación de imágenes.

En el siguiente código se intalan los diferentes paquetes necesarios

In [3]:
!pip install diffusers
!pip install transformers
!pip install accelerate
!pip install torch
!pip install xformers
!pip install gradio
!pip install Pillow
!pip install qrcode
!pip install qreader
!pip install opencv-python

Collecting diffusers
  Downloading diffusers-0.19.3-py3-none-any.whl (1.3 MB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/1.3 MB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━[0m[90m╺[0m[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.1/1.3 MB[0m [31m4.3 MB/s[0m eta [36m0:00:01[0m[2K     [91m━━━━━━━━━━━━━━━━━[0m[91m╸[0m[90m━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.6/1.3 MB[0m [31m9.0 MB/s[0m eta [36m0:00:01[0m[2K     [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[90m╺[0m[90m━━[0m [32m1.2/1.3 MB[0m [31m12.3 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.3/1.3 MB[0m [31m11.4 MB/s[0m eta [36m0:00:00[0m
Collecting huggingface-hub>=0.13.2 (from diffusers)
  Downloading huggingface_hub-0.16.4-py3-none-any.whl (268 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m268.8/268.8 kB[0m [31m15.7 MB/s[0m eta [36m0:00:00[0m
Collecting safetensors>=0.3.1 (from diffusers

Aquí instalamos una dependencia del lector de código QR

In [4]:
!sudo apt-get install libzbar0

Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
The following additional packages will be installed:
  fonts-droid-fallback fonts-noto-mono fonts-urw-base35 ghostscript gsfonts
  imagemagick-6-common libdjvulibre-text libdjvulibre21 libfftw3-double3
  libgs9 libgs9-common libidn12 libijs-0.35 libjbig2dec0 libjxr-tools libjxr0
  liblqr-1-0 libmagickcore-6.q16-6 libmagickcore-6.q16-6-extra
  libmagickwand-6.q16-6 libv4l-0 libv4lconvert0 libwmflite-0.2-7 poppler-data
Suggested packages:
  fonts-noto fonts-freefont-otf | fonts-freefont-ttf fonts-texgyre
  ghostscript-x libfftw3-bin libfftw3-dev inkscape poppler-utils
  fonts-japanese-mincho | fonts-ipafont-mincho fonts-japanese-gothic
  | fonts-ipafont-gothic fonts-arphic-ukai fonts-arphic-uming fonts-nanum
The following NEW packages will be installed:
  fonts-droid-fallback fonts-noto-mono fonts-urw-base35 ghostscript gsfonts
  imagemagick-6-common libdjvulibre-text libdjvulibre21 libfftw3-

Importamos todo lo necesario para que corra nuestro código

In [6]:
import torch
import gradio as gr
from PIL import Image
import qrcode
from pathlib import Path
from multiprocessing import cpu_count
import requests
import io
import os
from PIL import Image
import random
from qreader import QReader
import cv2
from numpy import asarray

from diffusers import (
    StableDiffusionPipeline,
    StableDiffusionControlNetImg2ImgPipeline,
    ControlNetModel,
    DDIMScheduler,
    DPMSolverMultistepScheduler,
    DEISMultistepScheduler,
    HeunDiscreteScheduler,
    EulerDiscreteScheduler,
)

Aquí se inicializa el generador de códigos QR a utilizar

In [7]:
qrcode_generator = qrcode.QRCode(
    version=1,  # Set the version of the QRCode
    error_correction=qrcode.ERROR_CORRECT_H,  # Set the error correction level
    box_size=10,  # Set the size of each box in the QRCode
    border=4,  # Set the size of the border around the QRCode
)

Y ahora preparamos la IA a utilizar con los modelos pre-entrenados de ControlNet y Stable Diffusion

In [8]:
# Load a pre-trained ControlNet model for image-to-image conversion
controlnet = ControlNetModel.from_pretrained(
    "DionTimmer/controlnet_qrcode-control_v1p_sd15",  # Specify the name of the pre-trained model
    torch_dtype=torch.float16,  # Set the torch dtype to float16 for memory efficiency
)

Downloading (…)lve/main/config.json:   0%|          | 0.00/954 [00:00<?, ?B/s]

Downloading (…)ch_model.safetensors:   0%|          | 0.00/1.45G [00:00<?, ?B/s]

In [9]:
# Create a StableDiffusionControlNetImg2ImgPipeline
pipe = StableDiffusionControlNetImg2ImgPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5",  # Specify the name of the pre-trained pipeline
    controlnet=controlnet,  # Pass the loaded ControlNet model to the pipeline
    safety_checker=None,  # Set the safety checker to None
    torch_dtype=torch.float16,  # Set the torch dtype to float16 for memory efficiency
).to("cuda")  # Move the pipeline to the CUDA device

# Enable memory-efficient attention in the pipeline
pipe.enable_xformers_memory_efficient_attention()

Downloading (…)ain/model_index.json:   0%|          | 0.00/541 [00:00<?, ?B/s]

Fetching 13 files:   0%|          | 0/13 [00:00<?, ?it/s]

Downloading (…)rocessor_config.json:   0%|          | 0.00/342 [00:00<?, ?B/s]

Downloading (…)cial_tokens_map.json:   0%|          | 0.00/472 [00:00<?, ?B/s]

Downloading (…)tokenizer/merges.txt:   0%|          | 0.00/525k [00:00<?, ?B/s]

Downloading (…)_encoder/config.json:   0%|          | 0.00/617 [00:00<?, ?B/s]

Downloading (…)cheduler_config.json:   0%|          | 0.00/308 [00:00<?, ?B/s]

Downloading (…)tokenizer/vocab.json:   0%|          | 0.00/1.06M [00:00<?, ?B/s]

Downloading (…)okenizer_config.json:   0%|          | 0.00/806 [00:00<?, ?B/s]

Downloading (…)7f0/unet/config.json:   0%|          | 0.00/743 [00:00<?, ?B/s]

Downloading (…)57f0/vae/config.json:   0%|          | 0.00/547 [00:00<?, ?B/s]

Downloading model.safetensors:   0%|          | 0.00/492M [00:00<?, ?B/s]

Downloading (…)ch_model.safetensors:   0%|          | 0.00/3.44G [00:00<?, ?B/s]

Downloading (…)ch_model.safetensors:   0%|          | 0.00/335M [00:00<?, ?B/s]

Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s]

You have disabled the safety checker for <class 'diffusers.pipelines.controlnet.pipeline_controlnet_img2img.StableDiffusionControlNetImg2ImgPipeline'> by passing `safety_checker=None`. Ensure that you abide to the conditions of the Stable Diffusion license and do not expose unfiltered results in services or applications open to the public. Both the diffusers team and Hugging Face strongly recommend to keep the safety filter enabled in all public facing circumstances, disabling it only for use-cases that involve analyzing network behavior or auditing its results. For more information, please have a look at https://github.com/huggingface/diffusers/pull/254 .


Definimos un método para cambiar la resolución de la imagen base

In [10]:
def resize_for_condition_image(input_image: Image.Image, resolution: int) -> Image.Image:
    # Convert the input image to RGB format
    input_image = input_image.convert("RGB")

    # Get the width and height of the input image
    W, H = input_image.size

    # Calculate the scaling factor based on the resolution and the minimum dimension of the image
    k = float(resolution) / min(H, W)

    # Scale the width and height of the image based on the scaling factor
    H *= k
    W *= k

    # Round the scaled width and height to the nearest multiple of 64
    H = int(round(H / 64.0)) * 64
    W = int(round(W / 64.0)) * 64

    # Resize the image with the new width and height using Lanczos resampling method
    img = input_image.resize((W, H), resample=Image.LANCZOS)

    # Return the resized image
    return img

Estas son las distintas posibilidades de uno de los hiperparámetros

In [12]:
SAMPLER_MAP = {
    "DPM++ Karras SDE": lambda config: DPMSolverMultistepScheduler.from_config(config, use_karras=True, algorithm_type="sde-dpmsolver++"),
    "DPM++ Karras": lambda config: DPMSolverMultistepScheduler.from_config(config, use_karras=True),
    "Heun": lambda config: HeunDiscreteScheduler.from_config(config),
    "Euler": lambda config: EulerDiscreteScheduler.from_config(config),
    "DDIM": lambda config: DDIMScheduler.from_config(config),
    "DEIS": lambda config: DEISMultistepScheduler.from_config(config),
}

Aquí es donde ocurre la magia. Se realiza la generación de la imagen por el modelo.

In [11]:
def inference(
    qr_code_content: str,
    prompt: str,
    negative_prompt: str,
    guidance_scale: float = 10.0,
    controlnet_conditioning_scale: float = 2.0,
    strength: float = 0.8,
    seed: int = -1,
    init_image: Image.Image | None = None,
    qrcode_image: Image.Image | None = None,
    use_qr_code_as_init_image = True,
    sampler = "DPM++ Karras SDE",
):
    # Check if prompt is provided
    if prompt is None or prompt == "":
        raise gr.Error("Prompt is required")

    # Check if either QR Code Image or QR Code Content is provided
    if qrcode_image is None and qr_code_content == "":
        raise gr.Error("QR Code Image or QR Code Content is required")

    # Set the scheduler based on the sampler type
    pipe.scheduler = SAMPLER_MAP[sampler](pipe.scheduler.config)

    # Set the generator seed if provided
    generator = torch.manual_seed(seed) if seed != -1 else torch.Generator()

    # Generate QR Code Image from content if provided, else use the provided QR Code Image
    if qr_code_content != "" or qrcode_image.size == (1, 1):
        print("Generating QR Code from content")
        qr = qrcode.QRCode(
            version=1,
            error_correction=qrcode.constants.ERROR_CORRECT_H,
            box_size=10,
            border=4,
        )
        qr.add_data(qr_code_content)
        qr.make(fit=True)

        qrcode_image = qr.make_image(fill_color="black", back_color="white")
        qrcode_image = resize_for_condition_image(qrcode_image, 768)
    else:
        print("Using QR Code Image")
        qrcode_image = resize_for_condition_image(qrcode_image, 768)

    # Set the init_image as the modified QR Code Image
    init_image = qrcode_image

    # Perform inference with the provided parameters
    out = pipe(
        prompt=prompt,
        negative_prompt=negative_prompt,
        image=qrcode_image,
        control_image=qrcode_image,
        width=768,
        height=768,
        guidance_scale=float(guidance_scale),
        controlnet_conditioning_scale=float(controlnet_conditioning_scale),
        generator=generator,
        strength=float(strength),
        num_inference_steps=40,
    )

    # Return the resulting image
    return out.images[0]

Aquí inicializamos el lector QR para comprobar si las diferentes imágenes son escaneables

In [13]:
global qreader
qreader = QReader()

Downloading weights...: 100%|██████████| 74.8M/74.8M [00:01<00:00, 50.1MiB/s]


Fusing layers... 
IDetect.fuse


Este método es idéntico al anterior de inferencia, pero al generar la imagen intenta escanearla y si falla retorna None

In [15]:
def try_inference(
    qr_code_content: str,
    prompt: str,
    negative_prompt: str,
    guidance_scale: float = 10.0,
    controlnet_conditioning_scale: float = 2.0,
    strength: float = 0.8,
    seed: int = -1,
    init_image: Image.Image | None = None,
    qrcode_image: Image.Image | None = None,
    use_qr_code_as_init_image: bool = True,
    sampler: str = "DPM++ Karras SDE"
    ) -> Image.Image | None :

    # Perform inference using the provided parameters
    image = inference(
        qr_code_content,
        prompt,
        negative_prompt,
        guidance_scale,
        controlnet_conditioning_scale,
        strength,
        seed,
        init_image,
        qrcode_image,
        use_qr_code_as_init_image,
        sampler
    )

    # Convert image to RGB format
    image = cv2.cvtColor(asarray(image), cv2.COLOR_BGR2RGB)

    # Decode QR code from the image
    decoded_text = qreader.decode(image=image)

    # Check if the decoded text matches the provided QR code content
    if decoded_text is not None and decoded_text == qr_code_content:
        return image
    else:
        return None

Este método se encarga de realizar búsqueda binaria para encontrar la imagen más artística posible. Utiliza la escala de condicionamiento para esto. Al terminar produce 4 imágenes con este hiperparámetro elevado escalonadamente para proporcionar alternativas potencialmente más fáciles de escanear.

In [18]:
def valid_QR_code_image(
    steps: int,
    qr_code_content: str,
    prompt: str,
    negative_prompt: str,
    guidance_scale: float = 10.0,
    controlnet_conditioning_scale: float = 2.5,
    strength: float = 0.8,
    seed: int = -1,
    init_image: Image.Image | None = None,
    qrcode_image: Image.Image | None = None,
    use_qr_code_as_init_image = True,
    sampler = "DPM++ Karras SDE",
):
    # Set the initial range for conditioning scale
    conditioning_max = 2.0
    conditioning_min = 0.6
    conditioning_current = 1.3
    last_working = 2.0
    working_image = None

    # Iterate for the specified number of steps
    for i in range(steps):
        # Try generating an image using inference function
        image = try_inference(
            qr_code_content, prompt, negative_prompt, guidance_scale, conditioning_current,
            strength, seed, init_image, qrcode_image, use_qr_code_as_init_image, sampler
        )
        if image is not None:
            # If an image is successfully generated, update the range of conditioning scale
            conditioning_max = conditioning_current
            last_working = conditioning_current
            conditioning_current = (conditioning_max + conditioning_min) / 2.0
            working_image = image
            print("Match Found!")
        else:
            # If no image is generated, update the range of conditioning scale
            conditioning_min = conditioning_current
            conditioning_current = (conditioning_max + conditioning_min) / 2.0
            print("No Match!")

    if working_image is None:
        # If no working image is found, use a higher conditioning scale
        conditioning_current = 2.0
        working_image = inference(
            qr_code_content, prompt, negative_prompt, guidance_scale, conditioning_current,
            strength, seed, init_image, qrcode_image, use_qr_code_as_init_image, sampler
        )

    # Generate more QR-like images
    final_images: List[Image.Image] = []
    final_images.append(working_image)
    print("Generating more QR like images")

    for i in range(4):
        print("Generating image " + str(i+2))
        conditioning_current += 0.2
        final_images.append(inference(
            qr_code_content, prompt, negative_prompt, guidance_scale, conditioning_current,
            strength, seed, init_image, qrcode_image, use_qr_code_as_init_image, sampler
        ))

    # Return the generated images
    return (
        final_images[0], final_images[1], final_images[2], final_images[3], final_images[4]
    )

Este es el método auxiliar que se utiliza en la interfaz gráfica

In [19]:
def valid_QR_code_image_GUI(
    steps: int,  # Number of steps for the QR code validation process
    qr_code_content: str,  # Content of the QR code to validate
    prompt: str,  # Prompt message for positive validation
    negative_prompt: str,  # Prompt message for negative validation
    guidance_scale: float = 10.0,  # Scale factor for guidance loss
    strength: float = 0.8,  # Strength of the validation process
    seed: int = -1,  # Seed for random number generation
    init_image: Image.Image | None = None,  # Initial image for the validation process
    qrcode_image: Image.Image | None = None,  # QR code image for the validation process
    use_qr_code_as_init_image = True,  # Flag to determine whether to use the QR code as initial image
    sampler = "DPM++ Karras SDE",  # Sampler to use for generating images
):
    # Set the conditioning scale for the controlnet
    controlnet_conditioning_scale: float = 1.3

    # Call the valid_QR_code_image function with the provided arguments
    return valid_QR_code_image(
        steps,
        qr_code_content,
        prompt,
        negative_prompt,
        guidance_scale,
        controlnet_conditioning_scale,
        strength,
        seed,
        init_image,
        qrcode_image,
        use_qr_code_as_init_image,
        sampler
    )

Aquí se define y inializa la interfaz gráfica. Para ello se utiliza [gradio](https://www.gradio.app/)

In [22]:
# Create a block of code
with gr.Blocks() as blocks:
    gr.Markdown(
        """
# QR Code AI Art Generator

## 💡 Cómo generar códigos QR hermosos

Utilizamos la imagen del código QR como la imagen inicial **y** la imagen de control, lo que te permite generar QR codes que se integren de forma **muy natural** con tu indicación proporcionada.
El parámetro de fuerza define cuánto ruido se agrega a tu código QR, y luego se guía al código QR ruidoso tanto hacia tu indicación como hacia la imagen del código QR mediante Controlnet.
Si necesitas cambiar la fuerza utiliza un valor de fuerza alto entre 0.8 y 0.95.


Se recomienda prompts con formas no demasiado específicas.
Usualmente personas o retratos no funcionan muy bien.
Los prompts de birdview suelen funcionar bien.
Los prompts en inglés suelen proporcionar mejores resultados.


Algunos ejemplos exitosos son:
- Colonial town birdview
- Sunny tropical island
- Cyberpunk city
- Galaxies with explosions

                """
    )

    # Create a row
    with gr.Row():
        # Create a column
        with gr.Column():
            # Create a textbox for QR code content
            qr_code_content = gr.Textbox(
                label="Contenido del código QR",
                info="Contenido o URL del código QR",
                value="",
            )

            # Create an accordion for QR code image (optional)
            with gr.Accordion(label="Imagen del código QR (Opcional)", open=False):
                qr_code_image = gr.Image(
                    label="Imagen del código QR (Opcional). Dejar en blanco para generar automáticamente",
                    type="pil",
                )

            # Create a textbox for prompt
            prompt = gr.Textbox(
                label="Prompt",
                info="Prompt que guía la generación",
            )

            # Create a slider for number of steps
            steps = gr.Slider(
                minimum=1, maximum=20, step=1, value=5, label="Pasos", info="Cantidad de imágenes generadas en búsqueda de la más artística",
            )

            # Create a checkbox for using QR code as initial image
            use_qr_code_as_init_image = gr.Checkbox(label="Usar código QR como imagen inicial", value=True, interactive=False, info="Si la imagen inicial debe ser un código QR. Desmarca para omitir la imagen inicial o genera la imagen inicial con Stable Diffusion")

            # Create an accordion for initial images (optional)
            with gr.Accordion(label="Imagenes iniciales (Opcional)", open=False, visible=False) as init_image_acc:
                init_image = gr.Image(label="Imagen inicial (Opcional). Dejar en blanco para generar la imagen con SD", type="pil")

            # Create an accordion for hyperparameters
            with gr.Accordion(
                label="Hiperparámetros: La funcionalidad del código QR generado está influenciada por los parámetros detallados a continuación.",
                open=False,
            ):
                # Create a textbox for negative prompt
                negative_prompt = gr.Textbox(
                    label="Prompt negativo",
                    value="ugly, disfigured, low quality, blurry, nsfw",
                    info="Prompt que se evita generar",
                )

                # Create a slider for strength
                strength = gr.Slider(
                    minimum=0.0, maximum=1.0, step=0.01, value=0.9, label="Fuerza",
                    info="Cambiar su valor para decidir cuanto se ajusta la imagen generada al prompt",
                )

                # Create a slider for guidance scale
                guidance_scale = gr.Slider(
                    minimum=0.0,
                    maximum=50.0,
                    step=0.25,
                    value=7.5,
                    label="Escala de guía",
                )

                # Create a dropdown for sampler
                sampler = gr.Dropdown(choices=list(SAMPLER_MAP.keys()), value="DPM++ Karras SDE", label="Sampler")

                # Create a slider for seed
                seed = gr.Slider(
                    minimum=-1,
                    maximum=9999999999,
                    step=1,
                    value=2313123,
                    label="Seed",
                    randomize=True,
                )

            # Create a row
            with gr.Row():
                # Create a button for running the code
                run_btn = gr.Button("Correr")

        # Create a column for result images
        with gr.Column():
            result_image1 = gr.Image(label="Imagen resultante 1 (La más artística)")
            result_image2 = gr.Image(label="Imagen resultante 2")
            result_image3 = gr.Image(label="Imagen resultante 3")
            result_image4 = gr.Image(label="Imagen resultante 4")
            result_image5 = gr.Image(label="Imagen resultante 5 (La más escaneable)")

    # When the run button is clicked, execute the function valid_QR_code_image_GUI
    run_btn.click(
        valid_QR_code_image_GUI,
        inputs=[
            steps,
            qr_code_content,
            prompt,
            negative_prompt,
            guidance_scale,
            strength,
            seed,
            init_image,
            qr_code_image,
            use_qr_code_as_init_image,
            sampler,
        ],
        outputs=[result_image1,result_image2,result_image3,result_image4,result_image5,],
    )
# Queue the code blocks with a concurrency count of 1 and a max size of 20
blocks.queue(concurrency_count=1, max_size=20)

# Launch the blocks with sharing enabled and debugging enabled
blocks.launch(share=True, debug=True)

Colab notebook detected. This cell will run indefinitely so that you can see errors and logs. To turn off, set debug=False in launch().
Running on public URL: https://4d8912131dc35135c1.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from Terminal to deploy to Spaces (https://huggingface.co/spaces)


Generating QR Code from content


  0%|          | 0/36 [00:00<?, ?it/s]

Match Found!
Generating QR Code from content


  0%|          | 0/36 [00:00<?, ?it/s]

Match Found!
Generating QR Code from content


  0%|          | 0/36 [00:00<?, ?it/s]

No Match!
Generating QR Code from content


  0%|          | 0/36 [00:00<?, ?it/s]

No Match!
Generating QR Code from content


  0%|          | 0/36 [00:00<?, ?it/s]

No Match!
Generating more QR like images
Generating image 2
Generating QR Code from content


  0%|          | 0/36 [00:00<?, ?it/s]

Generating image 3
Generating QR Code from content


  0%|          | 0/36 [00:00<?, ?it/s]

Generating image 4
Generating QR Code from content


  0%|          | 0/36 [00:00<?, ?it/s]

Generating image 5
Generating QR Code from content


  0%|          | 0/36 [00:00<?, ?it/s]

Keyboard interruption in main thread... closing server.
Killing tunnel 127.0.0.1:7860 <> https://4d8912131dc35135c1.gradio.live




# Posibles mejoras

## Paralelización

La computación del modelo pudiera paralelizarse o utilizarse mejor hardware para acelerar su rendimiento. Un caso susceptible de paralelización sería la generación de las imágenes más probables de escanear en el último paso.

## Otros Modelos

Otra opción sería utilizar otros modelos de Stable Diffusion y de ControlNet, incluso hacer fine-tunning para ajustar los resultados a lo deseado.

## Aprovechar prompts pasados

También sería posible guardar los resultados de la búsqueda binaria relacionado a los prompts anteriores o un vector que lo represente para tal vez saltarse este paso por completo en caso que se haya utilizado un prompt parecido en el pasado.

## Diferentes bibliotecas de escaneo de código QR

Utilizar conjuntamente varias bibliotecas diferentes para escanear el código QR, para así garantizar que el resultado sea escaneable con menor dificultad