<a href="https://colab.research.google.com/github/davidlealo/100profes/blob/master/dlo_template_gradio_demos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Introducción a Gradio

Gradio ofrece dos API diferentes según el nivel de detalle que se busque:

- `gradio.Interface`: API de alto nivel que permite crear demos de ML simplemente proporcionando una lista de entradas y salidas.

- `gradio.Blocks`: API de bajo nivel que permite tener un control total sobre los flujos de datos y el diseño de la aplicación. Se pueden crear aplicaciones muy complejas de varios pasos utilizando Blocks (como si fueran bloques de construcción).

Comenzaremos utilizando `Interface` y al final mostraremos un ejemplo de `Blocks`.

## Instalamos Gradio

In [1]:
%%capture
!pip install gradio

Ejemplo usando una función para saludar que tiene `text` como input y `text` como output.

In [2]:
import gradio as gr

def greet(name):
    return "Hello " + name + "!!"

demo = gr.Interface(fn=greet, inputs="text", outputs="text")

demo.launch()

It looks like you are running Gradio on a hosted Jupyter notebook, which requires `share=True`. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://f135166cd8b1959138.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




In [9]:
import gradio as gr
import tensorflow as tf
import requests
import numpy as np

# Cargar modelo preentrenado MobileNetV2
model = tf.keras.applications.MobileNetV2(weights="imagenet")

# Descargar las etiquetas de ImageNet
labels_url = "https://storage.googleapis.com/download.tensorflow.org/data/ImageNetLabels.txt"
response = requests.get(labels_url)
labels = response.text.split("\n")[1:]  # la primera línea es un placeholder "background"

def classify_image(image):
    try:
        # Redimensionar y preparar
        image = image.resize((224, 224))
        img_array = np.asarray(image)
        img_array = np.expand_dims(img_array, axis=0)
        img_array = tf.keras.applications.mobilenet_v2.preprocess_input(img_array)

        # Predicción
        preds = model.predict(img_array).flatten()

        # Ajustar etiquetas al tamaño de preds
        valid_labels = labels[:len(preds)]

        confidences = {valid_labels[i]: float(preds[i]) for i in range(len(preds))}
        return confidences
    except Exception as e:
        print("ERROR en classify_image:", e)
        return {"error": str(e)}


# Interfaz Gradio
demo = gr.Interface(
    fn=classify_image,
    inputs=gr.Image(type="pil"),
    outputs=gr.Label(num_top_classes=3),
    title="Clasificador de Imágenes con MobileNetV2",
    description="Sube una imagen y el modelo MobileNetV2 preentrenado en ImageNet la clasificará."
)

if __name__ == "__main__":
    demo.launch(debug=True)


It looks like you are running Gradio on a hosted Jupyter notebook, which requires `share=True`. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. This cell will run indefinitely so that you can see errors and logs. To turn off, set debug=False in launch().
* Running on public URL: https://8befa1311f97d7c31c.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1s/step
Keyboard interruption in main thread... closing server.
Killing tunnel 127.0.0.1:7862 <> https://8befa1311f97d7c31c.gradio.live


La clase de `gr.Interface` es una forma fácil de crear demos que pueden ser desde una calculadora hasta una aplicación para reconocimiento de voz.

Se inicializa con tres parámetros necesarios:


*   `fn`: la función.

*   `inputs`: qué componente(s) usar para los inputs de la función, por ejemplo, "texto", "imagen" o "audio"
* `outputs`: qué componente(s) usar para los outputs de la función, por ejemplo, "texto", "imagen" o "etiqueta"


Gradio incluye más de 20 componentes diferentes, la mayoría de los cuales se pueden utilizar como inputs y outputs. En la documentación está la [lista completa](https://gradio.app/docs/#components).

Ejemplo 2:

In [20]:
import gradio as gr
from transformers import pipeline

# Cargar modelo de Hugging Face (imagen clasificación)
classifier = pipeline("image-classification", model="microsoft/swin-tiny-patch4-window7-224")

def classify(img):
    return classifier(img)

titulo = "Mi primer demo con Hugging Face"
descripcion = "Una descripción de mi demo"

demo = gr.Interface(
    fn=classify,
    inputs=gr.Image(label="Carga una imagen aquí"),
    outputs=gr.Label(num_top_classes=3),
    title=titulo,
    description=descripcion
)

demo.launch(debug=True)


Device set to use cpu


It looks like you are running Gradio on a hosted Jupyter notebook, which requires `share=True`. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. This cell will run indefinitely so that you can see errors and logs. To turn off, set debug=False in launch().
* Running on public URL: https://7a01d8f73a6c9c2b8e.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


Traceback (most recent call last):
  File "/usr/local/lib/python3.12/dist-packages/gradio/queueing.py", line 626, in process_events
    response = await route_utils.call_process_api(
               ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/usr/local/lib/python3.12/dist-packages/gradio/route_utils.py", line 350, in call_process_api
    output = await app.get_blocks().process_api(
             ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/usr/local/lib/python3.12/dist-packages/gradio/blocks.py", line 2250, in process_api
    result = await self.call_function(
             ^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/usr/local/lib/python3.12/dist-packages/gradio/blocks.py", line 1757, in call_function
    prediction = await anyio.to_thread.run_sync(  # type: ignore
                 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/usr/local/lib/python3.12/dist-packages/anyio/to_thread.py", line 56, in run_sync
    return await get_async_backend().run_sync_in_worker_thread(
           ^^^^^

Keyboard interruption in main thread... closing server.
Killing tunnel 127.0.0.1:7862 <> https://c7125906fcde8b9e4e.gradio.live
Killing tunnel 127.0.0.1:7863 <> https://7a01d8f73a6c9c2b8e.gradio.live




In [21]:
import gradio as gr
from transformers import pipeline
from PIL import Image

# Cargar modelo de Hugging Face
classifier = pipeline("image-classification", model="microsoft/swin-tiny-patch4-window7-224")

def classify(img):
    # Asegurar que sea PIL.Image
    if not isinstance(img, Image.Image):
        img = Image.fromarray(img)
    return classifier(img)

titulo = "Mi primer demo con Hugging Face"
descripcion = "Una descripción de mi demo"

demo = gr.Interface(
    fn=classify,
    inputs=gr.Image(type="pil", label="Carga una imagen aquí"),  # importante: type="pil"
    outputs=gr.Label(num_top_classes=3),
    title=titulo,
    description=descripcion
)

demo.launch(debug=True)


Device set to use cpu


It looks like you are running Gradio on a hosted Jupyter notebook, which requires `share=True`. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. This cell will run indefinitely so that you can see errors and logs. To turn off, set debug=False in launch().
* Running on public URL: https://a410a5e824efa3b96c.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


Traceback (most recent call last):
  File "/usr/local/lib/python3.12/dist-packages/gradio/queueing.py", line 626, in process_events
    response = await route_utils.call_process_api(
               ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/usr/local/lib/python3.12/dist-packages/gradio/route_utils.py", line 350, in call_process_api
    output = await app.get_blocks().process_api(
             ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/usr/local/lib/python3.12/dist-packages/gradio/blocks.py", line 2260, in process_api
    data = await self.postprocess_data(block_fn, result["prediction"], state)
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/usr/local/lib/python3.12/dist-packages/gradio/blocks.py", line 2038, in postprocess_data
    prediction_value = block.postprocess(prediction_value)
                       ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/usr/local/lib/python3.12/dist-packages/gradio/components/label.py", line 155, in postprocess

Keyboard interruption in main thread... closing server.
Killing tunnel 127.0.0.1:7863 <> https://a410a5e824efa3b96c.gradio.live




In [22]:
import gradio as gr
from transformers import pipeline
from PIL import Image

# Cargar modelo de Hugging Face
classifier = pipeline("image-classification", model="microsoft/swin-tiny-patch4-window7-224")

def classify(img):
    # Asegurar que sea PIL.Image
    if not isinstance(img, Image.Image):
        img = Image.fromarray(img)

    # Ejecutar el pipeline
    results = classifier(img)

    # Convertir lista de resultados -> diccionario
    confidences = {r["label"]: float(r["score"]) for r in results}
    return confidences

titulo = "Mi primer demo con Hugging Face"
descripcion = "Una descripción de mi demo"

demo = gr.Interface(
    fn=classify,
    inputs=gr.Image(type="pil", label="Carga una imagen aquí"),
    outputs=gr.Label(num_top_classes=3),
    title=titulo,
    description=descripcion
)

demo.launch()


Device set to use cpu


It looks like you are running Gradio on a hosted Jupyter notebook, which requires `share=True`. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://8007becdc1e04c38cd.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)





## ✅ Explicación de la mejora en el demo con Gradio + Hugging Face

Cuando conectamos un modelo de **Hugging Face** con **Gradio**, aparecieron varios problemas que fuimos resolviendo paso a paso:

---

### 1. Diferencia entre `labels` y `preds`
- **Problema:** El modelo `MobileNetV2` devuelve **1000 probabilidades**, pero el archivo de etiquetas tenía **1001 líneas** (incluía un `"background"` extra).
- **Solución:** Recortar la lista de etiquetas a **1000 clases reales**:
  ```python
  labels = response.text.split("\n")[1:1001]
  ```

---

### 2. Formato de la imagen (`PIL.Image`)
- **Problema:** El pipeline de Hugging Face (`pipeline("image-classification")`) esperaba recibir una imagen en formato `PIL.Image`, pero `gr.Image` estaba entregando un `numpy.ndarray`.
- **Solución:** Configurar Gradio para entregar directamente `PIL.Image`:
  ```python
  inputs=gr.Image(type="pil")
  ```

---

### 3. Formato de salida esperado por `gr.Label`
- **Problema:** El pipeline devolvía una **lista de diccionarios**:
  ```python
  [
    {"label": "Egyptian cat", "score": 0.85},
    {"label": "tabby cat", "score": 0.10},
    {"label": "tiger cat", "score": 0.04}
  ]
  ```
  Pero `gr.Label` solo acepta:
  - un `string`
  - un `int` o `float`
  - o un **diccionario `{label: probabilidad}`**

- **Solución:** Convertir la lista en un diccionario:
  ```python
  results = classifier(img)
  confidences = {r["label"]: float(r["score"]) for r in results}
  return confidences
  ```

---

### 🔑 Resultado final
Con estas correcciones:
- La interfaz recibe imágenes como `PIL.Image`.
- El modelo Hugging Face procesa correctamente.
- El output se transforma en un diccionario comprensible para `gr.Label`.

Ahora la demo funciona sin errores 🎉


## Demos para clasificación de imágenes

**Ejemplo 1:** demo con modelo cargado de las aplicaciones de TensorFlow.

In [None]:
import requests

# Obteniendo las labels de "https://git.io/JJkYN"


**Ejemplo 2**: demo cargando un modelo del Hub de Hugging Face.

## Demo de transcripción de audio a texto

Usamos `pipeline` para cargar un modelo para automatic speech recognition en español del Hub de Hugging Face.

El demo transcribe automáticamente de lo que grabamos.

## Blocks

Creamos un demo que recibe dos modelos. Puede transcribir una voz y también puede clasificar el sentimiento de un texto.

Hagamos un aplicación de blocks un poco más interesante.