## UTILIZANDO **GRADIO** PARA VALIDA√á√ÉO DE DETEC√á√ÉO DE OBJETOS

- **Gradio** √© uma ferramenta em Python que simplifica a cria√ß√£o e compartilhamento de demos ou aplicativos web para modelos de ML, APIs ou fun√ß√µes, sem necessidade de experi√™ncia em JavaScript, CSS ou hospedagem web.
- Neste _notebook_, abordaremos a cria√ß√£o de uma **interface gr√°fica** b√°sica utilizando o **Gradio** e como executar um modelo de **detec√ß√£o de objetos** em conjunto com essa interface.

#### üîé Verificar se est√° sendo utilizado CPU ou GPU

In [1]:
import tensorflow as tf
tf.config.list_physical_devices()

[PhysicalDevice(name='/physical_device:CPU:0', device_type='CPU')]

#
---

### 1¬∫ PASSO: IMPORTAR AS BIBLIOTECAS

In [2]:
import os
import zipfile

import gradio as gr
import numpy as np
import tensorflow as tf
from PIL import Image, ImageDraw, ImageFont

  from .autonotebook import tqdm as notebook_tqdm


# 
---

### 2¬∫ PASSO: CRIAR A INTERFACE RESPONS√ÅVEL POR EXECUTAR O MODELO

Vamos empregar **vari√°veis globais** para simplificar o c√≥digo, por√©m essa n√£o √© a √∫nica forma de implementar a fun√ß√£o. 
_(Sinta-se √† vontade para otimizar o c√≥digo se desejar)_

In [3]:
# Diret√≥rio onde o modelo est√° armazenado
DATA_PATH = os.path.join(os.pardir, "data", "models", "detec4")

# Nome do modelo .tflite a ser utilizado
MODEL_FILE = "t5_battery_detec.tflite"

# Caminho completo do diret√≥rio at√© o arquivo do modelo
MODEL_PATH = os.path.join(DATA_PATH, MODEL_FILE)

#
---

### 3¬∫ PASSO: EXTRAIR AS CATEGORIAS DO MODELO QUE SER√Å EXECUTADO

O c√≥digo abaixo imprime no _output_ quais categorias existem dentro do modelo carregado na vari√°vel global **MODEL_PATH**

In [4]:
with zipfile.ZipFile(MODEL_PATH, "r") as archive:
    for file in archive.namelist():
        LABELS = archive.read(file).decode(encoding="utf-8").split()
        display(LABELS)

['flex', 'cr2', 'eve']

In [5]:
LABELS = LABELS[0:]
display(f"N¬∞ de Classes: {len(LABELS)}", LABELS)

'N¬∞ de Classes: 3'

['flex', 'cr2', 'eve']

O c√≥digo abaixo extrai o arquivo **dict.txt** do modelo e o salva no mesmo diret√≥rio

In [6]:
with zipfile.ZipFile(MODEL_PATH, "r") as zip_ref:
    zip_ref.extractall(DATA_PATH)

#
---

### 4¬∫ PASSO: CRIAR O INTERPRETADOR QUE USAR√Å O MODELO E ALOCAR NA MEM√ìRIA

In [7]:
# Cria√ß√£o do interpretador do modelo
interpreter = tf.lite.Interpreter(model_path=MODEL_PATH)

# Aloca√ß√£o na mem√≥ria
interpreter.allocate_tensors()

#
---

### 5¬∫ PASSO: CRIAR FUN√á√ÉO DE PREVIS√ÉO COM O INTERPRETADOR DO MODELO

Par√¢metros que ser√£o utilizados pelo _*predict*_:
- Cria uma lista de cores que ser√£o utilizadas para *visualiza√ß√£o*, utilizando uma _seed_ para que n√£o altere o tempo todo.

In [8]:
np.random.seed(42)
COLORS = np.random.randint(0, 255, size=(len(LABELS), 3), dtype=np.uint8)

In [9]:
dict(zip(LABELS, COLORS))

{'flex': array([102, 220, 225], dtype=uint8),
 'cr2': array([ 95, 179,  61], dtype=uint8),
 'eve': array([234, 203,  92], dtype=uint8)}

- Carrega o modelo .tflite:

In [10]:
interpreter = tf.lite.Interpreter(model_path=MODEL_PATH)
interpreter.allocate_tensors()

- Esta √© a fun√ß√£o que ir√° pr√©-processar a imagem de entrada para alimentar o modelo TFLite:

In [11]:
def preprocess_image(interpreter, image):
    input_details = interpreter.get_input_details()[0]
    model_height, model_width = input_details["shape"][1:3]

    # Redimensionar a imagem
    image_resized = tf.image.resize(image, (model_height, model_width))

    # Normalizar a imagem
    img_array = tf.cast(image_resized, tf.float32) / 255.0

    # Verificar se √© necess√°rio escalar e quantizar
    if input_details["dtype"] == tf.uint8:
        input_scale, input_zero_point = input_details["quantization"]
        img_array = img_array / input_scale + input_zero_point
        img_array = tf.cast(img_array, input_details["dtype"])

    # Adicionar dimens√£o de lote, se necess√°rio
    img_array = tf.expand_dims(img_array, axis=0)

    return img_array

- Esta √© a fun√ß√£o retornar√° uma lista de resultados de detec√ß√£o. Cada resultado em um dicion√°rio com infos sobre o objeto.

In [12]:
def detect_objects(interpreter, image_array, threshold):

    interpreter.set_tensor(interpreter.get_input_details()[0]["index"], image_array)
    interpreter.invoke()

    boxes = np.squeeze(
        interpreter.get_tensor(interpreter.get_output_details()[0]["index"])
    )
    classes = np.squeeze(
        interpreter.get_tensor(interpreter.get_output_details()[1]["index"])
    )
    scores = np.squeeze(
        interpreter.get_tensor(interpreter.get_output_details()[2]["index"])
    )
    count = int(
        np.squeeze(interpreter.get_tensor(interpreter.get_output_details()[3]["index"]))
    )
    results = []
    for i in range(count):
        if scores[i] >= threshold:
            result = {
                "bounding_box": boxes[i],
                "class_id": classes[i],
                "score": scores[i],
            }
            results.append(result)
    return results

- Esta √© a fun√ß√£o final de detec√ß√£o de objetos em uma imagem de entrada, que desenha os resultados da detec√ß√£o.

In [13]:
def predict(image, threshold):
    global LABELS
    global interpreter

    new_image = image.copy()

    # Load the input image and preprocess it
    preprocessed_image = preprocess_image(interpreter, new_image)

    # Run object detection on the input image
    results = detect_objects(interpreter, preprocessed_image, threshold=threshold)
    display(results)

    # Create a Pillow ImageDraw object
    draw = ImageDraw.Draw(new_image)

    for obj in results:
        # Convert the object bounding box from relative coordinates to absolute
        # coordinates based on the original image resolution
        ymin, xmin, ymax, xmax = obj["bounding_box"]

        xmin = int(xmin * new_image.width)
        xmax = int(xmax * new_image.width)
        ymin = int(ymin * new_image.height)
        ymax = int(ymax * new_image.height)

        # Find the class index of the current object
        class_id = int(obj["class_id"])

        # Draw the bounding box and label on the image
        color = [int(c) for c in COLORS[class_id]]
        draw.rectangle([(xmin, ymin), (xmax, ymax)], outline=tuple(color), width=2)

        # Make adjustments to make the label visible for all objects
        # font = ImageFont.load_default()
        font = ImageFont.truetype("arial.ttf", 40)
        label = f"{LABELS[class_id]} {round(obj['score'] * 100, 2)}%"

        text_position = (xmin, ymin)

        text_left, text_top, text_right, text_bottom = draw.textbbox(
            text_position, label, font=font
        )
        draw.rectangle(
            (text_left - 5, text_top - 5, text_right + 5, text_bottom + 5),
            fill=tuple(color),
        )

        draw.text(text_position, label, fill="black", font=font)

    return new_image

# 
---

### 6¬∫ PASSO: CRIAR A INTERFACE COM O GRADIO

Cria√ß√£o da interface que utiliza da fun√ß√£o **_predict(image)_**

Esta interface possui um configurador de _*threshold*_.

In [14]:
gr.Interface(
    fn=predict,
    inputs=[
        gr.Image(type="pil"),
        gr.Slider(
            0.1,
            1.0,
            step=0.05,
            value=0.5,
            label="Threshold",
            info="Choose a confident percentage value",
        ),
    ],
    outputs=[gr.Image()],
).launch()

* Running on local URL:  http://127.0.0.1:7862

To create a public link, set `share=True` in `launch()`.




[]

[]

[{'bounding_box': array([0.36187315, 0.22808257, 0.5147912 , 0.42725036], dtype=float32),
  'class_id': np.float32(2.0),
  'score': np.float32(0.81640625)}]

####
---

#### üí°VALIDE O MODELO ATRAV√âS DA INTERFACE
- √â poss√≠vel testar o modelo pelo pr√≥prio _output_ da c√©lula do notebook
- Outra op√ß√£o √© clicar no link gerado e test√°-lo em seu _browser_ de prefer√™ncia