# Sistema de Identificação e Recomendação.
---

# Carregando a base de dados artificial:


In [1]:
!pip install openpyxl



In [2]:
import openpyxl # This line imports the necessary library for reading xlsx files

In [3]:
from google.colab import drive
import pandas as pd
import os

# Montar o Google Drive
drive.mount('/content/drive')

Mounted at /content/drive


In [4]:
caminho_base = '/content/drive/MyDrive/Ciência da Computação/Hackaton/Bert/Base.xlsx'
caminho_culturas_pragas = '/content/drive/MyDrive/Ciência da Computação/Hackaton/Bert/Culturas_e_pragas.xlsx'

df_base = pd.read_excel(caminho_base, engine='openpyxl')
df_culturas_pragas = pd.read_excel(caminho_culturas_pragas, engine='openpyxl')

In [5]:
df_base.head()

print(df_base.shape)

(50, 11)


In [6]:
df_culturas_pragas.head()

print(df_culturas_pragas.shape)

(12, 6)


# A partir daqui trabalhando com os Embedings e com o Gradio

In [7]:
!pip install transformers
!pip install torch
!pip install transformers gradio

Collecting gradio
  Downloading gradio-5.5.0-py3-none-any.whl.metadata (16 kB)
Collecting aiofiles<24.0,>=22.0 (from gradio)
  Downloading aiofiles-23.2.1-py3-none-any.whl.metadata (9.7 kB)
Collecting fastapi<1.0,>=0.115.2 (from gradio)
  Downloading fastapi-0.115.4-py3-none-any.whl.metadata (27 kB)
Collecting ffmpy (from gradio)
  Downloading ffmpy-0.4.0-py3-none-any.whl.metadata (2.9 kB)
Collecting gradio-client==1.4.2 (from gradio)
  Downloading gradio_client-1.4.2-py3-none-any.whl.metadata (7.1 kB)
Collecting huggingface-hub<1.0,>=0.23.2 (from transformers)
  Downloading huggingface_hub-0.26.2-py3-none-any.whl.metadata (13 kB)
Collecting markupsafe~=2.0 (from gradio)
  Downloading MarkupSafe-2.1.5-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (3.0 kB)
Collecting pydub (from gradio)
  Downloading pydub-0.25.1-py2.py3-none-any.whl.metadata (1.4 kB)
Collecting python-multipart==0.0.12 (from gradio)
  Downloading python_multipart-0.0.12-py3-none-any.whl.metadata (

In [9]:
import torch
from transformers import BertTokenizer, BertModel
import pandas as pd
import gradio as gr

# Carregar os dados das planilhas
df_base = pd.read_excel(caminho_base, sheet_name=0, engine='openpyxl')
df_culturas_pragas = pd.read_excel(caminho_culturas_pragas, sheet_name=0, engine='openpyxl')

# Inicializar o tokenizer e o modelo BERT
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
model = BertModel.from_pretrained('bert-base-uncased')

# Obter lista de perguntas
perguntas = df_base.columns[:-1].tolist()  # Todas as perguntas, exceto a coluna "DIAGNÓSTICO"

# Função para calcular embeddings de uma lista de textos
def calcular_embeddings(textos):
    entradas = tokenizer(textos, padding=True, truncation=True, return_tensors="pt")
    with torch.no_grad():
        outputs = model(**entradas)
    return outputs.last_hidden_state[:, 0, :]

# Pré-calcular os embeddings dos diagnósticos
diagnosticos = df_base['DIAGNÓSTICO'].tolist()
embeddings_diagnosticos = calcular_embeddings(diagnosticos)

# Função de diagnóstico
def diagnosticar(respostas_usuario):
    # Calcular embedding médio das respostas do usuário para as 10 perguntas
    embeddings_respostas = calcular_embeddings(respostas_usuario)
    embedding_medio_respostas = embeddings_respostas.mean(dim=0, keepdim=True)

    # Comparar o embedding médio das respostas com cada embedding de diagnóstico
    similaridades = torch.nn.functional.cosine_similarity(embedding_medio_respostas, embeddings_diagnosticos)
    indice_diagnostico = similaridades.argmax().item()
    diagnostico = df_base.loc[indice_diagnostico, 'DIAGNÓSTICO']

    # Buscar tratamentos na segunda planilha
    praga = df_culturas_pragas[df_culturas_pragas['Categoria da Praga'] == diagnostico]
    if not praga.empty:
        tratamento_nivel_1 = praga.iloc[0]['Tratamento Nível 1 (Orgânico)']
        tratamento_nivel_2 = praga.iloc[0]['Tratamento Nível 2 (Genérico)']
        tratamento_nivel_3 = praga.iloc[0]['Tratamento Nível 3 (Agrotóxico Controlado)']
    else:
        tratamento_nivel_1 = tratamento_nivel_2 = tratamento_nivel_3 = "Tratamento não encontrado"

    return diagnostico, tratamento_nivel_1, tratamento_nivel_2, tratamento_nivel_3

# Interface Gradio
def interface_gradio(*respostas_usuario):
    respostas_usuario = list(respostas_usuario)
    diagnostico, tratamento1, tratamento2, tratamento3 = diagnosticar(respostas_usuario)
    return [diagnostico, tratamento1, tratamento2, tratamento3]

inputs = [gr.Textbox(label=pergunta) for pergunta in perguntas]
outputs = [
    gr.Textbox(label="Diagnóstico"),
    gr.Textbox(label="Tratamento Nível 1 (Orgânico)"),
    gr.Textbox(label="Tratamento Nível 2 (Genérico)"),
    gr.Textbox(label="Tratamento Nível 3 (Agrotóxico Controlado)")
]

gr.Interface(
    fn=interface_gradio,
    inputs=inputs,
    outputs=outputs,
    title="Diagnóstico e Tratamento de Pragas",
    description="Responda às perguntas para obter um diagnóstico e as opções de tratamento."
).launch()




Running Gradio in a Colab notebook requires sharing enabled. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://3bcc7fa6a32bb4488b.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


