<a href="https://colab.research.google.com/github/thaylonmayk/Poc-Gemini-Imersao-Alura/blob/main/Untitled0.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
!sudo apt install tesseract-ocr
!pip install pytesseract
!pip install -U -q google-generativeai
!python -m spacy download pt_core_news_sm
!pip install numpy

In [13]:
import pytesseract
from PIL import Image
import spacy
from sklearn.cluster import KMeans
from sklearn.feature_extraction.text import TfidfVectorizer
import numpy as np
import google.generativeai as genai
import io
import en_core_web_sm

# Configure a sua chave de API do Google Cloud
from google.colab import userdata
genai_key = userdata.get('genaiKey')
genai.configure(api_key=genai_key)

# Carregar modelo de linguagem para PNL
#nlp = spacy.load('pt_core_news_sm')
nlp = en_core_web_sm.load()

def extrair_dados_nota(imagem):
    # Ler a imagem utilizando BytesIO
    imagem = Image.open(io.BytesIO(imagem))

    texto = pytesseract.image_to_string(imagem, lang='por')

    # Corrigir erros de OCR com Gemini
    response = genai.generate_text(
        model="gemini-1.0-pro",
        prompt=texto,
        temperature=0.1,
        max_output_tokens=len(texto),
    )
    texto_corrigido = response.result

    # Analisar o texto corrigido com PNL
    doc = nlp(texto_corrigido)

    dados_produtos = []
    for entidade in doc.ents:
        if entidade.label_ == "MONEY":
            produto = [token.text for token in entidade.sent if token.dep_ in ["nsubj", "nmod"]]
            if produto:
                dados_produtos.append((" ".join(produto), entidade.text))
    return dados_produtos

def categorizar_produtos(dados_produtos):
    produtos = [produto for produto, _ in dados_produtos]

    vectorizer = TfidfVectorizer()
    tfidf = vectorizer.fit_transform(produtos)

    num_clusters = 3
    kmeans = KMeans(n_clusters=num_clusters)
    kmeans.fit(tfidf)

    categorias = {i: [] for i in range(num_clusters)}
    for i, label in enumerate(kmeans.labels_):
        categorias[label].append(produtos[i])

    return categorias

def detectar_anomalias(dados_produtos, limite_superior=100):
    anomalias = []
    for produto, preco in dados_produtos:
        preco = float(preco.replace(',', '.'))
        if preco > limite_superior:
            anomalias.append((produto, preco))
    return anomalias

def responder_pergunta(pergunta, dados_produtos):
    contexto = [
        f"{produto}: R$ {preco.replace(',', '.')}" for produto, preco in dados_produtos
    ]

    response = genai.generate_text(
        model="gemini-1.0-pro",
        prompt=f"{pergunta}\nContexto: {' '.join(contexto)}",
        temperature=0.7,
        max_output_tokens=100,
    )
    return response.result

# Exemplo de uso:

# Receber a imagem (exemplo com upload de arquivo)
imagem = None
while imagem is None:
    try:
        imagem_path = input("Digite o caminho para a imagem da nota fiscal: ")
        with open(imagem_path, "rb") as imagem_file:
            imagem = imagem_file.read()
    except FileNotFoundError:
        print("Arquivo não encontrado. Tente novamente.")

dados_produtos = extrair_dados_nota(imagem)

# Categorizar produtos
categorias = categorizar_produtos(dados_produtos)
print("\nCategorias de Produtos:")
for categoria, produtos in categorias.items():
    print(f"Categoria {categoria + 1}: {', '.join(produtos)}")

# Detectar anomalias
anomalias = detectar_anomalias(dados_produtos)
if anomalias:
    print("\nAnomalias Detectadas:")
    for produto, preco in anomalias:
        print(f"- {produto}: R$ {preco:.2f}")

# Interface de Chatbot
while True:
    pergunta = input("\nFaça uma pergunta sobre a nota fiscal: ")
    if pergunta.lower() == "sair":
        break
    resposta = responder_pergunta(pergunta, dados_produtos)
    print(f"Resposta: {resposta}")

KeyboardInterrupt: Interrupted by user