<a href="https://colab.research.google.com/github/AlexandreGuerra-prod/_ENAP/blob/main/fluxograma_analyzer.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# 1. Importa√ß√µes e Setup
import pytesseract  # Biblioteca para OCR (Reconhecimento √ìptico de Caracteres)
from PIL import Image, ImageDraw  # Biblioteca para manipula√ß√£o de imagens
import matplotlib.pyplot as plt  # Biblioteca para cria√ß√£o de gr√°ficos
import torch  # Biblioteca para opera√ß√µes de Tensor, necess√°ria para modelos de ML
from transformers import BlipProcessor, BlipForConditionalGeneration  # Para processamento e gera√ß√£o de legendas
import networkx as nx  # Biblioteca para manipula√ß√£o de grafos
import os  # Biblioteca para intera√ß√µes com o sistema operacional
from fpdf import FPDF  # Biblioteca para gerar arquivos PDF

# 2. Fun√ß√£o para Extra√ß√£o de Texto com OCR - Pytesseract
def extract_text_blocks(image_path):
    """
    Esta fun√ß√£o extrai blocos de texto de uma imagem utilizando OCR e retorna suas coordenadas.

    :param image_path: Caminho para a imagem de entrada.
    :return: Lista de blocos de texto com informa√ß√µes de coordenadas.
    """
    image = Image.open(image_path).convert("RGB")  # Abre a imagem e a converte para RGB
    data = pytesseract.image_to_data(image, output_type=pytesseract.Output.DICT)  # Realiza OCR
    draw = ImageDraw.Draw(image)  # Cria um objeto para desenhar na imagem
    blocks = []  # Lista para armazenar os blocos de texto

    # Percorre cada item retornado pelo OCR
    for i in range(len(data['text'])):
        text = data['text'][i].strip()  # Remove espa√ßos em branco
        if text:  # Verifica se o texto n√£o est√° vazio
            x, y, w, h = data['left'][i], data['top'][i], data['width'][i], data['height'][i]
            blocks.append({
                'text': text,  # Texto extra√≠do
                'bbox': (x, y, w, h)  # Caixa delimitadora: posi√ß√£o e tamanho
            })
            # Desenha um ret√¢ngulo na imagem ao redor do texto
            draw.rectangle([x, y, x + w, y + h], outline='red', width=2)
            draw.text((x, y - 10), text, fill='blue')  # Adiciona o texto acima do ret√¢ngulo

    # Exibe a imagem com os blocos de texto destacados
    plt.figure(figsize=(12, 8))
    plt.imshow(image)
    plt.axis('off')  # Remove os eixos
    plt.title("Blocos de Texto Detectados")
    plt.show()

    return blocks  # Retorna a lista de blocos de texto


# 3. An√°lise com BLIP (Modelo Multimodal de Imagem)
def analyze_with_blip(image_path):
    """
    Esta fun√ß√£o gera uma descri√ß√£o para a imagem usando um modelo de linguagem e vis√£o (BLIP).

    :param image_path: Caminho para a imagem de entrada.
    :return: Descri√ß√£o da imagem gerada pelo modelo.
    """
    # Inicializa o processador e o modelo BLIP
    processor = BlipProcessor.from_pretrained("Salesforce/blip-image-captioning-base")
    model = BlipForConditionalGeneration.from_pretrained("Salesforce/blip-image-captioning-base")
    image = Image.open(image_path).convert("RGB")  # Abre a imagem
    inputs = processor(images=image, return_tensors="pt")  # Processa a imagem para tensor
    out = model.generate(**inputs)  # Gera a descri√ß√£o
    caption = processor.decode(out[0], skip_special_tokens=True)  # Decodifica a sa√≠da
    return caption  # Retorna a descri√ß√£o


# 4. Constru√ß√£o e An√°lise de Grafo
def draw_and_identify_bottlenecks(blocks):
    """
    Esta fun√ß√£o cria um grafo a partir dos blocos de texto e identifica gargalos.

    :param blocks: Lista de blocos de texto.
    :return: Tupla (grafo, lista de gargalos).
    """
    G = nx.DiGraph()  # Cria um grafo direcionado
    for i, block in enumerate(blocks):
        G.add_node(i, label=block['text'])  # Adiciona n√≥ para cada bloco de texto
        if i > 0:
            G.add_edge(i - 1, i)  # Cria uma liga√ß√£o entre blocos sequenciais

    pos = nx.spring_layout(G)  # Calcula a posi√ß√£o dos n√≥s no grafo
    labels = nx.get_node_attributes(G, 'label')  # Obt√©m r√≥tulos para os n√≥s
    plt.figure(figsize=(10, 6))
    nx.draw(G, pos, with_labels=True, labels=labels, node_size=2000, node_color='lightblue', font_size=10)

    # Identifica gargalos: n√≥s com alto grau de entrada
    bottlenecks = [n for n in G.nodes if G.in_degree(n) > 1]  # N√≥s que recebem entrada de m√∫ltiplos n√≥s
    nx.draw_networkx_nodes(G, pos, nodelist=bottlenecks, node_color='red')  # Destaca os gargalos em vermelho
    plt.title("Grafo Gerado e Gargalos (vermelho)")
    plt.axis('off')  # Remove os eixos
    plt.savefig("grafo_corrigido.png")  # Salva a imagem do grafo
    plt.show()
    return G, bottlenecks  # Retorna o grafo e os gargalos


# 5. Sugest√µes para Corre√ß√£o de Gargalos
def sugerir_correcao(grafo, gargalos):
    """
    Esta fun√ß√£o gera sugest√µes para melhorar os gargalos detectados no grafo.

    :param grafo: O grafo analisado.
    :param gargalos: Lista de n√≥s que s√£o gargalos.
    :return: Lista de sugest√µes.
    """
    sugestoes = []  # Lista para armazenar sugest√µes
    for g in gargalos:
        label = grafo.nodes[g].get('label', f'N√≥ {g}')  # Obt√©m a etiqueta do n√≥, se dispon√≠vel
        sugestao = f"O bloco '{label}' √© um gargalo. Sugest√£o: divida o fluxo de entrada ou revise a l√≥gica de depend√™ncia."
        sugestoes.append(sugestao)  # Adiciona a sugest√£o √† lista
    return sugestoes  # Retorna a lista de sugest√µes


# 6. Gerar PDF da Imagem Corrigida
def gerar_pdf(imagem_path, sugestoes):
    """
    Esta fun√ß√£o gera um PDF com a imagem do fluxograma e as sugest√µes de corre√ß√£o.

    :param imagem_path: Caminho para a imagem do grafo.
    :param sugestoes: Lista de sugest√µes para corre√ß√£o.
    """
    pdf = FPDF()  # Cria uma inst√¢ncia do PDF
    pdf.add_page()  # Adiciona uma p√°gina ao PDF
    pdf.set_font("Arial", size=12)  # Define a fonte e tamanho
    pdf.cell(200, 10, txt="Fluxograma Corrigido", ln=True, align='C')  # T√≠tulo do PDF
    pdf.image(imagem_path, x=10, y=30, w=190)  # Adiciona a imagem do grafo ao PDF
    pdf.ln(120)  # Espa√ßamento
    pdf.set_font("Arial", size=10)  # Define a fonte para sugest√µes
    pdf.cell(200, 10, txt="Sugest√µes de Corre√ß√£o:", ln=True)  # T√≠tulo das sugest√µes
    for s in sugestoes:
        pdf.multi_cell(0, 8, txt="- " + s)  # Adiciona cada sugest√£o como uma nova linha
    pdf.output("fluxograma_corrigido.pdf")  # Salva o PDF com o nome especificado


# 7. Execu√ß√£o Exemplo do Pipeline Completo
# Certifica-se de que o diret√≥rio 'imagens' existe
if not os.path.exists("imagens"):
    os.makedirs("imagens")  # Cria o diret√≥rio se n√£o existir
    print("Diret√≥rio 'imagens' criado.")

# URL RAW da imagem no seu reposit√≥rio GitHub
image_url = "https://raw.githubusercontent.com/AlexandreGuerra-prod/_ENAP/main/exemplo_fluxograma.png"
local_image_path = "imagens/exemplo_fluxograma.png"  # Caminho onde a imagem ser√° salva localmente

# Baixa a imagem do GitHub para o caminho local usando wget
!wget -O {local_image_path} {image_url}  # O -O especifica o nome do arquivo de sa√≠da local

print(f"Imagem baixada para: {local_image_path}")

# Execu√ß√£o das fun√ß√µes
image_path = local_image_path  # Usa o caminho local da imagem

# 7. Executando as etapas do pipeline
blocks = extract_text_blocks(image_path)  # Extra√ß√£o dos blocos de texto
caption = analyze_with_blip(image_path)  # An√°lise multimodal com BLIP
print("Descri√ß√£o:", caption)  # Exibe a descri√ß√£o gerada pela BLIP
G, bottlenecks = draw_and_identify_bottlenecks(blocks)  # Gera√ß√£o do grafo e identifica√ß√£o de gargalos
sugestoes = sugerir_correcao(G, bottlenecks)  # Sugest√µes para corre√ß√µes
gerar_pdf("grafo_corrigido.png", sugestoes)  # Gera o PDF com as sugest√µes

# Mensagens de log para o usu√°rio
print("\nüîç Executando OCR e extra√ß√£o de blocos:")
blocks = extract_text_blocks(image_path)

print("\nüß† An√°lise multimodal com BLIP:")
caption = analyze_with_blip(image_path)
print("\nDescri√ß√£o do Diagrama:", caption)

print("\nüîó Constru√ß√£o do grafo e identifica√ß√£o de gargalos:")
G, bottlenecks = draw_and_identify_bottlenecks(blocks)
print("\nGargalos detectados nos n√≥s:", bottlenecks)

print("\nüõ† Sugest√µes de melhoria:")
sugestoes = sugerir_correcao(G, bottlenecks)
for s in sugestoes:
    print("-", s)

print("\nüìÑ Exportando grafo corrigido para PDF...")
gerar_pdf("grafo_corrigido.png", sugestoes)
print("PDF salvo como 'fluxograma_corrigido.pdf'")