In [18]:
import fitz  # PyMuPDF
from PIL import Image

# Función para extraer áreas específicas de una página como imágenes
def extract_areas_from_pdf(pdf_path, page_number, output_dir):
    """
    Extrae 6 áreas específicas (3 tercios verticales, cada uno dividido en superior e inferior) de una página de un PDF.
    
    :param pdf_path: Ruta al archivo PDF.
    :param page_number: Número de página (empieza desde 1).
    :param output_dir: Directorio donde guardar las imágenes extraídas.
    """
    # Abrir el PDF
    doc = fitz.open(pdf_path)
    page = doc[page_number - 1]  # La numeración empieza desde 0 en PyMuPDF

    # Renderizar la página como imagen
    pix = page.get_pixmap()
    img = Image.frombytes("RGB", [pix.width, pix.height], pix.samples)

    # Obtener las dimensiones de la imagen original
    width, height = img.size
    
    # Calcular las divisiones en tercios verticales y mitades horizontales
    third_width = width // 3
    half_height = height // 2

    # Definir las áreas de recorte para los 6 rectángulos
    areas = {
        "Izquierda_Superior": (0, 0, third_width, half_height),
        "Izquierda_Inferior": (0, half_height, third_width, height),
        "Centro_Superior": (third_width, 0, 2 * third_width, half_height),
        "Centro_Inferior": (third_width, half_height, 2 * third_width, height),
        "Derecha_Superior": (2 * third_width, 0, width, half_height),
        "Derecha_Inferior": (2 * third_width, half_height, width, height),
    }

    # Recortar y guardar las imágenes correspondientes a cada área
    output_paths = {}
    for section, area in areas.items():
        cropped_image = img.crop(area)
        output_path = f"{output_dir}/Area_{section}.png"
        cropped_image.save(output_path)
        output_paths[section] = output_path

    doc.close()
    return output_paths

# Ejemplo de uso:
# paths = extract_areas_from_pdf("ruta_al_pdf.pdf", 1, "ruta_al_directorio_de_salida")
# print(paths)


# Definir las áreas específicas a recortar (coordenadas en píxeles)
areas = [
    (50, 100, 200, 300),  # Área 1
    (250, 100, 400, 300),  # Área 2
    (50, 350, 200, 550),   # Área 3
    (250, 350, 400, 550),  # Área 4
    (50, 600, 200, 800),   # Área 5
    (250, 600, 400, 800)   # Área 6
]

# Usar la función para extraer las áreas
pdf_path = fr"C:\Users\AMONTORIOP002\Downloads\UFV\UFV\MarcelaRoBusta.pdf"
output_dir = fr"C:\Users\AMONTORIOP002\Downloads\UFV"
extract_areas_from_pdf(pdf_path, page_number=2, output_dir=output_dir)


{'Izquierda_Superior': 'C:\\Users\\AMONTORIOP002\\Downloads\\UFV/Area_Izquierda_Superior.png',
 'Izquierda_Inferior': 'C:\\Users\\AMONTORIOP002\\Downloads\\UFV/Area_Izquierda_Inferior.png',
 'Centro_Superior': 'C:\\Users\\AMONTORIOP002\\Downloads\\UFV/Area_Centro_Superior.png',
 'Centro_Inferior': 'C:\\Users\\AMONTORIOP002\\Downloads\\UFV/Area_Centro_Inferior.png',
 'Derecha_Superior': 'C:\\Users\\AMONTORIOP002\\Downloads\\UFV/Area_Derecha_Superior.png',
 'Derecha_Inferior': 'C:\\Users\\AMONTORIOP002\\Downloads\\UFV/Area_Derecha_Inferior.png'}

In [26]:
import fitz  # PyMuPDF
from PIL import Image
import io
import base64
import httpx

def extract_areas_from_pdf_base64(pdf_path, page_number):
    """
    Extrae 6 áreas específicas (3 tercios verticales, cada uno dividido en superior e inferior) de una página de un PDF
    y devuelve las imágenes en formato data:image/jpeg;base64.
    
    :param pdf_path: Ruta al archivo PDF.
    :param page_number: Número de página (empieza desde 1).
    :return: Lista de strings en formato data:image/jpeg;base64.
    """
    # Abrir el PDF
    doc = fitz.open(pdf_path)
    page = doc[page_number - 1]  # La numeración empieza desde 0 en PyMuPDF

    # Renderizar la página como imagen
    pix = page.get_pixmap()
    img = Image.frombytes("RGB", [pix.width, pix.height], pix.samples)

    # Obtener las dimensiones de la imagen original
    width, height = img.size
    
    # Calcular las divisiones en tercios verticales y mitades horizontales
    third_width = width // 3
    half_height = height // 2

    # Definir las áreas de recorte para los 6 rectángulos
    areas = [
        (0, 0, third_width, half_height),                   # Izquierda_Superior
        (0, half_height, third_width, height),             # Izquierda_Inferior
        (third_width, 0, 2 * third_width, half_height),    # Centro_Superior
        (third_width, half_height, 2 * third_width, height), # Centro_Inferior
        (2 * third_width, 0, width, half_height),          # Derecha_Superior
        (2 * third_width, half_height, width, height)      # Derecha_Inferior
    ]

    # Recortar y almacenar las imágenes como Base64
    base64_images = []
    for area in areas:
        cropped_image = img.crop(area)
        buffer = io.BytesIO()
        cropped_image.save(buffer, format="JPEG")
        encoded_image = base64.b64encode(buffer.getvalue()).decode("utf-8")
        base64_images.append(encoded_image)
        buffer.close()

    doc.close()
    return base64_images



In [27]:
# Usar la función para extraer las áreas
pdf_path = fr"C:\Users\AMONTORIOP002\Downloads\UFV\UFV\MarcelaRoBusta.pdf"
extracted_images = extract_areas_from_pdf_base64(pdf_path, page_number=2)
extracted_images


['/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAsLDBkSEw8UHRofHh0aHBwgJC4nICIsIxwcKDcpLDAxNDQ0Hyc5PTgyPC4zNDL/2wBDAQkJCQwLDBgNDRgyIRwhMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjL/wAARCAFiAMYDASIAAhEBAxEB/8QAHwAAAQUBAQEBAQEAAAAAAAAAAAECAwQFBgcICQoL/8QAtRAAAgEDAwIEAwUFBAQAAAF9AQIDAAQRBRIhMUEGE1FhByJxFDKBkaEII0KxwRVS0fAkM2JyggkKFhcYGRolJicoKSo0NTY3ODk6Q0RFRkdISUpTVFVWV1hZWmNkZWZnaGlqc3R1dnd4eXqDhIWGh4iJipKTlJWWl5iZmqKjpKWmp6ipqrKztLW2t7i5usLDxMXGx8jJytLT1NXW19jZ2uHi4+Tl5ufo6erx8vP09fb3+Pn6/8QAHwEAAwEBAQEBAQEBAQAAAAAAAAECAwQFBgcICQoL/8QAtREAAgECBAQDBAcFBAQAAQJ3AAECAxEEBSExBhJBUQdhcRMiMoEIFEKRobHBCSMzUvAVYnLRChYkNOEl8RcYGRomJygpKjU2Nzg5OkNERUZHSElKU1RVVldYWVpjZGVmZ2hpanN0dXZ3eHl6goOEhYaHiImKkpOUlZaXmJmaoqOkpaanqKmqsrO0tba3uLm6wsPExcbHyMnK0tPU1dbX2Nna4uPk5ebn6Onq8vP09fb3+Pn6/9oADAMBAAIRAxEAPwD3+iiigAopCQoJJAA5JNYzeKtKLlLV7i+IOCbK2knUH0LqpUfnTSb2E2lubVFYf/CUQf8AQL1n/wAF8n+FH/CUQf8AQL1n/wAF0n+FPlYuZG5RWH/wlEH/AEC9Z/8ABdJ/hR/wlEH/AEC9Z/8ABdJ/hRysOZG5RWH/AMJRB/

In [29]:
import json
from langchain.chains import create_retrieval_chain
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain.chains import create_history_aware_retriever
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_groq import ChatGroq
from langchain.chains import create_history_aware_retriever, create_retrieval_chain
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_chroma import Chroma
from langchain_community.embeddings.fastembed import FastEmbedEmbeddings
from langchain.memory import ChatMessageHistory
from dotenv import load_dotenv
import os
from functools import lru_cache
from langchain.chains import create_sql_query_chain
from langchain_community.utilities import SQLDatabase
from langchain_google_vertexai import ChatVertexAI

from sympy import im
import aux_functions as af
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
import traceback
def get_model(model_name, temperature, max_tokens):
    """
    Returns a language model based on the specified model name, temperature, and max tokens.

    Args:
        model_name (str): The name of the language model.
        temperature (float): The temperature parameter for generating responses.
        max_tokens (int): The maximum number of tokens to generate.

    Returns:
        ChatGroq: The language model object based on the specified parameters.
    """
    print(f"Parámetros de modelo {model_name, temperature, max_tokens}")
    llm = {
        "llama3-70b-8192": ChatGroq(temperature=temperature,model_name="llama3-70b-8192", max_tokens=max_tokens),
        "llama3-8b-8192": ChatGroq(temperature=temperature,model_name="llama3-8b-8192", max_tokens=max_tokens),
        "mixtral-8x7b-32768": ChatGroq(temperature=temperature,model_name="mixtral-8x7b-32768", max_tokens=max_tokens),
        "gemma-7b-it": ChatGroq(temperature=temperature,model_name="mixtral-8x7b-32768", max_tokens=max_tokens),
        "gemini-1.5-flash-002":ChatVertexAI(model_name="gemini-1.5-flash-002",project="single-cirrus-435319-f1",verbose=True, temperature=temperature),
        "gemini-1.5-pro-002":ChatVertexAI(model_name="gemini-1.5-pro-002",project="single-cirrus-435319-f1",verbose=True, temperature=temperature),
        "llama-3.1-70b-versatile": ChatGroq(temperature=temperature,model_name="llama-3.1-70b-versatile", max_tokens=max_tokens),
    }
    return llm[model_name]
prompt_extraer_campos_ficha = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            """
            Que grados está marcado con un 1?
            """,
        ),
        ("user", "Extrae de forma rigurosa los campos de la siguiente imagen"),
        MessagesPlaceholder("image_data"),
        
    ]
)
def invoke_extraer_campos_ficha(model_name="gemini-1.5-flash-002", temperature=0, max_tokens=128000, image_data=[]):
    llm = get_model(model_name, temperature, max_tokens)
    chain = prompt_extraer_campos_ficha | llm | StrOutputParser()
    response = ""
    list_images = []
    for image in image_data:
        #format_image = base64.b64encode(image).decode("utf-8")
        list_images.append(
            (
            "human",
            [
                {
                    "type": "image_url",
                    "image_url": {"url": f'data:image/jpeg;base64,{image}'},
                }
            ],
        )
        )
    #print(list_images)
    
    config = {
        "image_data": list_images
        }
    
    res = chain.invoke(config)
    return res

In [30]:
invoke_extraer_campos_ficha(image_data=extracted_images)

Parámetros de modelo ('gemini-1.5-flash-002', 0, 128000)


'Aquí tienes una lista de los grados marcados con un "1" en las imágenes proporcionadas:\n\n* **Arquitectura** (Escuela Politécnica Superior)\n\nNo hay otros grados marcados con un "1" en las imágenes.  Todos los demás grados están marcados con una "X" para indicar una selección o con una casilla vacía.\n'