## LLM (Large Language Model)
- LLMs are advanced AI models designed to understand and generate human-like text based on vast amounts of data.

Que son los llm y para que sirven?
## LLM (Large Language Model)
Un LLM multimodal es un modelo de lenguaje avanzado que puede entender, generar y razonar no solo con texto, sino tambi√©n con otros tipos de datos como im√°genes, audio o video. A diferencia de los modelos puramente textuales, un LLM multimodal combina informaci√≥n de diferentes fuentes para dar respuestas m√°s completas y contextualizadas. Por ejemplo, puede analizar una imagen y describirla con palabras, interpretar texto dentro de ella o responder preguntas sobre lo que muestra.


In [3]:
from openai import OpenAI
import requests 
import os 
import base64
from pathlib import Path
import io
from PIL import Image
import fitz  # PyMuPDF - Agregar esta l√≠nea



def load_document(file_path: str) -> dict:
    """
    üéØ Funci√≥n que carga documentos PDF o PNG y los convierte para LLM multimodal
    
    Args:
        file_path (str): Ruta al archivo PDF o PNG
        
    Returns:
        dict: Informaci√≥n del documento procesado
    """
    
    file_path = Path(file_path)
    
    if not file_path.exists():
        raise FileNotFoundError(f"‚ùå Archivo no encontrado: {file_path}")
    
    file_extension = file_path.suffix.lower()
    
    print(f"üìÑ Cargando documento: {file_path.name}")
    print(f"üìã Tipo de archivo: {file_extension}")
    
    if file_extension == '.pdf':
        return load_pdf_document(file_path)
    elif file_extension in ['.png', '.jpg', '.jpeg']:
        return load_image_document(file_path)
    else:
        raise ValueError(f"‚ùå Formato no soportado: {file_extension}")


def load_pdf_document(file_path: Path) -> dict:
    """
    üìÑ Carga y procesa documentos PDF
    
    Args:
        file_path (Path): Ruta al archivo PDF
        
    Returns:
        dict: PDF procesado como im√°genes en base64
    """
    
    try:
        # Abrir el PDF
        pdf_document = fitz.open(file_path)
        total_pages = len(pdf_document)
        
        print(f"üìñ PDF con {total_pages} p√°ginas")
        
        pages_data = []
        
        for page_num in range(total_pages):
            print(f"   üîÑ Procesando p√°gina {page_num + 1}/{total_pages}")
            
            # Obtener la p√°gina
            page = pdf_document[page_num]
            
            # Convertir p√°gina a imagen
            pix = page.get_pixmap(matrix=fitz.Matrix(2, 2))  # 2x zoom para mejor calidad
            img_data = pix.tobytes("png")
            
            # Convertir a base64
            base64_image = base64.b64encode(img_data).decode('utf-8')
            
            pages_data.append({
                "page_number": page_num + 1,
                "base64_image": base64_image,
                "format": "png"
            })
        
        pdf_document.close()
        
        return {
            "file_name": file_path.name,
            "file_type": "pdf",
            "total_pages": total_pages,
            "pages": pages_data,
            "status": "success"
        }
        
    except Exception as e:
        return {
            "file_name": file_path.name,
            "file_type": "pdf", 
            "error": str(e),
            "status": "error"
        }


def load_image_document(file_path: Path) -> dict:
    """
    üñºÔ∏è Carga y procesa documentos de imagen
    
    Args:
        file_path (Path): Ruta al archivo de imagen
        
    Returns:
        dict: Imagen procesada en base64
    """
    
    try:
        # Abrir y procesar la imagen
        with Image.open(file_path) as img:
            # Convertir a RGB si es necesario
            if img.mode != 'RGB':
                img = img.convert('RGB')
            
            # Redimensionar si es muy grande (opcional)
            max_size = (1024, 1024)
            img.thumbnail(max_size, Image.Resampling.LANCZOS)
            
            # Convertir a bytes
            img_buffer = io.BytesIO()
            img.save(img_buffer, format='PNG')
            img_data = img_buffer.getvalue()
            
            # Convertir a base64
            base64_image = base64.b64encode(img_data).decode('utf-8')
            
            return {
                "file_name": file_path.name,
                "file_type": "image",
                "format": "png",
                "base64_image": base64_image,
                "dimensions": img.size,
                "status": "success"
            }
            
    except Exception as e:
        return {
            "file_name": file_path.name,
            "file_type": "image",
            "error": str(e),
            "status": "error"
        }


def convert_base64(file_path: str) -> str:
    """
    üîÑ Funci√≥n simplificada que convierte archivo a base64
    
    Args:
        file_path (str): Ruta al archivo
        
    Returns:
        str: Archivo en formato base64
    """
    
    try:
        document_data = load_document(file_path)
        
        if document_data["status"] == "error":
            raise Exception(document_data["error"])
        
        if document_data["file_type"] == "pdf":
            # Para PDF, devolver la primera p√°gina
            return document_data["pages"][0]["base64_image"]
        else:
            # Para im√°genes
            return document_data["base64_image"]
            
    except Exception as e:
        print(f"‚ùå Error al convertir a base64: {str(e)}")
        return ""


# üß™ FUNCI√ìN DE PRUEBA
def test_document_loading():
    """
    üß™ Funci√≥n para probar la carga de documentos
    """
    
    print("üß™ PROBANDO CARGA DE DOCUMENTOS")
    print("=" * 40)
    
    # Archivos de ejemplo (ajusta las rutas seg√∫n tus archivos)
    test_files = [
        "comprobantes/mp_youtube_pago.pdf",
        "comprobantes/mp_pago_imagen.png", 
    ]
    
    for file_path in test_files:
        if os.path.exists(file_path):
            print(f"\nüìÑ Probando: {file_path}")
            try:
                result = load_document(file_path)
                
                if result["status"] == "success":
                    print(f"‚úÖ Cargado exitosamente")
                    if result["file_type"] == "pdf":
                        print(f"   üìñ P√°ginas: {result['total_pages']}")
                    else:
                        print(f"   üìè Dimensiones: {result['dimensions']}")
                else:
                    print(f"‚ùå Error: {result['error']}")
                    
            except Exception as e:
                print(f"‚ùå Error: {str(e)}")
        else:
            print(f"‚ö†Ô∏è Archivo no encontrado: {file_path}")

# Ejecutar pruebas (descomenta si quieres probar)
test_document_loading()



üß™ PROBANDO CARGA DE DOCUMENTOS

üìÑ Probando: comprobantes/mp_youtube_pago.pdf
üìÑ Cargando documento: mp_youtube_pago.pdf
üìã Tipo de archivo: .pdf
üìñ PDF con 2 p√°ginas
   üîÑ Procesando p√°gina 1/2
   üîÑ Procesando p√°gina 2/2
‚úÖ Cargado exitosamente
   üìñ P√°ginas: 2

üìÑ Probando: comprobantes/mp_pago_imagen.png
üìÑ Cargando documento: mp_pago_imagen.png
üìã Tipo de archivo: .png
‚úÖ Cargado exitosamente
   üìè Dimensiones: (559, 726)


### Definicion de costos

In [4]:
from langchain.chat_models import init_chat_model
from langchain_core.messages import HumanMessage, SystemMessage, AIMessage

MODEL_COSTS = {
    "gpt-4o": {
        "input": 0.0025,   # $2.50 por 1M tokens = $0.0025 por 1K ‚úÖ Confirmado
        "output": 0.01,    # $10.00 por 1M tokens = $0.01 por 1K ‚úÖ Confirmado
        "cached_input": 0.00125,  # 50% descuento con cache
        "vision": "Incluido en tokens est√°ndar",  # ~700 tokens por imagen 1024x1024
        "quality": "Excelente",
        "speed": "R√°pido (77.4 tokens/segundo)",
        "context": "128K tokens",
        "max_output": "16.4K tokens"
    },
    "gpt-4o-mini": {
        "input": 0.00015,  # $0.15 por 1M tokens ‚úÖ Confirmado
        "output": 0.0006,  # $0.60 por 1M tokens ‚úÖ Confirmado
        "cached_input": 0.000075,  # 50% descuento con cache
        "vision": "Incluido en tokens est√°ndar",
        "quality": "Muy bueno (82% MMLU)",
        "speed": "Muy r√°pido",
        "context": "128K tokens",
        "max_output": "16K tokens"
    },
    
    # üÜï NUEVOS MODELOS GEMINI 2.5
    "gemini-2.5-pro": {
        "input": 0.00125,  # $1.25 por 1M tokens (‚â§200K contexto)
        "input_large": 0.0025,  # $2.50 por 1M tokens (>200K contexto)
        "output": 0.01,    # $10.00 por 1M tokens (‚â§200K contexto)
        "output_large": 0.015,  # $15.00 por 1M tokens (>200K contexto)
        "vision": "Incluido",  # Sin costo adicional
        "audio": 0.001,    # $1.00 por 1M tokens audio
        "cache": 0.000125,  # Cache muy econ√≥mico
        "quality": "Excelente - Modelo frontier",
        "speed": "R√°pido",
        "context": "2M tokens",
        "batch_discount": "50%"  # Descuento para procesamiento batch
    },
    "gemini-2.5-flash": {
        "input": 0.0003,   # $0.30 por 1M tokens texto/imagen/video
        "output": 0.0025,  # $2.50 por 1M tokens
        "audio_input": 0.001,  # $1.00 por 1M tokens audio
        "vision": "Incluido",
        "cache": 0.00003,  # Cache ultra econ√≥mico
        "quality": "Muy bueno - Modelo de razonamiento h√≠brido",
        "speed": "Muy r√°pido",
        "context": "1M tokens",
        "batch_discount": "50%"
    },
    "gemini-2.5-flash-lite": {
        "input": 0.0001,   # $0.10 por 1M tokens ‚ö° M√ÅS BARATO
        "output": 0.0004,  # $0.40 por 1M tokens
        "audio_input": 0.0003,  # $0.30 por 1M tokens audio
        "vision": "Incluido",
        "cache": 0.000025,
        "quality": "Bueno - Optimizado para escala",
        "speed": "Ultra r√°pido",
        "context": "Contexto moderado",
        "batch_discount": "50%"
    },
    
    # üÜï GEMINI 2.0 (Versi√≥n anterior pero a√∫n disponible)
    "gemini-2.0-flash": {
        "input": 0.0001,   # $0.10 por 1M tokens
        "output": 0.0004,  # $0.40 por 1M tokens
        "audio_input": 0.0007,  # $0.70 por 1M tokens audio
        "vision": "Incluido",
        "cache": 0.000025,
        "quality": "Bueno - Era de agentes",
        "speed": "Muy r√°pido",
        "context": "1M tokens",
        "batch_discount": "50%"
    }
}


def calcular_costo(usage_metadata: dict, modelo: str = "gpt-4o-mini", context_size: int = 0) -> dict:
    """
    üìä Calcula el costo de uso de tokens para diferentes modelos
    
    Args:
        usage_metadata: Diccionario con input_tokens, output_tokens, total_tokens
        modelo: Nombre del modelo usado
        context_size: Tama√±o del contexto (para modelos Gemini con precios variables)
    
    Returns:
        dict: Informaci√≥n detallada de tokens y costos
    """

    if modelo not in MODEL_COSTS:
        raise ValueError(f"‚ùå Modelo '{modelo}' no encontrado en MODEL_COSTS")

    precios = MODEL_COSTS[modelo]
    input_tokens = usage_metadata.get('input_tokens', 0)
    output_tokens = usage_metadata.get('output_tokens', 0)

    # üîç Determinar precio de input (algunos modelos tienen precios variables)
    if 'input_large' in precios and context_size > 200_000:
        precio_input = precios['input_large']
    elif 'cached_input' in usage_metadata and usage_metadata.get('cached_input', 0) > 0:
        # Si hay tokens cacheados, calcular separadamente
        precio_input = precios.get('cached_input', precios['input'])
        input_tokens = usage_metadata.get('cached_input', 0)
    else:
        precio_input = precios['input']

    # üîç Determinar precio de output
    if 'output_large' in precios and context_size > 200_000:
        precio_output = precios['output_large']
    else:
        precio_output = precios['output']

    # üí∞ Calcular costos (precios ya est√°n por 1K tokens)
    costo_input = (input_tokens / 1_000) * precio_input
    costo_output = (output_tokens / 1_000) * precio_output
    costo_total = costo_input + costo_output

    return {
        "modelo": modelo,
        "input_tokens": input_tokens,
        "output_tokens": output_tokens,
        "total_tokens": usage_metadata.get('total_tokens', input_tokens + output_tokens),
        "costo_input_usd": round(costo_input, 6),
        "costo_output_usd": round(costo_output, 6),
        "costo_total_usd": round(costo_total, 6),
        "precio_input_por_1k": precio_input,
        "precio_output_por_1k": precio_output,
        "calidad": precios.get('quality', 'N/A'),
        "velocidad": precios.get('speed', 'N/A'),
    }


def ejecutar_llm(
    prompt_text: str,
    document: dict,
    model: str = "gpt-4o-mini",
    model_provider: str = "openai",
    system_message: str = "Eres un experto en an√°lisis de documentos financieros.",
    verbose: bool = True
) -> dict:
    """
    ü§ñ Ejecuta un LLM multimodal con imagen y retorna respuesta + costos
    
    Args:
        prompt_text: Texto del prompt para analizar la imagen
        document: Diccionario con 'base64_image' del documento
        model: Nombre del modelo a usar
        model_provider: Proveedor del modelo (openai, google-genai, etc.)
        system_message: Mensaje de sistema para contextualizar
        verbose: Si True, imprime informaci√≥n de costos
    
    Returns:
        dict: {
            "respuesta": contenido de la respuesta,
            "costos": informaci√≥n de tokens y costos,
            "metadata": metadata completa de la respuesta
        }
    """

    # Inicializar el modelo
    llm = init_chat_model(model=model, model_provider=model_provider)

    # Construir mensajes
    messages = [
        SystemMessage(content=system_message),
        HumanMessage(content=[
            {
                "type": "text",
                "text": prompt_text
            },
            {
                "type": "image_url",
                "image_url": {
                    "url": f"data:image/png;base64,{document['base64_image']}"
                }
            }
        ])
    ]

    # Invocar el modelo
    response = llm.invoke(messages)

    return response


def mostrar_resultado_costos(model, costos):
     """ Funcion que permite mostrar los costos por pantalla"""
     # Imprimir informaci√≥n si verbose=True
     print("\n" + "="*50)
     print(f"üìä AN√ÅLISIS DE COSTO - {model}")
     print("="*50)
     print(f"üîπ Tokens de entrada:  {costos['input_tokens']:,}")
     print(f"üîπ Tokens de salida:   {costos['output_tokens']:,}")
     print(f"üîπ Total tokens:       {costos['total_tokens']:,}")
     print(f"\nüí∞ COSTOS:")
     print(f"üîπ Entrada:  ${costos['costo_input_usd']:.6f}")
     print(f"üîπ Salida:   ${costos['costo_output_usd']:.6f}")
     print(f"üîπ TOTAL:    ${costos['costo_total_usd']:.6f}")
     print(f"\n‚öôÔ∏è  MODELO:")
     print(f"üîπ Calidad:    {costos['calidad']}")
     print(f"üîπ Velocidad:  {costos['velocidad']}")
     print("="*50 + "\n")
    


In [5]:
result = load_document("comprobantes/mp_pago_imagen.png")
print(result)

üìÑ Cargando documento: mp_pago_imagen.png
üìã Tipo de archivo: .png
{'file_name': 'mp_pago_imagen.png', 'file_type': 'image', 'format': 'png', 'base64_image': 'iVBORw0KGgoAAAANSUhEUgAAAi8AAALWCAIAAAABK+TCAAEAAElEQVR4nOyddXwUx9vAn9mLEg+EYEkITnC3oi3uUKxAkWIF2gIVKkhLjTq0lBd+SGmhSIsUp7hDoLgHgiQkJJBAPKc77x+zO7enubuc5TLfT0rv9nZnZ2d355lH5hn07NkzYDAkKNU+f2xaPr7fAC4ojGyRK73++meDt0ZN9/GSqYf1H8z7lnHE6dwN968hg+EBICaNGEWCMRQUFCCks6lMmTKgs4nBYDBsx8vVFWCUABCCgAA7qEEMBoNhCs7VFWAwGAwGg0kjBoPBYLgBTBoxGAwGw/UwacRgMBgM18OkEYPBYDBcD5NGDAaDwXA9XlevXnV1HRgMBoNR2kFKpdLVdWAwGAxGaYdZ6hgMBoPhepg0YjAYDIbrYdKIwWAwGK6HSSMGg8FguB7PyZqKMTbzlcFgMBh6IGNp+I1udAIeIo0wxjzPUwlEPkj/lW5nMBiM0gaVMXofpP8SOI5ziUDyBGlERJFarVar1eSrIXRPvQ8MBoPhqUiFCpU65gEALy8vlwikEi+NiCjSaDRKpTI8PNzV1WEwGIySTX5+PrhCQ2JRDAwGg8FwPZ4jjZjxjcFgMEouHiKNeJ7ned7VtWAwGIwSj6v6Uk+QRiROgUkjBoPBKD7SyC9n4gnSCMRYBlfXgsFgMEo8rvJ6MGnEYDAYDC1MGhULJo0YDAbDLjBpZDt6U1wZDAaDYTPMb2QjNP0P040YDAaj+BjmVHMOJV4aAdONGAwGw34w3ai4MN2IwWAwSi4eIo2YbsRgMBh2gUUx2A6b/cpgMBj2glnqi

In [6]:
prompt = "Extrae la siguiente informaci√≥n en formato JSON: fecha, monto, destinatario, concepto"
resultado = ejecutar_llm(
    prompt_text=prompt,
    document={"base64_image": result["base64_image"]},  # ‚úÖ Diccionario correcto
    model="gemini-2.5-flash-lite",
    model_provider="google-genai",
    verbose=True
)

# Calcular costos
costos = calcular_costo(resultado.usage_metadata, modelo="gpt-4o-mini")

mostrar_resultado_costos("gpt-4o-mini", costos)

   

print("‚úÖ Extracci√≥n exitosa")
print(f"üìÑ Respuesta: {resultado.content}")

E0000 00:00:1760891541.753285  300308 alts_credentials.cc:93] ALTS creds ignored. Not running on GCP and untrusted ALTS is not enabled.



üìä AN√ÅLISIS DE COSTO - gpt-4o-mini
üîπ Tokens de entrada:  285
üîπ Tokens de salida:   62
üîπ Total tokens:       347

üí∞ COSTOS:
üîπ Entrada:  $0.000043
üîπ Salida:   $0.000037
üîπ TOTAL:    $0.000080

‚öôÔ∏è  MODELO:
üîπ Calidad:    Muy bueno (82% MMLU)
üîπ Velocidad:  Muy r√°pido

‚úÖ Extracci√≥n exitosa
üìÑ Respuesta: ```json
{
  "fecha": "18 de octubre de 2025",
  "monto": "$ 48.909",
  "destinatario": "Susana Armeya",
  "concepto": "Varios"
}
```


In [7]:
def test_modelos(file_path="comprobantes/mp_pago_imagen.png"):
    """
    üß™ Prueba simple para usar los modelos con an√°lisis de costos
    """
    
    print("üß™ PROBANDO EXTRACCI√ìN CON AN√ÅLISIS DE COSTOS")
    print("=" * 50)
    
    if not os.path.exists(file_path):
        print(f"‚ùå Archivo no encontrado: {file_path}")
        return
    
    # Cargar documento
    result = load_document(file_path)
    if result["status"] != "success":
        print(f"‚ùå Error cargando documento: {result.get('error')}")
        return
    
    # Preparar documento para LLM
    if result["file_type"] == "pdf":
        document_for_llm = {"base64_image": result["pages"][0]["base64_image"]}
    else:
        document_for_llm = {"base64_image": result["base64_image"]}
    
    # Prompt de extracci√≥n
    prompt = "Extrae la siguiente informaci√≥n en formato JSON: fecha, monto, destinatario, concepto"
    
    # Probar con diferentes modelos
    modelos_test = [
        {"model": "gpt-4o-mini", "provider": "openai"},
        {"model": "gemini-2.5-flash-lite", "provider": "google-genai"},
        {"model": "gemini-2.5-flash", "provider": "google-genai"}
    ]
    
    resultados_comparacion = []  # üìä Para comparar al final
    
    for config in modelos_test:
        print(f"\nü§ñ Probando: {config['model']}")
        try:
            resultado = ejecutar_llm(
                prompt_text=prompt,
                document=document_for_llm,
                model=config["model"],
                model_provider=config["provider"],
                verbose=False  # üîß Cambiado a False para evitar duplicar outputs
            )

            # üîß CORRECCI√ìN PRINCIPAL - Usar el modelo correcto
            costos = calcular_costo(resultado.usage_metadata, modelo=config["model"])
            
            # Mostrar costos del modelo actual
            mostrar_resultado_costos(config["model"], costos)
            
            print("‚úÖ Extracci√≥n exitosa")
            print(f"üìÑ Respuesta: {resultado.content[:100]}...")
            
            # Guardar para comparaci√≥n final
            resultados_comparacion.append({
                "modelo": config["model"],
                "costo": costos['costo_total_usd'],
                "tokens": costos['total_tokens'],
                "calidad": costos['calidad'],
                "respuesta": resultado.content
            })
            
        except Exception as e:
            print(f"‚ùå Error con {config['model']}: {str(e)}")
    
    # üìä MOSTRAR COMPARACI√ìN FINAL
    if len(resultados_comparacion) > 1:
        print(f"\n{'='*60}")
        print("üìä RESUMEN COMPARATIVO DE MODELOS")
        print("="*60)
        
        # Ordenar por costo (m√°s barato primero)
        resultados_comparacion.sort(key=lambda x: x['costo'])
        
        for i, r in enumerate(resultados_comparacion):
            emoji = "üèÜ" if i == 0 else "üí∞" if i == 1 else "üìä"
            print(f"\n{emoji} {r['modelo']}:")
            print(f"   üíµ Costo: ${r['costo']:.6f}")
            print(f"   üìä Tokens: {r['tokens']:,}")
            print(f"   ‚≠ê Calidad: {r['calidad']}")
        
        # Calcular ahorro
        mas_caro = max(resultados_comparacion, key=lambda x: x['costo'])
        mas_barato = min(resultados_comparacion, key=lambda x: x['costo'])
        
        if mas_caro['costo'] > mas_barato['costo']:
            ahorro_pct = ((mas_caro['costo'] - mas_barato['costo']) / mas_caro['costo']) * 100
            ahorro_usd = mas_caro['costo'] - mas_barato['costo']
            
            print(f"\nüí° AHORRO M√ÅXIMO:")
            print(f"   üéØ {ahorro_pct:.1f}% usando {mas_barato['modelo']} vs {mas_caro['modelo']}")
            print(f"   üí∞ ${ahorro_usd:.6f} por consulta")
            print(f"   üìà En 1000 consultas: ${ahorro_usd * 1000:.2f}")

# Ejecutar la prueba
test_modelos()

üß™ PROBANDO EXTRACCI√ìN CON AN√ÅLISIS DE COSTOS
üìÑ Cargando documento: mp_pago_imagen.png
üìã Tipo de archivo: .png

ü§ñ Probando: gpt-4o-mini

üìä AN√ÅLISIS DE COSTO - gpt-4o-mini
üîπ Tokens de entrada:  25,539
üîπ Tokens de salida:   50
üîπ Total tokens:       25,589

üí∞ COSTOS:
üîπ Entrada:  $0.003831
üîπ Salida:   $0.000030
üîπ TOTAL:    $0.003861

‚öôÔ∏è  MODELO:
üîπ Calidad:    Muy bueno (82% MMLU)
üîπ Velocidad:  Muy r√°pido

‚úÖ Extracci√≥n exitosa
üìÑ Respuesta: ```json
{
  "fecha": "18 de octubre de 2025",
  "monto": 48.909,
  "destinatario": "Susana Armeya",
...

ü§ñ Probando: gemini-2.5-flash-lite


E0000 00:00:1760891553.649769  300308 alts_credentials.cc:93] ALTS creds ignored. Not running on GCP and untrusted ALTS is not enabled.



üìä AN√ÅLISIS DE COSTO - gemini-2.5-flash-lite
üîπ Tokens de entrada:  285
üîπ Tokens de salida:   61
üîπ Total tokens:       346

üí∞ COSTOS:
üîπ Entrada:  $0.000028
üîπ Salida:   $0.000024
üîπ TOTAL:    $0.000053

‚öôÔ∏è  MODELO:
üîπ Calidad:    Bueno - Optimizado para escala
üîπ Velocidad:  Ultra r√°pido

‚úÖ Extracci√≥n exitosa
üìÑ Respuesta: ```json
{
  "fecha": "18 de octubre de 2025",
  "monto": "48.909",
  "destinatario": "Susana Armeya"...

ü§ñ Probando: gemini-2.5-flash


E0000 00:00:1760891555.742119  300308 alts_credentials.cc:93] ALTS creds ignored. Not running on GCP and untrusted ALTS is not enabled.



üìä AN√ÅLISIS DE COSTO - gemini-2.5-flash
üîπ Tokens de entrada:  285
üîπ Tokens de salida:   1,061
üîπ Total tokens:       1,346

üí∞ COSTOS:
üîπ Entrada:  $0.000085
üîπ Salida:   $0.002652
üîπ TOTAL:    $0.002738

‚öôÔ∏è  MODELO:
üîπ Calidad:    Muy bueno - Modelo de razonamiento h√≠brido
üîπ Velocidad:  Muy r√°pido

‚úÖ Extracci√≥n exitosa
üìÑ Respuesta: ```json
{
  "fecha": "S√°bado, 18 de octubre de 2025 a las 11:36 hs",
  "monto": "$ 48.909",
  "desti...

üìä RESUMEN COMPARATIVO DE MODELOS

üèÜ gemini-2.5-flash-lite:
   üíµ Costo: $0.000053
   üìä Tokens: 346
   ‚≠ê Calidad: Bueno - Optimizado para escala

üí∞ gemini-2.5-flash:
   üíµ Costo: $0.002738
   üìä Tokens: 1,346
   ‚≠ê Calidad: Muy bueno - Modelo de razonamiento h√≠brido

üìä gpt-4o-mini:
   üíµ Costo: $0.003861
   üìä Tokens: 25,589
   ‚≠ê Calidad: Muy bueno (82% MMLU)

üí° AHORRO M√ÅXIMO:
   üéØ 98.6% usando gemini-2.5-flash-lite vs gpt-4o-mini
   üí∞ $0.003808 por consulta
   üìà En 1000 con