In [54]:
import os
from openai import AzureOpenAI
from dotenv import load_dotenv

In [56]:
load_dotenv()
endpoint = os.getenv("ENDPOINT")
api_key = os.getenv("API_KEY")


In [57]:
model_name = "gpt-4.1"
deployment = "gpt-4.1"

api_version = "2024-12-01-preview"

client = AzureOpenAI(
    api_version=api_version,
    azure_endpoint=endpoint,
    api_key=api_key,
)


In [58]:

doc1_path = "iltuxam.pdf"
doc2_path = "1. ENTRADA - Folleto Paciente ILTUXAM 40-5-12.5 ISP.pdf"

system_prompt = """
# Agente de Comparación de Documentos - Instrucciones del Prompt

Eres un **Agente de Comparación Técnica de Documentos Farmacológicos**.

- Debes tener la capacidad de abrir y procesar el texto de los archivos adjuntos.
- Solo debes comenzar el proceso de comparación cuando el cliente indique explícitamente: **"arranca la comparación"**.

---

## TU MISIÓN

Analiza dos documentos que te proporcionaremos como adjuntos:

- **DOCUMENTO A**:  Versión original o preliminar.
- **DOCUMENTO B**: Versión corregida 

Debes generar un **informe estructurado** que detalle con precisión las **diferencias entre ambos documentos**, con énfasis en aspectos **técnicos y farmacológicos**.

### Debes detectar:

- **Correcciones generales** (ortografía, gramática, puntuación, formato)
- **Diferencias farmacológicas clave**, incluyendo:
  - Cambios en nombres de medicamentos o principios activos
  - Variaciones en concentraciones, unidades, dosis o frecuencias
  - Sustituciones de productos, composiciones o interacciones
- **Adiciones** (contenido nuevo en el Documento B)
- **Eliminaciones** (contenido eliminado respecto al Documento A)
- **Modificaciones** (texto reescrito o reemplazado)
- **Tachones o supresiones explícitas**

---

## FORMATO DEL INFORME DE COMPARACIÓN

# 1. Resumen de Cambios
- Cambios totales detectados: [número]
- Adiciones: [número]
- Eliminaciones: [número]
- Modificaciones: [número]
- Correcciones gramaticales: [número]
- Cambios farmacológicos detectados: [número]
- Tachones / supresiones explícitas: [número]

---

## 2. Detalle de las Diferencias

### Cambios Farmacológicos
- [Ej: "Paracetamol 500 mg cada 8 hs" → "Ibuprofeno 600 mg cada 6 hs"]

### Correcciones gramaticales y ortográficas
- [Ej: "debera administrarse" → "deberá administrarse"]

### Adiciones
- [Ej: "Se recomienda realizar un control hepático cada 6 meses."]

### Eliminaciones
- [Ej: "No administrar a menores de 12 años sin indicación médica."]

### Modificaciones relevantes
- [Ej: **Antes:** "Administrar una vez al día en ayunas." **Después:** "Administrar dos veces al día, preferentemente antes de las comidas."]

### Tachones o Borrados
- [Ej: Se encontró contenido tachado: "~~No administrar con alcohol~~"]

---

## 3. Observaciones Finales
- [Ej: Se detectaron cambios farmacológicos significativos que podrían alterar la indicación terapéutica.]

4. Diferencias en HTML

Además del informe estructurado, deberás generar una sección adicional titulada "Diferencias en HTML" que represente los cambios entre el Documento A y el Documento B en formato HTML, línea por línea.

Instrucciones para el formato:

- Las eliminaciones deben mostrarse en rojo con tachado, usando:
  <span style="color:red; text-decoration:line-through">Texto eliminado</span>

- Las modificaciones deben representarse como una línea eliminada seguida de una línea nueva. Ejemplo:
  <p><span style="color:red; text-decoration:line-through">Administrar una vez al día.</span> <span style="color:green;">Administrar dos veces al día.</span></p>

- Las adiciones deben mostrarse en verde, sin tachado:
  <span style="color:green;">Texto agregado</span>

- Cada diferencia debe estar envuelta en un bloque <p> independiente para facilitar su visualización.

- El HTML debe estar listo para ser insertado en una página web sin necesidad de edición posterior.

"""


In [59]:
usermessage = f"""
He adjuntado dos documentos.
- DOCUMENTO A (Original): `{doc1_path}`
- DOCUMENTO B (Corregido): `{doc2_path}`

Ahora, por favor, arranca la comparación.
"""

In [None]:
try:
    print("Subiendo archivos a OpenAI...")
    with open(doc1_path, "rb") as file1, open(doc2_path, "rb") as file2:
        file_doc1 = client.files.create(
            file=file1,
            purpose='assistants'
        )
        file_doc2 = client.files.create(
            file=file2,
            purpose='assistants'
        )
    print("Archivos subidos con éxito.")
    print(f"ID Doc 1: {file_doc1.id}")
    print(f"ID Doc 2: {file_doc2.id}")
    
  
    print("\nEnviando solicitud al modelo...")
    completion = client.chat.completions.create(
        model=model_name,
        messages=[
            {
                "role": "system",
                "content": system_prompt
            },
            {
                "role": "user",
                "content": [
                    {
                        "type": "text",
                        "text": usermessage
                    }
                ],
                
                "attachments": [
                    {"file_id": file_doc1.id, "tools": [{"type": "file_search"}]},
                    {"file_id": file_doc2.id, "tools": [{"type": "file_search"}]}
                ]
            }
        ]
    )

    
    response = completion.choices[0].message.content

    print("\n--- INFORME DE COMPARACIÓN GENERADO ---")
    print(response)

except FileNotFoundError as e:
    print(f"\nERROR: No se pudo encontrar uno de los archivos. Revisa las rutas.")
    print(f"Detalle: {e}")
except Exception as e:
    print(f"\nOcurrió un error inesperado: {e}")

Subiendo archivos a OpenAI...
Archivos subidos con éxito.
ID Doc 1: assistant-JfDGyE7Jx4K3BEWY582yLA
ID Doc 2: assistant-9NUkxqsjLYVt7xdxyhrHRA

Enviando solicitud al modelo...

--- INFORME DE COMPARACIÓN GENERADO ---
¡Entendido! Comienzo la comparación técnica y farmacológica entre:

- **DOCUMENTO A**: `iltuxam.pdf` (Original)
- **DOCUMENTO B**: `1. ENTRADA - Folleto Paciente ILTUXAM 40-5-12.5 ISP.pdf` (Corregido)

---

# 1. Resumen de Cambios

- Cambios totales detectados: 28
- Adiciones: 7
- Eliminaciones: 5
- Modificaciones: 10
- Correcciones gramaticales: 4
- Cambios farmacológicos detectados: 2
- Tachones / supresiones explícitas: 0

---

# 2. Detalle de las Diferencias

### Cambios Farmacológicos
- **Nombre del medicamento:**  
  "ILTUXAM" → "ILTUXAM®" (agregado el símbolo de marca comercial)
- **Precisión en presentación:**  
  "ILTUXAM 40/5/12,5 comprimidos" → "ILTUXAM® 40 mg/5 mg/12,5 mg comprimidos recubiertos"

### Correcciones gramaticales y ortográficas
- Se corrigió: "de

In [53]:
response

'¡Entendido! Procedo a comparar los documentos adjuntos:\n\n- DOCUMENTO A: iltuxam.pdf\n- DOCUMENTO B: 1. ENTRADA - Folleto Paciente ILTUXAM 40-5-12.5 ISP.pdf\n\nA continuación, presento el informe estructurado de diferencias:\n\n---\n\n# 1. Resumen de Cambios\n\n- Cambios totales detectados: 28\n- Adiciones: 7\n- Eliminaciones: 5\n- Modificaciones: 9\n- Correcciones gramaticales: 4\n- Cambios farmacológicos detectados: 3\n- Tachones / supresiones explícitas: 0\n\n---\n\n## 2. Detalle de las Diferencias\n\n### Cambios Farmacológicos\n\n1. **Concentraciones específicas**\n   - "ILTUXAM contiene los principios activos: Olmesartán medoxomilo, Amlodipino y Hidroclorotiazida."  \n     →  \n     "ILTUXAM contiene 40 mg de Olmesartán medoxomilo, 5 mg de Amlodipino y 12,5 mg de Hidroclorotiazida."  \n     _(Adición de concentraciones exactas para cada principio activo)_\n\n2. **Interacción**\n   - "Puede administrarse con o sin alimentos."  \n     →  \n     "ILTUXAM puede administrarse con o s