<a href="https://colab.research.google.com/github/marcos-pd/IA_Prompting_CoderHouse/blob/main/Entrega_Final_CoderHouse.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Generaci√≥n de contenidos de difusi√≥n a partir de informes t√©cnicos**
*Marcos Ferrrario*

*La soluci√≥n que vamos a construir permite cargar un informe en pdf y mediante herramientas y librer√≠as en Python extraer el texto que contiene. Ese texto se guardar√° en en un archivo JSON y se pasar√° a un modelo LLM para que, mediante un prompt optimizado, el modelo devuelva un texto con engagement que pueda usarse para su difusi√≥n mediante RS, email y publicaci√≥n en web institucional.

La soluci√≥n se optimiza haciendo que el mismo resultado del LLM, genere un prompt coherente para pasarlo a Dall-E y que √©ste genere una im√°gen para ilustrar la publicaci√≥n.*


# *EXTRACI√ìN DE TEXTO desde PDF*

Para la extracci√≥n de PDFs, las bibliotecas m√°s comunes y robustas en Python son PyPDF2 (para PDFs basados en texto) y pdfplumber (que maneja mejor la estructura y tablas, y es m√°s potente).

No es nuestro caso, pero para resolver el problema de pdfs escaneados, hay que usar una herramienta de OCR, donde PyTesseract es una buena opci√≥n.

In [None]:
# Instalar bibliotecas necesarias (ejecutar solo una vez por sesi√≥n)
!pip install PyPDF2
!pip install pdfplumber
!pip install google-colab

from google.colab import files
import pdfplumber
import re # Para futuras extracciones num√©ricas

In [None]:
# Subir el archivo PDF
print("Por favor, selecciona y sube tu archivo PDF (solo uno):")
uploaded = files.upload()

# Validamos la subida del archivo. Funciona mentras subas un solo archivo.
if uploaded:
    pdf_file_path = list(uploaded.keys())[0]
    print(f"Archivo '{pdf_file_path}' subido exitosamente.")
else:
    pdf_file_path = None
    print("No se ha subido ning√∫n archivo.")

In [None]:
# Extraemos el texto del PDF
def extract_info_from_pdf_pdfplumber(pdf_path):
    full_text = ""
    extracted_tables = []

    if not pdf_path:
        print("Error: No se proporcion√≥ una ruta de archivo PDF v√°lida.")
        return None, None

    try:
        with pdfplumber.open(pdf_path) as pdf:
            for page in pdf.pages:
                # Extraer texto de la p√°gina
                page_text = page.extract_text()
                if page_text:
                    full_text += page_text + "\n\n"

                # Extraer tablas de la p√°gina
                tables = page.extract_tables()
                if tables:
                    extracted_tables.extend(tables)
    except Exception as e:
        print(f"Error al procesar el PDF '{pdf_path}': {e}")
        return None, None

    return full_text, extracted_tables

In [None]:
# Verificando la extracci√≥n
if 'pdf_file_path' in locals() and pdf_file_path:
    print(f"\nIntentando extraer informaci√≥n de: {pdf_file_path}")
    extracted_text_pdfplumber, extracted_tables_pdfplumber = extract_info_from_pdf_pdfplumber(pdf_file_path)

    if extracted_text_pdfplumber is not None:
        print("\n--- Texto extra√≠do con pdfplumber (primeros 1000 caracteres) ---")
        print(extracted_text_pdfplumber[:1000])
        print("\n--- Fin del fragmento de texto ---")

        if len(extracted_text_pdfplumber) > 1000:
            print(f"\n(El texto completo tiene {len(extracted_text_pdfplumber)} caracteres. Se mostraron los primeros 1000.)")

        if extracted_tables_pdfplumber:
            print(f"\n--- Se encontraron {len(extracted_tables_pdfplumber)} tabla(s) ---")
            for i, table in enumerate(extracted_tables_pdfplumber):
                print(f"\nTabla {i+1} (primeras 3 filas):")
                for row_idx, row in enumerate(table):
                    print(row)
                    if row_idx >= 2:
                        break
                if i >= 0: # Para mostrar solo la primera tabla.
                    break
        else:
            print("\n--- No se encontraron tablas con pdfplumber. ---")
    else:
        print("\n--- La extracci√≥n de PDF fall√≥ o no se pudo obtener texto/tablas. ---")
else:
    print("\nError: La ruta del archivo PDF no est√° disponible. Asegurate de haber subido el archivo  y de que la variable 'pdf_file_path' se haya creado correctamente.")

# *PROCESAMIENTO DEL TEXTO EXTRAIDO a trav√©s del modelo OpenAI gpt 4o*

In [None]:
from google.colab import userdata
from openai import OpenAI
import json
import requests
from PIL import Image
from io import BytesIO

# Carga la clave de API desde "los secretos" de Colab
OPENAI_API_KEY = userdata.get('OPENAI_API_KEY')

# Inicializa el cliente de OpenAI
client = OpenAI(api_key=OPENAI_API_KEY)

# Prueba una peque√±a solicitud para verificar la conexi√≥n
try:
    response = client.chat.completions.create(
        model="gpt-4", #"gpt-3.5-turbo"
        messages=[{"role": "user", "content": "Hola, ¬øest√°s funcionando?"}]
    )
    print("Conexi√≥n a OpenAI exitosa:", response.choices[0].message.content)
except Exception as e:
    print(f"Error al conectar con OpenAI: {e}")
    print("Aseg√∫rate de que tu clave de API est√© configurada correctamente en los secretos de Colab y que tengas saldo disponible.")

Ahora s√≠. Vamos a pasarle a ChatGPT un prompt **usando la t√©cnica de One Shot Prompting** para darle contexto y especificarle al modelo que genere un resultado que optimice el uso de recursos y minimice los costos.

Este prompt le pedir√° al sistema que genere un texto para publicar y un prompt para que Dall-E genere una im√°gen ilustrativa para la publicaci√≥n, por ejemplo, en Linkedin.

**Este m√©todo nos permite ahorrar costos ya que realizamos una sola llamada a la API en lugar de dos y aumentar la coherencia, ya que el mismo modelo que entendi√≥ y resumi√≥ el texto es el que sugiere la imagen, asegurando que el concepto visual est√© perfectamente alineado con el textual**.

El prompt le pedir√° a la API que genere un JSON con dos claves: una para el texto y otra para el prompt de la imagen.

Luego usar√° esas dos salidas para generar un archivo .txt con los textos para la publicaci√≥n, que se va a guardar en una carpeta en Google Drive y llamar√° a Dall-E para generar la im√°gen a partir de la segunda parte de la salida.

In [None]:
if 'extracted_text_pdfplumber' in locals() and extracted_text_pdfplumber:
    prompt_messages = [
        {"role": "system", "content": "Eres economista con muy buen conocimento de la macroeconom√≠a argentina y un fuerte expertice en el mercado automotor. Tu diferencial como analista es tu capacidad para entender las implicancias de las novedades macroecon√≥micas en el negocio automotriz, desde la industria (f√°bricas, autopartistas o importadores) hasta el retail minorista (la venta de veh√≠culos nuevos y usados al consumidor final). En tu rol, tienes el objetivo de analizar los informes t√©cnicos que se te proveeran y a partir de ellos generar contenido para los canales de difusi√≥n de la empresa que los promueve. Ese contenido est√° orientado a Redes Sociales como Linkedin y a textos con engadgement para difundir los informes por email o en el sitio web de la empresa. Para generar esos contenidos, es importante que mantengas ciertas cualidades del lenguaje humano a trav√©s de las siguientes premisas: 1) Manteniendo la estructura general del texto y el rigor t√©cnico, agregando emociones sutiles, expresiones humanas y lenguaje conversacional. 2) Redactar el texto con frases de ritmo variado, mezclando oraciones cortas con oraciones largas. 3) Sustituye palabras gen√©ricas por otras m√°s espec√≠ficas que contengan carga emocional. 4) Agrega conectores suaves y naturales como ‚Äúadem√°s‚Äù, ‚Äúy es que‚Äù, etc. En la medida de lo posible usa ejemplos, analog√≠as o detalles que hagan m√°s cercano el texto al lector. 5) Evita estructuras gramaticales repetitivas, frases sim√©tricas o lenguaje neutro. Finalmente, estructura tu respuesta √∫nicamente como un objeto JSON v√°lido con las siguientes dos claves: 'texto_linkedin' (que contendr√° el texto generado para la publicaci√≥n) y 'prompt_imagen' (que contendr√° un prompt descriptivo en ingl√©s, de no m√°s de 100 palabras, para que un generador de im√°genes como DALL-E cree una ilustraci√≥n fotorrealista y profesional que acompa√±e al texto)."},
        {"role": "user", "content": f"Analiza el siguiente informe t√©cnico y genera el contenido JSON solicitado:\n\n---\nINFORME T√âCNICO:\n{extracted_text_pdfplumber}\n---"}
    ]

    model_name = "gpt-4o" # gpt-4o es ideal para esta tarea por su calidad y capacidad para seguir instrucciones JSON
    print(f"\nü§ñ Enviando solicitud a OpenAI con el modelo {model_name}. Esto puede tomar unos segundos...")

    try:
        # LLAMADA A GPT-4o Y PROCESAMIENTO JSON
        response_gpt = client.chat.completions.create(
            model=model_name,
            messages=prompt_messages,
            temperature=0.5,
            response_format={"type": "json_object"} # Forzamos una respuesta JSON para mayor fiabilidad
        )

        # Parseamos la respuesta JSON
        raw_content = response_gpt.choices[0].message.content
        resultados_json = json.loads(raw_content)

        texto_para_linkedin = resultados_json.get("texto_linkedin", "Error: No se encontr√≥ el texto para LinkedIn en la respuesta.")
        prompt_para_dalle = resultados_json.get("prompt_imagen", "A photorealistic image of the Argentinian automotive market, focusing on new cars in a dealership.")

        print("\n--- ‚úÖ Contenido para LinkedIn generado ---")
        print(texto_para_linkedin)
        print("\n--- ‚úÖ Prompt para DALL-E generado ---")
        print(prompt_para_dalle)

        # GUARDAR EL TEXTO EN GOOGLE DRIVE
        from google.colab import drive
        drive.mount('/content/drive', force_remount=True)
        ruta_texto = '/content/drive/MyDrive/post_linkedin.txt'

        with open(ruta_texto, 'w', encoding='utf-8') as f:
            f.write(texto_para_linkedin)
        print(f"\nüìù Texto guardado exitosamente en Google Drive: {ruta_texto}")

        # GENERAMOS LA IMAGEN CON DALL-E 3
        print("\nüé® Generando imagen con DALL-E 3. Esto puede tardar un momento...")
        response_dalle = client.images.generate(
            model="dall-e-3",
            prompt=prompt_para_dalle,
            size="1024x1024",
            quality="standard",
            n=1,
        )
        image_url = response_dalle.data[0].url

        # GUARDAR Y MOSTRAR LA IMAGEN
        ruta_imagen = '/content/drive/MyDrive/imagen_linkedin.png'
        response_img = requests.get(image_url)
        img = Image.open(BytesIO(response_img.content))

        img.save(ruta_imagen)
        print(f"üñºÔ∏è Imagen guardada exitosamente en Google Drive: {ruta_imagen}")

        print("\n--- Mostrando imagen generada ---")
        display(img)

    except json.JSONDecodeError:
        print("\n‚ùå Error Cr√≠tico: La respuesta de OpenAI no fue un JSON v√°lido. No se puede continuar.")
        print("Respuesta recibida:", raw_content)
    except Exception as e:
        print(f"\n‚ùå Ocurri√≥ un error durante la generaci√≥n o guardado: {e}")

else:
    print("\n--- Proceso detenido: No se pudo extraer texto del PDF para generar el prompt. ---")