# Interfaz de Usuario para Generador de Brochures
## Combinando el generador de brochures con una interfaz de Gradio

Este notebook combina la funcionalidad del generador de brochures del notebook 02 con una interfaz de usuario amigable usando Gradio del notebook 03.

### Importamos las librerías necesarias

In [None]:
import requests
import json
from dotenv import load_dotenv
from bs4 import BeautifulSoup
from openai import OpenAI
import gradio as gr

### Cargamos las variables del fichero .env e inicializamos OpenAI

In [None]:
load_dotenv()
openai = OpenAI()
MODEL = 'gpt-4o-mini'

### Clase Website para scrappear sitios web

In [None]:
class Website:
    """
    Una clase de utilidad para representar un sitio web que hemos scrappeado, ahora con enlaces
    """

    def __init__(self, url):
        self.url = url
        response = requests.get(url)
        self.body = response.content
        soup = BeautifulSoup(self.body, 'html.parser')
        self.title = soup.title.string if soup.title else "Sin título"
        if soup.body:
            for irrelevant in soup.body(["script", "style", "img", "input"]):
                irrelevant.decompose()
            self.text = soup.body.get_text(separator="\n", strip=True)
        else:
            self.text = ""
        links = [link.get('href') for link in soup.find_all('a')]
        self.links = [link for link in links if link]

    def get_contents(self):
        return f"Título de la Web:\n{self.title}\nContenido de la Web:\n{self.text}\n\n"

### Configuración de prompts para obtener enlaces relevantes

In [None]:
link_system_prompt = """Se te proporciona una lista de enlaces que se encuentran en una página web.
Puedes decidir cuáles de los enlaces serían los más relevantes para incluir en un folleto sobre la empresa,
como enlaces a una página Acerca de, una página de la empresa, las carreras/empleos disponibles o páginas de servicios.
Debes responder en JSON como en este ejemplo:
{
    "links": [
        {"type": "Pagina Sobre nosotros", "url": "https://url.completa/aqui/va/sobre/nosotros"},
        {"type": "Pagina de Seguros", "url": "https://otra.url.completa/seguros"}
    ]
}
"""

In [None]:
def get_links_user_prompt(website):
    links_list = '\n'.join(website.links)
    user_prompt = f"""Aquí hay una lista de enlaces de la página web {website.url} - 
    Por favor, decide cuáles de estos son enlaces web relevantes para un folleto sobre la empresa. Responde con la URL https completa en formato JSON.
    No incluyas Términos y Condiciones, Privacidad ni enlaces de correo electrónico.
    Links (puede que algunos sean links relativos): {links_list}"""
    return user_prompt

In [None]:
def get_links(url):
    website = Website(url)
    response = openai.chat.completions.create(
        model='gpt-4o-mini',
        messages=[
            {"role": "system", "content": link_system_prompt},
            {"role": "user", "content": get_links_user_prompt(website)}
      ],
        response_format={"type": "json_object"}
    )
    result = response.choices[0].message.content
    return json.loads(result)

### Funciones para generar el brochure

In [None]:
def get_all_details(url):
    result = "Landing page:\n"
    result += Website(url).get_contents()
    try:
        links = get_links(url)
        print("Links encontrados:", links)
        for link in links["links"]:
            result += f"\n\n{link['type']}\n"
            try:
                result += Website(link["url"]).get_contents()
            except:
                print(f"Error al acceder al enlace: {link['url']}")
    except Exception as e:
        print(f"Error al obtener enlaces: {e}")
    return result

In [None]:
system_prompt = """Eres un asistente que analiza el contenido de varias páginas relevantes del sitio web de una empresa
y crea un folleto breve sobre la empresa para posibles clientes, inversores y nuevos empleados. Responde en formato Markdown.
Incluye detalles sobre la cultura de la empresa, los clientes, las carreras/empleos y los cursos/packs para futuros empleos si tienes la información."""

In [None]:
def get_brochure_user_prompt(company_name, url):
    user_prompt = f"""Estás mirando una empresa llamada: {company_name}. Aquí se encuentra el contenido de su página de inicio y otras páginas relevantes. 
                      Usa esta información para crear un breve folleto de la empresa en Markdown: {get_all_details(url)}"""
    user_prompt = user_prompt[:20_000]
    return user_prompt

### Función principal para crear brochure con streaming

In [None]:
def create_brochure_streaming(company_name, url, progress=gr.Progress()):
    """
    Crea un brochure con respuesta en streaming para una mejor experiencia de usuario
    """
    try:
        progress(0.1, desc="Analizando la página web...")
        
        user_prompt = get_brochure_user_prompt(company_name, url)
        
        progress(0.5, desc="Generando brochure...")
        
        stream = openai.chat.completions.create(
            model=MODEL,
            messages=[
                {"role": "system", "content": system_prompt},
                {"role": "user", "content": user_prompt}
            ],
            stream=True
        )
        
        response = ""
        for chunk in stream:
            if chunk.choices[0].delta.content:
                response += chunk.choices[0].delta.content
                clean_response = response.replace("```", "").replace("markdown", "")
                yield clean_response
        
        progress(1.0, desc="¡Brochure completado!")
        
    except Exception as e:
        error_message = f"Error al generar el brochure: {str(e)}"
        yield error_message

### Interfaz de Gradio

In [None]:
def create_brochure_interface():
    """
    Crea la interfaz de usuario de Gradio para el generador de brochures
    """
    with gr.Blocks(title="Generador de Brochures Empresariales", theme=gr.themes.Soft()) as demo:
        gr.Markdown(
            """
            # 📄 Generador de Brochures Empresariales
            
            Crea brochures profesionales para empresas analizando automáticamente su sitio web.
            
            **Instrucciones:**
            1. Ingresa el nombre de la empresa
            2. Proporciona la URL del sitio web de la empresa
            3. Haz clic en "Generar Brochure" y espera el resultado
            
            El sistema analizará la página principal y páginas relevantes para crear un brochure completo.
            """
        )
        
        with gr.Row():
            with gr.Column(scale=1):
                company_name = gr.Textbox(
                    label="Nombre de la Empresa",
                    placeholder="Ej: Google, Microsoft, OpenAI...",
                    value=""
                )
                
                company_url = gr.Textbox(
                    label="URL del Sitio Web",
                    placeholder="https://ejemplo.com",
                    value=""
                )
                
                generate_btn = gr.Button(
                    "🚀 Generar Brochure",
                    variant="primary",
                    size="lg"
                )
                
                gr.Markdown(
                    """
                    ### Ejemplos para probar:
                    - **Anthropic**: https://anthropic.com
                    - **Hugging Face**: https://huggingface.co
                    - **Aegon España**: https://www.aegon.es
                    """
                )
            
            with gr.Column(scale=2):
                brochure_output = gr.Markdown(
                    label="Brochure Generado",
                    value="El brochure aparecerá aquí una vez que se genere...",
                    height=600
                )
        
        generate_btn.click(
            fn=create_brochure_streaming,
            inputs=[company_name, company_url],
            outputs=[brochure_output],
            show_progress=True
        )
        
        gr.Examples(
            examples=[
                ["Anthropic", "https://anthropic.com"],
                ["Hugging Face", "https://huggingface.co"],
                ["Aegon España", "https://www.aegon.es"]
            ],
            inputs=[company_name, company_url],
            label="Ejemplos para probar"
        )
    
    return demo

### Lanzar la interfaz

In [None]:
demo = create_brochure_interface()
demo.launch(inline=False, share=False)  # Cambia a True si quieres compartir la interfaz públicamente

### Versión alternativa con interfaz más simple

In [None]:
def simple_brochure_generator(company_name, url):
    """
    Simplified version for quick testing
    """
    try:
        user_prompt = get_brochure_user_prompt(company_name, url)
        
        response = openai.chat.completions.create(
            model=MODEL,
            messages=[
                {"role": "system", "content": system_prompt},
                {"role": "user", "content": user_prompt}
            ]
        )
        
        result = response.choices[0].message.content
        return result.replace("```", "").replace("markdown", "")
        
    except Exception as e:
        return f"Error al generar el brochure: {str(e)}"

### Interfaz simple alternativa

In [None]:
simple_interface = gr.Interface(
    fn=simple_brochure_generator,
    inputs=[
        gr.Textbox(label="Nombre de la Empresa", placeholder="Ej: Google"),
        gr.Textbox(label="URL del Sitio Web", placeholder="https://ejemplo.com")
    ],
    outputs=gr.Markdown(label="Brochure Generado"),
    title="🏢 Generador Simple de Brochures",
    description="Ingresa el nombre de la empresa y su URL para generar un brochure profesional.",
    examples=[
        ["Anthropic", "https://anthropic.com"],
        ["Hugging Face", "https://huggingface.co"]
    ],
    flagging_mode="never"
)
simple_interface.launch(inline=False, share=False)