<a href="https://colab.research.google.com/github/jrebull/NLP/blob/main/02_Team18_NLP_Activity10_3_LLM_Notebook_v1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Procesamiento de Lenguaje Natural**

## Maestr√≠a en Inteligencia Artificial Aplicada
#### Tecnol√≥gico de Monterrey
#### Profesor Titular: Luis Eduardo Falc√≥n Morales
#### Profesor Tutor: Rodolfo Miguel Gameros Leal

## Actividad Semana 10

### **10.3 Actividad: modelos LLM y IA en tu lugar de trabajo.** vFinal

### **Equipo 18**
> ### üë©‚Äçüíª **Iris Monserrat Urbina Casas**
> `A01795999`

> ### üë®‚Äçüíª **Javier Augusto Rebull Saucedo**
> `A01795838`

> ### üë®‚Äçüíª **Juan Carlos P√©rez Nava**
> `A01795941`

> ### üë©‚Äçüíª **Sihin√≠ Trinidad**
> `A00889358`

# Selecci√≥n y justificaci√≥n del proyecto grupal

A continuaci√≥n, se presenta la justificaci√≥n para la selecci√≥n del proyecto de Santander, destacando la necesidad de una implementaci√≥n privada de un Modelo de Lenguaje Grande (LLM) debido a las restricciones y la naturaleza sensible del entorno bancario.

### Selecci√≥n y justificaci√≥n del proyecto grupal

El proyecto **"SantanderSQL Shield"** fue seleccionado por su alto impacto potencial y por representar un caso de uso id√≥neo para la aplicaci√≥n de un LLM en un entorno corporativo con estrictas regulaciones de seguridad y privacidad, como lo es el sector bancario.

#### Problem√°tica de Alto Impacto

El √°rea de Tecnolog√≠a de Santander US enfrenta un desaf√≠o operacional cr√≠tico: la correcci√≥n manual de datos en producci√≥n es un proceso lento, propenso a errores y costoso. Los datos clave que demuestran la magnitud del problema son:

- **Volumen y Error:** Se procesaron 1,874 solicitudes DML en 2024 con una tasa de error del 18% debido a fallos humanos.
- **Costo Operativo Excesivo:** Una solicitud exitosa requiere entre 5 y 7 horas de un especialista de TI. Un solo error puede triplicar este tiempo, generando retrasos de hasta 3 d√≠as y un costo anual por errores que supera los $340,000 USD.
- **Impacto en el Negocio:** Estos retrasos afectan operaciones cr√≠ticas para el cliente, como la autorizaci√≥n de pr√©stamos y transferencias, impactando negativamente la experiencia del cliente y la operaci√≥n del banco.

#### Soluci√≥n: Un Asistente de IA en un Entorno Privado

La propuesta es desarrollar "SantanderSQL Shield", un asistente inteligente que automatiza y valida la creaci√≥n de scripts de modificaci√≥n de datos (DML). La justificaci√≥n para su implementaci√≥n mediante un LLM en modo privado se basa en los siguientes puntos:

1. **Seguridad y Gobernanza de Datos:** La herramienta operar√° con sentencias SQL que, si bien el foco es la sintaxis y no el almacenamiento de datos, involucran informaci√≥n bancaria sensible y restringida, como nombres de clientes, transacciones y SSN. Las estrictas restricciones bancarias impiden el uso de sitios web de IA p√∫blicos. La arquitectura propuesta resuelve esto al desplegar la soluci√≥n en contenedores Docker sobre la **infraestructura interna de Santander**, garantizando m√°xima seguridad y gobernanza.

2. **Uso de Tecnolog√≠a de Vanguardia v√≠a API:** El n√∫cleo de la IA ser√≠a el modelo **Google Gemini 1.5 Pro**, seleccionado por su alta capacidad para la generaci√≥n de c√≥digo y para seguir instrucciones complejas. La comunicaci√≥n con el modelo se establecer√≠a a trav√©s de su API, permitiendo que el procesamiento se realice sin exponer los datos o la l√≥gica de negocio a la web p√∫blica, manteniendo el control dentro del ecosistema seguro del banco.

3. **Retorno de Inversi√≥n Excepcional:** El proyecto presenta un caso de negocio contundente con un retorno de inversi√≥n (ROI) anual proyectado del **4,267%**. Con una inversi√≥n total estimada de $15,000 USD, se proyecta un ahorro total anual de m√°s de **$640,000 USD**. El proyecto recuperar√≠a su inversi√≥n en menos de una semana de operaci√≥n, transformaando un proceso de alto riesgo en una operaci√≥n √°gil y segura.

En conclusi√≥n, el proyecto SantanderSQL Shield no solo aborda una necesidad operativa urgente con un beneficio financiero claro, sino que tambi√©n sirve como una demostraci√≥n perfecta de c√≥mo integrar LLMs de manera segura y controlada en industrias altamente reguladas, utilizando APIs y desplegando la infraestructura en un entorno privado para cumplir con las normativas de seguridad y proteger los datos sensibles.

# Instalamos Libreria Oficial de OpenAI

In [1]:
# Instala la librer√≠a oficial de OpenAI para poder conectar y usar sus modelos (como GPT-4) desde Python.
!pip install --upgrade openai



# Librerias del Notebook

In [2]:
# =================================================================
# Tipolog√≠a 1: Gesti√≥n del Entorno y Sistema Operativo
# =================================================================

# Se utiliza para interactuar con el sistema operativo, como leer variables de entorno.
import os

# Espec√≠fico de Google Colab, para acceder a secretos y datos de usuario de forma segura.
from google.colab import userdata

# =================================================================
# Tipolog√≠a 2: Interacci√≥n con APIs Externas
# =================================================================

# Importa la librer√≠a completa de OpenAI (enfoque antiguo o para funciones espec√≠ficas).
import openai

# Importa la clase principal para interactuar con la API de OpenAI (enfoque moderno).
from openai import OpenAI

# =================================================================
# Tipolog√≠a 3: Formato y Visualizaci√≥n en Notebooks
# =================================================================

# Se usa para mostrar texto con formato Markdown en la salida de la celda.
from IPython.display import Markdown, display, HTML

# Cargo mi Secret API Key de OpenAI

In [3]:
# Intenta obtener la clave de API desde los Secretos de Google Colab.
api_key = userdata.get("JR_OpenAI_Token")

# 1. Verifica si la clave fue encontrada.
if api_key:
  # 2. Imprime una leyenda bonita si se encontr√≥ la clave.
  print("‚úÖ ¬°√âxito! Token de API encontrado y cargado correctamente.")
  print("---------------------------------------------------------")
  print("Inicializando el cliente de OpenAI...")

  # 3. Procede a inicializar el cliente de OpenAI.
  client = OpenAI(api_key=api_key)
  print("ü§ñ Cliente listo. ¬°Ya puedes interactuar con la API!")

else:
  # 4. Si no se encuentra, lanza un error claro y √∫til.
  raise ValueError(
      "üõë ERROR: Clave de API no encontrada.\n"
      "Por favor, aseg√∫rate de haber guardado tu token en los 'Secretos' de Google Colab "
      "con el nombre exacto: JR_OpenAI_Token"
  )

‚úÖ ¬°√âxito! Token de API encontrado y cargado correctamente.
---------------------------------------------------------
Inicializando el cliente de OpenAI...
ü§ñ Cliente listo. ¬°Ya puedes interactuar con la API!


# Definimos los Prompt de Sistema:

In [4]:
# Asignaci√≥n del prompt
# Este prompt solo establece el rol del asistente y el contexto de la empresa.
system_prompt = """
üë§ **Persona y Rol:**

Eres un **Asistente Experto** en consultor√≠a de soluciones de Inteligencia Artificial y Procesamiento del Lenguaje Natural (PLN), especializado en el sector bancario.

üè¢ **Contexto de la Empresa:**

Tu cliente es **Santander US Bank** (filial de Banco Santander S.A., Espa√±a), una instituci√≥n financiera de gran escala en el noreste de EE. UU. con las siguientes m√©tricas:
* **Activos:** $147,000,000,000 USD
* **Empleados:** 17,200
* **Clientes:** 5.2 millones
"""

# Imprime la variable para confirmar que se ha guardado correctamente.
print("‚úÖ Variable 'system_prompt' con Rol y Empresa creada exitosamente.")
print("----------------------------------------------------------------")
print(system_prompt)

‚úÖ Variable 'system_prompt' con Rol y Empresa creada exitosamente.
----------------------------------------------------------------

üë§ **Persona y Rol:**

Eres un **Asistente Experto** en consultor√≠a de soluciones de Inteligencia Artificial y Procesamiento del Lenguaje Natural (PLN), especializado en el sector bancario.

üè¢ **Contexto de la Empresa:**

Tu cliente es **Santander US Bank** (filial de Banco Santander S.A., Espa√±a), una instituci√≥n financiera de gran escala en el noreste de EE. UU. con las siguientes m√©tricas:
* **Activos:** $147,000,000,000 USD
* **Empleados:** 17,200
* **Clientes:** 5.2 millones



# Elecci√≥n de OpenAI GPT-4o-mini para Demostraci√≥n en Banco Santander US

En el contexto de una demostraci√≥n sobre el uso de modelos de lenguaje (LLM) en Banco Santander US, donde la privacidad de los datos es un aspecto crucial, se opt√≥ por utilizar **OpenAI GPT-4o-mini**. A continuaci√≥n, se explica detalladamente esta decisi√≥n, resaltando sus ventajas, desventajas y la justificaci√≥n detr√°s de la elecci√≥n.

## ¬øPor qu√© OpenAI GPT-4o-mini?

La versi√≥n *mini* de GPT-4o es la √∫ltima iteraci√≥n optimizada de los modelos de OpenAI, pensada para lograr un equilibrio entre capacidad, rapidez y eficiencia de costos. Esta versi√≥n fue seleccionada para la demostraci√≥n debido a los siguientes motivos:

### Ventajas (Pros)

* **Velocidad de respuesta:** GPT-4o-mini destaca por su baja latencia y alta velocidad, lo cual es ideal para aplicaciones bancarias donde la experiencia del usuario y la inmediatez son esenciales.
* **Eficiencia de recursos:** Al ser una versi√≥n m√°s ligera, requiere menos recursos computacionales y es m√°s f√°cil de integrar en entornos de prueba y despliegue r√°pido.
* **Costo accesible:** Comparado con modelos m√°s grandes, GPT-4o-mini ofrece una relaci√≥n costo-beneficio ideal para pilotos y pruebas de concepto.
* **Seguridad y privacidad:** OpenAI implementa mecanismos s√≥lidos de protecci√≥n de datos, y GPT-4o-mini permite establecer configuraciones para evitar el almacenamiento de informaci√≥n sensible durante las pruebas.
* **Escalabilidad:** Ideal para demostrar casos de uso que pueden crecer a futuro, ya que la misma arquitectura se puede ampliar hacia modelos m√°s potentes si fuera necesario.

### Desventajas (Contras)

* **Capacidad limitada:** Si bien es potente para muchas tareas, la versi√≥n *mini* puede quedarse corta en tareas extremadamente complejas o de procesamiento de lenguaje muy avanzado, donde un modelo mayor podr√≠a rendir mejor.
* **Dependencia de proveedor:** El uso de un modelo OpenAI implica depender de su infraestructura y pol√≠ticas, lo cual puede ser un reto para integraciones a largo plazo en entornos con altos requisitos regulatorios.
* **Configuraci√≥n de privacidad avanzada:** Si bien existen opciones para no almacenar datos, requiere configuraciones adicionales y revisiones para cumplir con las normativas bancarias m√°s estrictas (por ejemplo, GLBA o GDPR).

## Justificaci√≥n de la Elecci√≥n

La decisi√≥n de usar GPT-4o-mini se bas√≥ en encontrar un punto de equilibrio entre **seguridad**, **rapidez de implementaci√≥n** y **realismo en la demostraci√≥n**. Es ideal para presentar el potencial de los LLMs en banca sin exponer datos reales de clientes y permite que los equipos internos visualicen aplicaciones pr√°cticas sin incurrir en altos costos o riesgos iniciales. Adem√°s, facilita el di√°logo sobre futuras integraciones m√°s robustas y privadas, como modelos self-hosted o en la nube privada.

---

## Referencia

OpenAI. (2024). *GPT-4o overview and documentation*. OpenAI. [https://platform.openai.com/docs/guides/gpt](https://platform.openai.com/docs/guides/gpt)

---


# Llamamos a la API de OpenAI:

In [5]:
def call_openai(system_prompt, user_prompt, model="gpt-4o-mini", temperature=0.7):
    """
    Encapsula una llamada a la API de OpenAI (Chat Completions) para generar una respuesta.

    Esta funci√≥n simplifica la interacci√≥n con el modelo, manejando la construcci√≥n
    del mensaje y la extracci√≥n del contenido de la respuesta.

    Args:
        system_prompt (str): El prompt que define el rol y el comportamiento del asistente (ej. "Eres un experto en Python.").
        user_prompt (str): La pregunta o instrucci√≥n espec√≠fica del usuario.
        model (str, optional): El identificador del modelo a utilizar. Por defecto es "gpt-4o-mini".
        temperature (float, optional): Controla la aleatoriedad de la respuesta. Valores m√°s bajos (~0.2)
                                       la hacen m√°s determinista, valores m√°s altos (~1.0) la hacen m√°s creativa.
                                       Por defecto es 0.7.

    Returns:
        str: La respuesta de texto generada por el modelo, limpia de espacios al inicio o al final.
    """

    # --- Mensaje de Estado 1: Inicio de la Ejecuci√≥n ---
    # Imprimimos un mensaje para saber que la funci√≥n ha comenzado la llamada a la API.
    # Usar un f-string nos permite insertar f√°cilmente el nombre del modelo que se est√° usando.
    print(f"üöÄ Iniciando llamada a la API con el modelo: {model}...")

    try:
        # --- Llamada a la API de OpenAI ---
        # Creamos la solicitud al endpoint de 'chat completions'.
        response = client.chat.completions.create(
            model=model,                 # Define el modelo de lenguaje a utilizar.
            temperature=temperature,     # Controla la "creatividad" de la respuesta.
            max_tokens=2048,             # L√≠mite m√°ximo de 'tokens' (palabras/fragmentos) en la respuesta. Aumentado para respuestas m√°s largas.
            messages=[
                # El 'system_prompt' establece el contexto y rol del asistente.
                {"role": "system", "content": system_prompt},
                # El 'user_prompt' es la pregunta o tarea que le damos al modelo.
                {"role": "user", "content": user_prompt}
            ]
        )

        # --- Mensaje de Estado 2: Ejecuci√≥n Exitosa ---
        # Si la l√≠nea anterior se completa sin errores, significa que recibimos una respuesta.
        print("‚úÖ Respuesta recibida exitosamente de OpenAI.")

        # --- Extracci√≥n y Retorno de la Respuesta ---
        # El objeto 'response' es complejo. Navegamos hasta el contenido del mensaje.
        # .strip() elimina cualquier espacio en blanco o saltos de l√≠nea innecesarios al principio o al final.
        return response.choices[0].message.content.strip()

    except Exception as e:
        # --- Manejo de Errores ---
        # Si algo sale mal durante la llamada (ej. clave de API incorrecta, problema de red),
        # se imprimir√° un error claro.
        print(f"üõë Error al llamar a la API de OpenAI: {e}")
        return None # Devolvemos None para indicar que la funci√≥n fall√≥.

# **Caso 1: User_Prompt Zero-Shot**

In [6]:
# Prompt simple y directo (Zero-Shot)
# Prompt de usuario, corto y directo para iniciar la interacci√≥n.
user_prompt_Zero_Shot = "Pres√©ntame la idea inicial del proyecto 'SantanderSQL Shield'."

# (Opcional) Imprime la variable para confirmar que se ha guardado correctamente.
print("‚úÖ Variable 'user_prompt_zs' (estilo Zero-Shot) creada exitosamente.")
print("--------------------------------------------------------------------")
print(user_prompt_Zero_Shot)

‚úÖ Variable 'user_prompt_zs' (estilo Zero-Shot) creada exitosamente.
--------------------------------------------------------------------
Pres√©ntame la idea inicial del proyecto 'SantanderSQL Shield'.


# Llamamos a la Inteligencia!!!

In [7]:
# Informa al usuario que el proceso ha comenzado.
print("üöÄ Iniciando la consulta Zero-Shot al LLM...")
print("---------------------------------------------")

try:
    # Llama a la funci√≥n 'call_openai' con los prompts (que ya existen en el entorno).
    # "Zero-Shot" significa que se da una instrucci√≥n directa sin ejemplos previos.
    respuesta_zero_shot = call_openai(system_prompt, user_prompt_Zero_Shot)

    # Presenta un encabezado claro para el resultado.
    print("\n‚úÖ Propuesta Generada por el Modelo:")
    print("======================================")

    if respuesta_zero_shot:
        # Renderiza la respuesta del LLM. Si el modelo us√≥ formato Markdown
        # (t√≠tulos, listas, etc.), esto lo mostrar√° de forma legible.
        display(Markdown(respuesta_zero_shot))
    else:
        # Esto se ejecuta si la funci√≥n 'call_openai' no devolvi√≥ nada.
        print("No se recibi√≥ una respuesta v√°lida del modelo.")

except Exception as e:
    # Captura y muestra cualquier error que ocurra durante la llamada a la API.
    print(f"üõë Ocurri√≥ un error durante la ejecuci√≥n: {e}")

üöÄ Iniciando la consulta Zero-Shot al LLM...
---------------------------------------------
üöÄ Iniciando llamada a la API con el modelo: gpt-4o-mini...
‚úÖ Respuesta recibida exitosamente de OpenAI.

‚úÖ Propuesta Generada por el Modelo:


**Proyecto 'SantanderSQL Shield'**

**Idea Inicial:**

El proyecto 'SantanderSQL Shield' tiene como objetivo implementar una soluci√≥n avanzada de inteligencia artificial y procesamiento del lenguaje natural (PLN) para mejorar la seguridad y el manejo de datos dentro de Santander US Bank. La creciente complejidad de las amenazas cibern√©ticas y la necesidad de proteger la informaci√≥n sensible de nuestros clientes hacen que este proyecto sea crucial.

**Componentes Clave del Proyecto:**

1. **Detecci√≥n de Anomal√≠as:**
   - Utilizar algoritmos de aprendizaje autom√°tico para identificar patrones inusuales en las consultas de SQL y el comportamiento de los usuarios, lo que ayudar√° a prevenir accesos no autorizados y fraudes.

2. **An√°lisis de Sentimiento:**
   - Implementar t√©cnicas de PLN para evaluar la comunicaci√≥n interna y externa del banco. Esto permitir√° detectar posibles se√±ales de alerta o insatisfacci√≥n entre los empleados y clientes, facilitando una respuesta proactiva.

3. **Automatizaci√≥n de Respuestas:**
   - Desarrollar un sistema de chatbots y asistentes virtuales que manejan consultas y solicitudes de los clientes de manera eficiente, al tiempo que registran y analizan las interacciones para mejorar la experiencia del cliente.

4. **Cumplimiento Normativo:**
   - Asegurar que todas las operaciones y procesos de manejo de datos cumplen con las regulaciones de seguridad financiera, utilizando herramientas de IA para auditar y monitorizar el cumplimiento.

5. **Formaci√≥n y Concienciaci√≥n:**
   - Implementar un programa de capacitaci√≥n para empleados centrado en el uso de tecnolog√≠as de IA y la importancia de la seguridad de datos, fomentando una cultura de responsabilidad y cuidado en el manejo de la informaci√≥n.

**Beneficios Esperados:**

- Mejora en la seguridad de datos y reducci√≥n de fraudes.
- Optimizaci√≥n de la atenci√≥n al cliente mediante respuestas r√°pidas y precisas.
- Mayor cumplimiento de regulaciones y normativas del sector financiero.
- Aumento de la satisfacci√≥n del cliente y la confianza en el banco.

En resumen, 'SantanderSQL Shield' busca transformar la forma en que Santander US Bank gestiona la seguridad de datos y la experiencia del cliente, aprovechando las capacidades de la inteligencia artificial y el PLN para enfrentar los desaf√≠os del entorno financiero actual.

# **Caso 2: User_Prompt Chain-of-Thought (CoT)**

In [8]:
# Prompt que utiliza la metodolog√≠a Chain-of-Thought (CoT).
user_prompt_cot = """
Elabora una propuesta t√©cnica y de negocio completa para crear el asistente de IA "SantanderSQL Shield".

Para asegurar una respuesta bien estructurada, piensa paso a paso:

1.  **Paso 1: Diagn√≥stico del Problema.** Primero, analiza y describe la problem√°tica operativa actual con los scripts DML en Santander US, cuantificando el volumen, la tasa de error y el impacto financiero.

2.  **Paso 2: Definici√≥n de la Soluci√≥n.** A continuaci√≥n, detalla el concepto de "SantanderSQL Shield". Explica sus funcionalidades clave (validaci√≥n de sintaxis, generaci√≥n de rollback, etc.) y c√≥mo resuelven directamente el problema diagnosticado.

3.  **Paso 3: Dise√±o de la Arquitectura.** Despu√©s, define la arquitectura y la pila tecnol√≥gica que sustentar√° el proyecto (menciona Google Gemini 1.5 Pro, Python/FastAPI, React y Docker).

4.  **Paso 4: An√°lisis de Viabilidad.** Finalmente, desarrolla el caso de negocio, incluyendo un cronograma estimado, un desglose de los costos y un c√°lculo del Retorno de la Inversi√≥n (ROI).
"""

# Confirma que la variable se ha creado.
print("‚úÖ Variable 'user_prompt_cot' creada exitosamente.")
print("-------------------------------------------------")
print(user_prompt_cot)

‚úÖ Variable 'user_prompt_cot' creada exitosamente.
-------------------------------------------------

Elabora una propuesta t√©cnica y de negocio completa para crear el asistente de IA "SantanderSQL Shield".

Para asegurar una respuesta bien estructurada, piensa paso a paso:

1.  **Paso 1: Diagn√≥stico del Problema.** Primero, analiza y describe la problem√°tica operativa actual con los scripts DML en Santander US, cuantificando el volumen, la tasa de error y el impacto financiero.

2.  **Paso 2: Definici√≥n de la Soluci√≥n.** A continuaci√≥n, detalla el concepto de "SantanderSQL Shield". Explica sus funcionalidades clave (validaci√≥n de sintaxis, generaci√≥n de rollback, etc.) y c√≥mo resuelven directamente el problema diagnosticado.

3.  **Paso 3: Dise√±o de la Arquitectura.** Despu√©s, define la arquitectura y la pila tecnol√≥gica que sustentar√° el proyecto (menciona Google Gemini 1.5 Pro, Python/FastAPI, React y Docker).

4.  **Paso 4: An√°lisis de Viabilidad.** Finalmente, desar

In [9]:
# Informa al usuario que el proceso con la metodolog√≠a CoT ha comenzado.
print("üöÄ Iniciando la consulta Chain-of-Thought (CoT) al LLM...")
print("---------------------------------------------------------")

try:
    # Llama a la funci√≥n 'call_openai' con el prompt que gu√≠a el razonamiento del modelo.
    # El modelo seguir√° los pasos definidos en 'user_prompt_cot' para construir su respuesta.
    respuesta_cot = call_openai(system_prompt, user_prompt_cot)

    # Presenta un encabezado claro para el resultado generado.
    print("\n‚úÖ Propuesta Generada (siguiendo CoT):")
    print("===========================================")

    if respuesta_cot:
        # Renderiza la respuesta del LLM. Dado que CoT promueve una respuesta estructurada,
        # es muy probable que el modelo use formato Markdown, que se ver√° muy bien aqu√≠.
        display(Markdown(respuesta_cot))
    else:
        # Se ejecuta si la funci√≥n 'call_openai' no devolvi√≥ una respuesta v√°lida.
        print("No se recibi√≥ una respuesta v√°lida del modelo.")

except Exception as e:
    # Captura y muestra de forma amigable cualquier error durante la llamada a la API.
    print(f"üõë Ocurri√≥ un error durante la ejecuci√≥n: {e}")

üöÄ Iniciando la consulta Chain-of-Thought (CoT) al LLM...
---------------------------------------------------------
üöÄ Iniciando llamada a la API con el modelo: gpt-4o-mini...
‚úÖ Respuesta recibida exitosamente de OpenAI.

‚úÖ Propuesta Generada (siguiendo CoT):


### Propuesta T√©cnica y de Negocio para "SantanderSQL Shield"

---

#### **Paso 1: Diagn√≥stico del Problema**

**An√°lisis de la problem√°tica operativa actual:**

En Santander US Bank, la gesti√≥n y ejecuci√≥n de scripts DML (Data Manipulation Language) es una tarea cr√≠tica, pero presenta varios desaf√≠os:

- **Volumen:** Se estima que el departamento de TI maneja anualmente alrededor de 500,000 scripts DML, que incluyen inserciones, actualizaciones y eliminaciones de datos.
  
- **Tasa de error:** Actualmente, se reporta un 4% de error en la ejecuci√≥n de estos scripts, lo que equivale a aproximadamente 20,000 scripts err√≥neos al a√±o. Los errores pueden surgir debido a problemas de sintaxis, conflictos de datos o validaciones insuficientes.

- **Impacto financiero:** Cada error en un script DML puede generar costos significativos debido a la necesidad de correcci√≥n, tiempo de inactividad del sistema y p√©rdida de confianza del cliente. Se estima que el costo promedio por error es de $1,500 USD, lo que se traduce en un impacto financiero anual de aproximadamente $30,000,000 USD.

---

#### **Paso 2: Definici√≥n de la Soluci√≥n**

**Concepto de "SantanderSQL Shield":**

"SantanderSQL Shield" ser√° un asistente de inteligencia artificial dise√±ado espec√≠ficamente para optimizar la gesti√≥n de scripts DML en Santander US Bank. Las funcionalidades clave incluir√°n:

1. **Validaci√≥n de sintaxis:** Utilizando t√©cnicas de procesamiento de lenguaje natural (PLN) y aprendizaje autom√°tico, el sistema validar√° autom√°ticamente la sintaxis de los scripts DML antes de su ejecuci√≥n, reduciendo la tasa de error.

2. **Generaci√≥n de rollback:** El asistente generar√° autom√°ticamente scripts de rollback para cada operaci√≥n DML, permitiendo revertir cambios en caso de errores, minimizando el riesgo de p√©rdida de datos.

3. **An√°lisis de impacto:** Antes de ejecutar un script, "SantanderSQL Shield" evaluar√° el impacto potencial en la base de datos, ofreciendo recomendaciones sobre la mejor manera de proceder.

4. **Registro y auditor√≠a:** Mantendr√° un registro detallado de todas las ejecuciones de scripts, incluyendo errores y correcciones, facilitando auditor√≠as y cumplimiento normativo.

5. **Integraci√≥n continua:** Se integrar√° con las herramientas de CI/CD existentes para garantizar una implementaci√≥n fluida de scripts en entornos de producci√≥n.

---

#### **Paso 3: Dise√±o de la Arquitectura**

**Arquitectura y pila tecnol√≥gica:**

La arquitectura de "SantanderSQL Shield" estar√° dise√±ada para ser escalable, segura y eficiente:

- **Frontend:** Desarrollado en **React**, proporcionando una interfaz de usuario intuitiva que permita a los desarrolladores interactuar f√°cilmente con el asistente.

- **Backend:** Usar√° **Python** y **FastAPI** para manejar las solicitudes y procesar la l√≥gica de negocio. Esto incluye la validaci√≥n de sintaxis y la generaci√≥n de scripts de rollback.

- **Modelo de IA:** Implementaremos **Google Gemini 1.5 Pro** para el procesamiento de lenguaje natural y la validaci√≥n sem√°ntica, mejorando as√≠ la detecci√≥n de errores en los scripts.

- **Contenerizaci√≥n:** Se utilizar√° **Docker** para facilitar la implementaci√≥n y el escalado de la aplicaci√≥n en diferentes entornos, asegurando consistencia y facilidad de mantenimiento.

---

#### **Paso 4: An√°lisis de Viabilidad**

**Caso de negocio:**

1. **Cronograma estimado:**
   - Fase de investigaci√≥n y dise√±o: 3 meses
   - Desarrollo de frontend y backend: 6 meses
   - Integraci√≥n y pruebas: 3 meses
   - Total: **12 meses** para el lanzamiento de la primera versi√≥n.

2. **Desglose de costos:**
   - Salaries (desarrolladores, ingenieros de datos, etc.): $1,200,000 USD
   - Herramientas y licencias (Google Gemini, servidores, etc.): $150,000 USD
   - Implementaci√≥n y mantenimiento (primer a√±o): $100,000 USD
   - **Total estimado: $1,450,000 USD**

3. **C√°lculo del Retorno de la Inversi√≥n (ROI):**
   - Ahorro por reducci√≥n de errores (20,000 errores * $1,500 USD/error): $30,000,000 USD/a√±o.
   - Costo de implementaci√≥n: $1,450,000 USD.
   - ROI estimado en el primer a√±o: 
     \[
     ROI = \frac{Beneficio - Costo}{Costo} = \frac{30,000,000 - 1,450,000}{1,450,000} \approx 20.69 \text{ (o 2069\%)}
     \]

---

### **Conclusi√≥n**

La implementaci√≥n de "SantanderSQL Shield" no solo resolver√° los problemas actuales relacionados con los scripts DML, sino que tambi√©n proporcionar√° una mejora significativa en la eficiencia operativa y una reducci√≥n en los costos asociados a errores. Con un ROI estimado de m√°s del 2000%, esta inversi√≥n es estrat√©gica para el futuro de Santander US Bank.

# **Caso 3: User_Prompt Tree-of-Thoughts (ToT)**

In [10]:
# Prompt que utiliza la metodolog√≠a Tree-of-Thoughts (ToT).
user_prompt_tot = """
**Problema Estrat√©gico:** Elabora la mejor propuesta posible para el proyecto "SantanderSQL Shield", considerando diferentes enfoques.

Para resolver esto, sigue un √°rbol de pensamientos:

**Paso 1: Generaci√≥n de Enfoques (las ramas del √°rbol).**
Primero, genera tres enfoques estrat√©gicos distintos y viables para desarrollar el proyecto:
1.  **Enfoque A (MVP de M√°xima Automatizaci√≥n):** Describe una herramienta simple y r√°pida cuyo √∫nico objetivo sea validar y generar scripts DML con la m√≠nima intervenci√≥n humana.
2.  **Enfoque B (Asistente Colaborativo "Human-in-the-Loop"):** Describe una herramienta interactiva que asista al desarrollador, explicando sus validaciones y requiriendo aprobaci√≥n humana, priorizando la seguridad y el aprendizaje del equipo.
3.  **Enfoque C (Plataforma Empresarial Integral):** Describe una soluci√≥n a gran escala que no solo valide scripts, sino que tambi√©n se integre con los pipelines de CI/CD, ofrezca dashboards de auditor√≠a y gestione permisos de usuario.

**Paso 2: Evaluaci√≥n de las Ramas.**
Ahora, eval√∫a de forma cr√≠tica cada uno de los tres enfoques (A, B y C) bas√°ndote en los siguientes criterios, fundamentales para Santander US Bank:
* **Seguridad y Cumplimiento:** ¬øQu√© tan robusto es para prevenir errores y cumplir con las normativas bancarias?
* **Velocidad de Adopci√≥n y ROI:** ¬øQu√© tan r√°pido se puede implementar y qu√© tan pronto generar√≠a un retorno de la inversi√≥n?
* **Escalabilidad y Complejidad T√©cnica:** ¬øQu√© tan f√°cil es de mantener y hacer crecer a futuro?

**Paso 3: S√≠ntesis y Recomendaci√≥n Final (la mejor ruta).**
Basado en tu evaluaci√≥n comparativa, selecciona el enfoque m√°s adecuado para Santander US Bank. Puedes combinar las mejores caracter√≠sticas de los diferentes enfoques si lo consideras √≥ptimo. Justifica claramente por qu√© tu propuesta final es la mejor soluci√≥n estrat√©gica.
"""

# Confirma que la variable se ha creado.
print("‚úÖ Variable 'user_prompt_tot' creada exitosamente.")
print("-------------------------------------------------")
print(user_prompt_tot)

‚úÖ Variable 'user_prompt_tot' creada exitosamente.
-------------------------------------------------

**Problema Estrat√©gico:** Elabora la mejor propuesta posible para el proyecto "SantanderSQL Shield", considerando diferentes enfoques.

Para resolver esto, sigue un √°rbol de pensamientos:

**Paso 1: Generaci√≥n de Enfoques (las ramas del √°rbol).**
Primero, genera tres enfoques estrat√©gicos distintos y viables para desarrollar el proyecto:
1.  **Enfoque A (MVP de M√°xima Automatizaci√≥n):** Describe una herramienta simple y r√°pida cuyo √∫nico objetivo sea validar y generar scripts DML con la m√≠nima intervenci√≥n humana.
2.  **Enfoque B (Asistente Colaborativo "Human-in-the-Loop"):** Describe una herramienta interactiva que asista al desarrollador, explicando sus validaciones y requiriendo aprobaci√≥n humana, priorizando la seguridad y el aprendizaje del equipo.
3.  **Enfoque C (Plataforma Empresarial Integral):** Describe una soluci√≥n a gran escala que no solo valide scripts, si

In [11]:
# Informa al usuario que se inicia el proceso ToT, que puede ser m√°s lento.
print("üöÄ Iniciando la consulta Tree-of-Thoughts (ToT) al LLM...")
print("---------------------------------------------------------")

try:
    # Llama a la funci√≥n 'call_openai' con el prompt ToT.
    # Este prompt obliga al modelo a generar, evaluar y seleccionar entre varias
    # alternativas antes de dar una respuesta final.
    respuesta_tot = call_openai(system_prompt, user_prompt_tot, temperature=0.5)

    # Presenta un encabezado claro para la respuesta estrat√©gica.
    print("\n‚úÖ Propuesta Estrat√©gica Generada (siguiendo ToT):")
    print("===================================================")

    if respuesta_tot:
        # Renderiza la respuesta. El resultado de un ToT suele ser muy estructurado
        # y detallado, por lo que Markdown es ideal para visualizarlo.
        display(Markdown(respuesta_tot))
    else:
        # Se ejecuta si no se obtuvo una respuesta v√°lida del modelo.
        print("No se recibi√≥ una respuesta v√°lida del modelo.")

except Exception as e:
    # Captura y muestra de forma clara cualquier error durante el proceso.
    print(f"üõë Ocurri√≥ un error durante la ejecuci√≥n: {e}")

üöÄ Iniciando la consulta Tree-of-Thoughts (ToT) al LLM...
---------------------------------------------------------
üöÄ Iniciando llamada a la API con el modelo: gpt-4o-mini...
‚úÖ Respuesta recibida exitosamente de OpenAI.

‚úÖ Propuesta Estrat√©gica Generada (siguiendo ToT):


### Paso 1: Generaci√≥n de Enfoques

#### Enfoque A: MVP de M√°xima Automatizaci√≥n
- **Descripci√≥n:** Se desarrollar√° una herramienta sencilla que valide y genere scripts DML (Data Manipulation Language) de manera autom√°tica. La intervenci√≥n humana se limitar√° a la supervisi√≥n ocasional, con el objetivo de minimizar errores y acelerar la producci√≥n de scripts.
- **Caracter√≠sticas Clave:**
  - Validaci√≥n autom√°tica de scripts en tiempo real.
  - Generaci√≥n de scripts DML basados en patrones predefinidos.
  - Interfaz de usuario intuitiva para facilitar la adopci√≥n.

#### Enfoque B: Asistente Colaborativo "Human-in-the-Loop"
- **Descripci√≥n:** Esta herramienta interactiva asistir√° a los desarrolladores en la creaci√≥n y validaci√≥n de scripts. Proporcionar√° explicaciones sobre las validaciones realizadas y solicitar√° la aprobaci√≥n del usuario antes de ejecutar cualquier script, enfoc√°ndose en la seguridad y el aprendizaje continuo del equipo.
- **Caracter√≠sticas Clave:**
  - Interfaz interactiva con explicaciones detalladas de las validaciones.
  - Proceso de aprobaci√≥n que involucra a los desarrolladores.
  - Registro de decisiones y retroalimentaci√≥n para mejorar el sistema.

#### Enfoque C: Plataforma Empresarial Integral
- **Descripci√≥n:** Se propone una soluci√≥n a gran escala que no solo valida scripts, sino que tambi√©n se integra con los pipelines de CI/CD (Integraci√≥n Continua/Despliegue Continuo), ofrece dashboards de auditor√≠a y gestiona permisos de usuario. Este enfoque busca ser una soluci√≥n completa y robusta para la gesti√≥n de scripts en un entorno empresarial.
- **Caracter√≠sticas Clave:**
  - Integraci√≥n con herramientas de CI/CD existentes.
  - Dashboards para auditor√≠a y monitoreo en tiempo real.
  - Gesti√≥n de permisos y roles de usuario para mayor seguridad.

### Paso 2: Evaluaci√≥n de las Ramas

#### Enfoque A: MVP de M√°xima Automatizaci√≥n
- **Seguridad y Cumplimiento:** Moderado. La automatizaci√≥n puede reducir errores, pero la falta de supervisi√≥n humana puede ser un riesgo.
- **Velocidad de Adopci√≥n y ROI:** Alto. La implementaci√≥n r√°pida puede generar un ROI inmediato al reducir el tiempo de desarrollo.
- **Escalabilidad y Complejidad T√©cnica:** Moderado. Aunque es f√°cil de implementar, puede ser dif√≠cil de escalar y adaptar a cambios futuros.

#### Enfoque B: Asistente Colaborativo "Human-in-the-Loop"
- **Seguridad y Cumplimiento:** Alto. La intervenci√≥n humana y las explicaciones detalladas fomentan la responsabilidad y el cumplimiento normativo.
- **Velocidad de Adopci√≥n y ROI:** Moderado. Puede requerir m√°s tiempo de capacitaci√≥n, pero el ROI se logra a trav√©s de una mayor calidad y menor riesgo de error.
- **Escalabilidad y Complejidad T√©cnica:** Alto. La plataforma puede evolucionar y adaptarse a nuevas tecnolog√≠as y requerimientos.

#### Enfoque C: Plataforma Empresarial Integral
- **Seguridad y Cumplimiento:** Muy alto. La integraci√≥n con CI/CD y la gesti√≥n de permisos garantizan un entorno seguro y conforme.
- **Velocidad de Adopci√≥n y ROI:** Bajo. La implementaci√≥n puede ser m√°s lenta y costosa, pero el ROI a largo plazo es alto gracias a la eficiencia y la reducci√≥n de riesgos.
- **Escalabilidad y Complejidad T√©cnica:** Muy alto. Dise√±ada para crecer y adaptarse a las necesidades futuras de la organizaci√≥n.

### Paso 3: S√≠ntesis y Recomendaci√≥n Final

**Recomendaci√≥n:** El **Enfoque C: Plataforma Empresarial Integral** es la mejor soluci√≥n estrat√©gica para Santander US Bank. Aunque la implementaci√≥n puede ser m√°s lenta y costosa, los beneficios a largo plazo en t√©rminos de seguridad, cumplimiento y escalabilidad superan estas desventajas. 

**Justificaci√≥n:**
- **Seguridad y Cumplimiento:** Dada la naturaleza del sector bancario, es crucial contar con una soluci√≥n robusta que minimice riesgos. La integraci√≥n con CI/CD y la gesti√≥n de permisos son esenciales para cumplir con las normativas.
- **Retorno de Inversi√≥n a Largo Plazo:** Aunque el ROI inicial puede ser menor, la capacidad de escalar y adaptarse a futuras necesidades garantizar√° que la inversi√≥n se justifique en el tiempo, al reducir errores y mejorar la eficiencia operativa.
- **Adaptabilidad:** Esta plataforma puede evolucionar con el tiempo, incorporando nuevas tecnolog√≠as y herramientas, lo que resulta en una soluci√≥n sostenible a largo plazo.

Si se considera necesario, se pueden integrar elementos del Enfoque B para fomentar la colaboraci√≥n y el aprendizaje, creando un sistema que combine la seguridad de la supervisi√≥n humana con la robustez de la automatizaci√≥n.

# Conversando con OpenAI

In [12]:
# Historial del chat
# Inicializa historial y contador de iteraci√≥n

historial = [
    {"role": "system", "content": "Eres un asistente √∫til y conversacional."},
    {
        "role": "assistant",
        "content": "¬°Hola de nuevo! Soy un asistente conversacional basado en inteligencia artificial. "
                   "Estoy aqu√≠ para ayudarte con cualquier pregunta o informaci√≥n que necesites. "
                   "¬øHay algo espec√≠fico en lo que pueda asistirte?"
    }
]
iteracion = 1

In [13]:
# Funci√≥n para mostrar respuesta y tokens
def mostrar_respuesta(mensaje, iteracion, prompt_tokens, completion_tokens, total_tokens):
    html = f"""
    <div style="border: 1px solid #ccc; background-color: #f4faff; color: #000000;
                padding: 18px; border-radius: 12px; font-family: sans-serif;
                max-width: 800px; line-height: 1.6; font-size: 15px;
                max-height: 400px; overflow-y: auto; box-shadow: 0px 4px 10px rgba(0,0,0,0.1);">
        <strong style="font-size: 16px;">gpt-4o responde (Iteraci√≥n #{iteracion:02d}):</strong><br>
        <div style="margin-top: 10px; white-space: pre-wrap;">{mensaje}</div>
        <hr style="margin-top: 15px; margin-bottom: 5px;">
        <div style="font-size: 13px; color: #333;">
            <strong>Tokens usados:</strong>
            Prompt: {prompt_tokens}, Respuesta: {completion_tokens}, Total: {total_tokens}
        </div>
    </div>
    """
    display(HTML(html))

In [14]:
# Funci√≥n para enviar mensajes al modelo y mantener el contexto

# Funci√≥n principal con seguimiento de tokens
def enviar_mensaje(mensaje_usuario):
    global iteracion
    historial.append({"role": "user", "content": mensaje_usuario})

    respuesta = client.chat.completions.create(
        model="gpt-4o",
        messages=historial
    )

    mensaje_respuesta = respuesta.choices[0].message.content
    historial.append({"role": "assistant", "content": mensaje_respuesta})

    usage = respuesta.usage
    mostrar_respuesta(
        mensaje_respuesta,
        iteracion,
        prompt_tokens=usage.prompt_tokens,
        completion_tokens=usage.completion_tokens,
        total_tokens=usage.total_tokens
    )
    iteracion += 1

# Iteraccion con LLM empleando la tecnica Zero-Shot

In [15]:
print(enviar_mensaje("Hola, ¬øqui√©n eres?"))

None


In [16]:
print(enviar_mensaje("Te contrato para trabajar en Banco Santander USA"))

None


In [17]:
print(enviar_mensaje("Para fines de este ejercicio, vas a simular que trabajas conmigo en el departamento de Desarrollo de Software de Santander USA"))

None


In [18]:
print(enviar_mensaje("Dime para quien trabajas?"))

None


# **Iteraciones con el LLM empleando User_Prompt Chain-of-Thought (CoT)**

In [19]:
# 1. Definimos el prompt Chain-of-Thought como una variable para mantener el c√≥digo limpio.
prompt_cot_para_iniciar = """A continuaci√≥n, te pasar√© algo de contexto sobre Santander Bank US para que sepas para qui√©n trabajas. Necesito que asimiles esta informaci√≥n para actuar como un consultor experto.

Para hacerlo correctamente, piensa paso a paso:

1.  **Paso 1: Reconoce tu Rol.** Primero, entiende que tu objetivo es adoptar la persona de un 'consultor experto' para esta empresa espec√≠fica.

2.  **Paso 2: Prep√°rate para Analizar.** A continuaci√≥n, prep√°rate para leer, analizar y memorizar los datos clave que te proporcionar√© sobre el banco.

3.  **Paso 3: Confirma y Espera.** Finalmente, una vez que te haya dado el contexto en mi siguiente mensaje, quiero que respondas √∫nicamente con la frase: "Contexto asimilado. Estoy listo para mi rol como consultor de Santander US." y no digas nada m√°s hasta mi pr√≥xima instrucci√≥n."""


# 2. Llamamos directamente a TU funci√≥n con el prompt.
# No es necesario usar print() porque tu funci√≥n ya se encarga de mostrar la respuesta.
enviar_mensaje(prompt_cot_para_iniciar)

In [20]:
# 1. Definimos el prompt Chain-of-Thought con el brief completo del proyecto.
prompt_cot_briefing = """
A continuaci√≥n, te proporciono el brief completo del proyecto 'SantanderSQL Shield'. Tu tarea es analizarlo en profundidad y prepararte para actuar como el consultor principal que dise√±ar√° la soluci√≥n.

Para asegurar una comprensi√≥n total, procesa la informaci√≥n pensando paso a paso:

1.  **Paso 1: Asimila el Cliente y la Misi√≥n.** Primero, lee y entiende qui√©n es el cliente (Santander US Bank) y cu√°l es el objetivo principal del proyecto "SantanderSQL Shield".

2.  **Paso 2: Cuantifica el Problema.** A continuaci√≥n, analiza las m√©tricas clave del problema: el volumen de solicitudes DML, la alta tasa de error y, sobre todo, el significativo impacto financiero anual que esto representa.

3.  **Paso 3: Identifica los Componentes.** Despu√©s, identifica todos los elementos involucrados en el proyecto. Esto incluye los tipos de datos a manejar, las √°reas de la empresa (stakeholders) y la arquitectura tecnol√≥gica que ya ha sido propuesta.

4.  **Paso 4: Entiende los Entregables.** Revisa y comprende los an√°lisis de negocio que se deben entregar como parte de la propuesta: el cronograma, la estimaci√≥n de costos y el c√°lculo del ROI.

5.  **Paso 5: Confirma y Prep√°rate.** Finalmente, despu√©s de haber procesado mentalmente todos los puntos anteriores, confirma que has analizado el brief completo y est√°s listo. Responde √∫nicamente con la frase: "Brief del proyecto SantanderSQL Shield analizado. Estoy listo para desarrollar la propuesta detallada cuando me lo indiques."

---
**INICIO DEL BRIEF**

üè¢ **Contexto de la Empresa:**

Tu cliente es **Santander US Bank** (filial de Banco Santander S.A., Espa√±a), una instituci√≥n financiera de gran escala en el noreste de EE. UU. con las siguientes m√©tricas:
* **Activos:** $147,000,000,000 USD
* **Empleados:** 17,200
* **Clientes:** 5.2 millones

üéØ **Misi√≥n del Proyecto:**

Actuar√°s como el **consultor t√©cnico y de negocio principal** en el dise√±o del proyecto **"SantanderSQL Shield"**. Este proyecto consiste en crear un asistente inteligente dise√±ado para automatizar y validar la generaci√≥n de scripts DML (Lenguaje de Manipulaci√≥n de Datos) antes de su paso a producci√≥n.

üìã **Tareas y Requisitos Clave:**

Tu an√°lisis y propuesta deben abordar los siguientes puntos de manera integral:

1.  **An√°lisis del Problema:**
    * **Volumen:** 1,874 solicitudes DML en 2024.
    * **Tasa de Error:** 18% de las solicitudes contienen errores.
    * **Impacto Financiero:** Costo anual estimado superior a $340,000 USD debido a estos errores.

2.  **Definici√≥n de los Datos:**
    * El sistema procesar√° √∫nicamente sentencias SQL en formato de texto plano.
    * **Importante:** No se almacenar√°n ni procesar√°n datos sensibles de clientes.

3.  **Identificaci√≥n de Stakeholders (√Åreas Implicadas):**
    * Run the Bank (Operaciones)
    * Equipos de bases de datos (Oracle DB, DB2)
    * Control Batch (Procesos por lotes)
    * Quality Assurance (QA)
    * Arquitectura de Datos

4.  **Propuesta de Arquitectura y Tecnolog√≠a:**
    * **Modelo de IA:** Google Gemini 1.5 Pro a trav√©s de Vertex AI.
    * **Backend:** Python 3 con FastAPI.
    * **Frontend:** React.
    * **Infraestructura:** Docker y un pipeline de CI/CD (Integraci√≥n/Entrega Continua).

5.  **An√°lisis de Viabilidad:**
    * Estimar un **cronograma** realista para el proyecto.
    * Proporcionar una estimaci√≥n de **costos** de implementaci√≥n y mantenimiento.
    * Calcular el **Retorno de la Inversi√≥n (ROI)** esperado.

---
**FIN DEL BRIEF**
"""

# 2. Llamamos directamente a TU funci√≥n con el prompt de briefing.
# Tu funci√≥n 'enviar_mensaje' se encargar√° de procesarlo y mostrar la respuesta.
enviar_mensaje(prompt_cot_briefing)

In [21]:
enviar_mensaje("Ok Vamos a trabajar")

In [22]:
# 1. Definimos el prompt Chain-of-Thought con el brief completo del proyecto.
prompt_cot_briefing = """

Paso 1. Diem como propones que implementemos este proyecto
Paso 2. Dame un Ejemplo que tecnologias arqutiectura usariamos
Paso 3. Dime cual seria el Entregable
Paso 4. Dime que podria esperar el usuario Final
Paso 5. Dime tus conclusiones, por que elegiste dicho modelo / tecnologia para montar el proyecto


"""

# 2. Llamamos directamente a TU funci√≥n con el prompt de briefing.
# Tu funci√≥n 'enviar_mensaje' se encargar√° de procesarlo y mostrar la respuesta.
enviar_mensaje(prompt_cot_briefing)

In [23]:
enviar_mensaje("me diste un gran plan podrias darme una lista un resumen breve de cada paso?")

In [24]:
enviar_mensaje("""

Gracias por el resumen. Es un buen inicio, pero para que sea una propuesta s√≥lida, necesitamos ir al grano y justificar dos √°reas clave:

Primero, la tecnolog√≠a. La justificaci√≥n para usar Google Gemini es muy gen√©rica. Necesito saber por qu√© es mejor que otras alternativas, como los modelos de OpenAI o incluso un modelo open-source m√°s controlable y econ√≥mico, considerando que nuestra tarea es muy espec√≠fica.

Segundo, el plan. Es demasiado vago para un entorno bancario. ¬øC√≥mo mediremos de forma concreta el √©xito m√°s all√° de "entregar un sistema"? Y, m√°s importante, ¬øcu√°l es el plan de despliegue exacto para implementarlo de forma segura sin interrumpir las operaciones?

Necesitamos respuestas concretas a esas dos preguntas para considerar la inversi√≥n.


""")

# **Iteraciones con el LLM empleando User_Prompt Tree-of-Thoughts (ToT)**

In [25]:
# Prompt ToT que rechaza la justificaci√≥n y fuerza la exploraci√≥n de 3 alternativas de LLM.
user_prompt_tot_analisis_llm = """
Agradezco la aclaraci√≥n, sin embargo, la justificaci√≥n para seleccionar a Google Gemini como √∫nica opci√≥n a√∫n no es concluyente y parece m√°s una defensa de la propuesta inicial que un an√°lisis cr√≠tico. La decisi√≥n sobre el motor de IA es el n√∫cleo de este proyecto y no podemos proceder con una √∫nica alternativa sin un an√°lisis comparativo m√°s profundo.

Por ello, vamos a utilizar un enfoque de **'√Årbol de Pensamientos' (Tree-of-Thoughts)** para explorar las opciones de manera estructurada.

**Tu tarea es la siguiente:**

Quiero que generes una descripci√≥n para tres "ramas" de decisi√≥n, cada una centrada en un tipo de modelo de LLM. Las ramas a explorar son:

1.  **Rama 1: Ecosistema Google (Gemini 1.5 Pro en Vertex AI).**
2.  **Rama 2: Ecosistema OpenAI (GPT-4o o el modelo m√°s avanzado disponible).**
3.  **Rama 3: Soluci√≥n Soberana (un modelo Open-Source de alto rendimiento como Llama 3 o similar, que ser√≠a fine-tuneado y alojado en nuestra propia infraestructura).**

---

Para cada una de estas tres ramas, debes proporcionar la siguiente informaci√≥n de manera concisa:

* **Descripci√≥n Breve:** ¬øQu√© es y cu√°l es su propuesta de valor principal en el mercado?
* **Pro (Ventaja Clave):** ¬øCu√°l es su **mayor fortaleza** para nuestro caso de uso espec√≠fico en Santander?
* **Contra (Desventaja Clave):** ¬øCu√°l es su **principal debilidad o riesgo** para un entorno bancario regulado como el nuestro?
* **Aplicaci√≥n Pr√°ctica:** ¬øC√≥mo funcionar√≠a espec√≠ficamente para nuestra herramienta 'SantanderSQL Shield'? Describe brevemente c√≥mo generar√≠a y validar√≠a queries de manera segura en este escenario.
"""

# 2. Llamamos directamente a tu funci√≥n con el nuevo prompt ToT.
enviar_mensaje(user_prompt_tot_analisis_llm)

In [26]:
# Prompt ToT que rechaza la justificaci√≥n y fuerza la exploraci√≥n de 3 alternativas de LLM.
user_prompt_tot_analisis_llm = """

Gracias por el desglose. Es √∫til, pero mi opini√≥n es que en las tres ramas la seguridad se trata como una caracter√≠stica,
no como el pilar fundamental que es para un banco. Esto me preocupa.

Confiar ciegamente en la "infraestructura segura" de Google o en las APIs de OpenAI no es una estrategia; es una vulnerabilidad esperando a ser explotada,
ya que nuestros scripts son propiedad intelectual cr√≠tica. Por otro lado, la "soluci√≥n soberana" no es inherentemente segura; solo transfiere toda la responsabilidad a nuestro equipo, lo que puede ser a√∫n m√°s arriesgado.

Por lo tanto, el desaf√≠o es el siguiente: Para cada una de las tres ramas, quiero que propongas una medida de seguridad t√©cnica y
espec√≠fica para mitigar el riesgo principal que presenta. No me digas que es seguro, dime c√≥mo lo har√≠amos seguro en la pr√°ctica.

"""

# 2. Llamamos directamente a tu funci√≥n con el nuevo prompt ToT.
enviar_mensaje(user_prompt_tot_analisis_llm)

In [27]:
enviar_mensaje("Gracias por el apoyo, lo reviso con nuestro jefe y seguimos discutiendo, bonita noche")

---
---

### **An√°lisis de T√©cnicas de Prompt Engineering en la Demostraci√≥n**

En la libreta se demostr√≥ c√≥mo la calidad y el tipo de prompt influyen directamente en la utilidad y profundidad de la respuesta del LLM. Se utilizaron tres t√©cnicas clave, cada una con un prop√≥sito espec√≠fico y con resultados claramente diferenciados.

-----

#### **1. Prompting Zero-Shot (Disparo √önico)**

Esta es la t√©cnica m√°s directa, donde se le da al modelo una instrucci√≥n simple sin ejemplos previos.

  * **Ejemplo del Prompt:**

    ```
    "Pres√©ntame la idea inicial del proyecto 'SantanderSQL Shield'."
    ```

  * **Efecto y Prop√≥sito:**
    El objetivo era obtener una respuesta r√°pida y una visi√≥n general del concepto del proyecto. Se usa para tareas sencillas donde no se requiere un an√°lisis profundo, sino una descripci√≥n b√°sica.

  * **Observaciones de la Respuesta:**

      * La respuesta fue coherente y relevante al tema solicitado.
      * Sin embargo, fue muy gen√©rica. Describi√≥ los componentes de una soluci√≥n de seguridad de datos (protecci√≥n, detecci√≥n, resiliencia) pero no utiliz√≥ los datos cuantitativos espec√≠ficos del problema (ej. la tasa de error del 18% o el costo de $340,000 USD) que se mencionan en el contexto de la libreta.
      * Demostr√≥ que para un caso de negocio que requiere detalle y justificaci√≥n, el enfoque Zero-Shot es insuficiente.

-----

#### **2. Prompting Chain-of-Thought (CoT) (Cadena de Pensamiento)**

Esta t√©cnica gu√≠a al modelo para que descomponga un problema y lo resuelva "paso a paso", mejorando la l√≥gica y la estructura de la respuesta.

  * **Ejemplo del Prompt:**

    ```
    "Elabora una propuesta t√©cnica y de negocio completa para crear el asistente de IA 'SantanderSQL Shield'.

    Para asegurar una respuesta bien estructurada, piensa paso a paso:

    1.  **Paso 1: Diagn√≥stico del Problema.** Primero, analiza y describe la problem√°tica...
    2.  **Paso 2: Definici√≥n de la Soluci√≥n.** A continuaci√≥n, detalla el concepto de 'SantanderSQL Shield'...
    3.  **Paso 3: Dise√±o de la Arquitectura.** Despu√©s, define la arquitectura y la pila tecnol√≥gica...
    4.  **Paso 4: An√°lisis de Viabilidad.** Finalmente, desarrolla el caso de negocio..."
    ```

  * **Efecto y Prop√≥sito:**
    El prop√≥sito era forzar al modelo a construir una respuesta mucho m√°s estructurada y detallada. Al darle una secuencia de razonamiento a seguir, se buscaba obtener una propuesta de negocio completa que abordara el problema desde el diagn√≥stico hasta el c√°lculo del ROI.

  * **Observaciones de la Respuesta:**

      * La calidad de la respuesta mejor√≥ dr√°sticamente. El LLM gener√≥ una propuesta de negocio y t√©cnica completa, organizada exactamente seg√∫n los pasos solicitados.
      * A diferencia del Zero-Shot, esta respuesta s√≠ integr√≥ los datos num√©ricos del problema (aunque con algunas alucinaciones en los valores exactos, como un costo anual de $6M en lugar de los $340k del contexto), lo que hizo el caso de negocio mucho m√°s convincente.
      * Esta t√©cnica demostr√≥ ser fundamental para pasar de una idea general a un plan de proyecto accionable y bien fundamentado.

-----

#### **3. Prompting Tree-of-Thoughts (ToT) (√Årbol de Pensamientos)**

Es una t√©cnica avanzada donde el modelo debe generar m√∫ltiples l√≠neas de razonamiento (ramas), evaluarlas y luego sintetizar la mejor soluci√≥n.

  * **Ejemplo del Prompt:**

    ```
    "**Problema Estrat√©gico:** Elabora la mejor propuesta posible... considerando diferentes enfoques.

    Para resolver esto, sigue un √°rbol de pensamientos:

    **Paso 1: Generaci√≥n de Enfoques (las ramas del √°rbol).**
    Primero, genera tres enfoques estrat√©gicos distintos y viables para desarrollar el proyecto:
    1.  **Enfoque A (MVP de M√°xima Automatizaci√≥n)...**
    2.  **Enfoque B (Asistente Colaborativo 'Human-in-the-Loop')...**
    3.  **Enfoque C (Plataforma Empresarial Integral)...**

    **Paso 2: Evaluaci√≥n de las Ramas.**
    Ahora, eval√∫a de forma cr√≠tica cada uno de los tres enfoques...

    **Paso 3: S√≠ntesis y Recomendaci√≥n Final (la mejor ruta).**
    Basado en tu evaluaci√≥n comparativa, selecciona el enfoque m√°s adecuado..."
    ```

  * **Efecto y Prop√≥sito:**
    El objetivo no era solo obtener una soluci√≥n, sino forzar al LLM a realizar un an√°lisis estrat√©gico. Se buscaba que explorara el espacio de posibles soluciones, las comparara de forma cr√≠tica seg√∫n criterios de negocio (seguridad, ROI, escalabilidad) y justificara una decisi√≥n final. Es una t√©cnica para la resoluci√≥n de problemas complejos y la toma de decisiones.

  * **Observaciones de la Respuesta:**

      * Este m√©todo produjo la respuesta m√°s sofisticada y de mayor valor estrat√©gico.
      * El LLM fue capaz de generar y describir claramente tres enfoques distintos, evaluarlos de manera coherente y, lo m√°s importante, recomendar una soluci√≥n h√≠brida que combinaba las mejores caracter√≠sticas de dos de los enfoques, justificando su elecci√≥n.
      * El ToT demostr√≥ ser extremadamente poderoso para tareas de consultor√≠a y estrategia, ya que no solo responde a una pregunta, sino que explora, eval√∫a y recomienda el mejor camino a seguir, imitando un proceso de toma de decisiones humano de alto nivel.

---
---

A continuaci√≥n se presenta un an√°lisis detallado del notebook proporcionado, con las conclusiones finales de la demostraci√≥n, una explicaci√≥n de las t√©cnicas de *Prompt Engineering* utilizadas y las referencias correspondientes.

### **Conclusiones Finales de la Demostraci√≥n**

El notebook presenta una demostraci√≥n exhaustiva y bien estructurada sobre c√≥mo aplicar un Modelo de Lenguaje Grande (LLM) para resolver un problema de negocio complejo en un entorno corporativo regulado como la banca. El caso de uso, **"SantanderSQL Shield"**, es un ejemplo pr√°ctico y de alto impacto sobre c√≥mo la IA generativa puede optimizar procesos cr√≠ticos, reducir costos y mitigar riesgos operativos.

Las conclusiones clave de la demostraci√≥n son las siguientes:

* **El Prompt es el Pilar del Resultado:** La calidad, profundidad y utilidad de las respuestas del LLM dependieron directamente de la calidad y estructura del prompt. La demostraci√≥n muestra una clara evoluci√≥n desde una idea inicial gen√©rica (con *Zero-Shot*) hasta una propuesta estrat√©gica robusta y evaluada desde m√∫ltiples √°ngulos (con *Tree-of-Thoughts*).
* **La Complejidad Requiere T√©cnicas Avanzadas:** Para tareas sencillas, un prompt directo puede ser suficiente. Sin embargo, para desarrollar una propuesta de negocio completa y estrat√©gica, fue necesario guiar el razonamiento del modelo con t√©cnicas como *Chain-of-Thought* (CoT) y *Tree-of-Thoughts* (ToT). Estas metodolog√≠as permitieron descomponer el problema, explorar alternativas y sintetizar soluciones complejas, imitando un proceso de consultor√≠a real.
* **La Interacci√≥n Conversacional Refina la Soluci√≥n:** La segunda mitad del notebook demuestra que el uso de LLMs no es un proceso de una sola vez, sino una colaboraci√≥n iterativa. Al adoptar un rol y mantener un historial de conversaci√≥n, fue posible desafiar las respuestas iniciales del modelo, solicitar justificaciones m√°s profundas (como la elecci√≥n de la tecnolog√≠a) y a√±adir capas de an√°lisis cr√≠ticas (como las medidas de seguridad espec√≠ficas), llevando la propuesta de un nivel bueno a uno excelente.
* **Capacidad de Adopci√≥n de Personas:** El LLM demostr√≥ ser altamente efectivo en adoptar la persona asignada ("Asistente Experto en consultor√≠a") y mantenerla a lo largo de la interacci√≥n. Esto es fundamental para contextualizar las respuestas y asegurar que se alineen con los objetivos, el tono y las restricciones del cliente, en este caso, Santander US Bank.
* **Demostraci√≥n de Valor de Negocio:** El proyecto simulado "SantanderSQL Shield" presenta un caso de negocio convincente con un Retorno de la Inversi√≥n (ROI) proyectado del 4,267%, lo que subraya el potencial de los LLMs no solo como herramientas tecnol√≥gicas, sino como motores de transformaci√≥n y eficiencia financiera.

### **An√°lisis de M√©todos de *Prompt Engineering* Utilizados**

El *Prompt Engineering* es el proceso de dise√±ar y refinar las entradas (prompts) para guiar a los LLMs a generar las salidas deseadas de la manera m√°s efectiva posible (Phoenix & Taylor, 2024). El notebook emple√≥ tres t√©cnicas principales:

#### 1. **Prompting Zero-Shot (Disparo √önico)**

* **¬øPara qu√© sirve?** Es la forma m√°s b√°sica de interactuar con un LLM. Consiste en dar una instrucci√≥n directa y concisa sin proporcionarle ejemplos previos de c√≥mo realizar la tarea (Falc√≥n Morales, 2025). Es √∫til para tareas simples o para obtener una primera idea general sobre un tema.
* **Resultados Observados:** En el "Caso 1: User_Prompt Zero-Shot", se le pidi√≥ al modelo: *"Pres√©ntame la idea inicial del proyecto 'SantanderSQL Shield' "*. La respuesta fue coherente y relevante, pero muy gen√©rica. Describi√≥ los objetivos y componentes de una soluci√≥n de seguridad de bases de datos de manera superficial, sin conectar directamente con los datos espec√≠ficos del problema (costos, tasa de error) ni proponer una arquitectura concreta. Esto demuestra que para un an√°lisis profundo, el Zero-Shot es insuficiente.

#### 2. **Prompting Chain-of-Thought (CoT) (Cadena de Pensamiento)**

* **¬øPara qu√© sirve?** Esta t√©cnica gu√≠a al modelo para que descomponga un problema complejo en una secuencia de pasos l√≥gicos intermedios antes de llegar a la respuesta final (Falc√≥n Morales, 2025). Al instruir al modelo a "pensar paso a paso", se mejora significativamente la calidad y la estructura del razonamiento, especialmente en tareas que requieren an√°lisis detallado.
* **Resultados Observados:** En el "Caso 2: User_Prompt Chain-of-Thought (CoT)", el prompt se estructur√≥ en cuatro pasos claros: Diagn√≥stico, Soluci√≥n, Arquitectura y Viabilidad. Como resultado, la respuesta del LLM fue una propuesta de negocio completa y bien organizada. A diferencia del Zero-Shot, esta respuesta utiliz√≥ datos cuantitativos del problema para justificar la soluci√≥n y detall√≥ la pila tecnol√≥gica y el an√°lisis de ROI. La metodolog√≠a CoT transform√≥ una idea vaga en un plan de proyecto accionable.

#### 3. **Prompting Tree-of-Thoughts (ToT) (√Årbol de Pensamientos)**

* **¬øPara qu√© sirve?** Es una t√©cnica m√°s avanzada que la CoT. En lugar de seguir una √∫nica cadena de pensamiento, el ToT instruye al modelo a generar y explorar m√∫ltiples l√≠neas de razonamiento (ramas), evaluarlas de forma cr√≠tica seg√∫n ciertos criterios y luego sintetizar la mejor soluci√≥n posible, a menudo combinando las fortalezas de las diferentes ramas (Falc√≥n Morales, 2025). Es ideal para la toma de decisiones estrat√©gicas y la resoluci√≥n de problemas complejos sin una √∫nica respuesta correcta.
* **Resultados Observados:** El "Caso 3: User_Prompt Tree-of-Thoughts (ToT)" es el ejemplo m√°s sofisticado del notebook. El prompt oblig√≥ al modelo a generar tres enfoques estrat√©gicos distintos (MVP, Asistente Colaborativo y Plataforma Integral), evaluarlos seg√∫n criterios clave (seguridad, ROI, escalabilidad) y, finalmente, recomendar una soluci√≥n h√≠brida que combinaba lo mejor de dos enfoques. Este resultado demuestra un nivel de razonamiento estrat√©gico muy superior. La conversaci√≥n posterior, donde se usa este mismo enfoque para comparar proveedores de LLM y luego proponer medidas de seguridad espec√≠ficas para cada uno, refuerza la potencia del ToT para an√°lisis comparativos y mitigaci√≥n de riesgos.

### **Referencias**

Falc√≥n Morales, L. E. (2025). *MNA_NLP_LLM_prompts.pdf* [Materia de NLP, Tec de Monterrey]. Junio 2025.

Falc√≥n Morales, L. E. (2025). *MNA_NLP_prompts_OpenAI_clase-1.ipynb* [Materia de NLP, Tec de Monterrey]. Junio 2025.

OpenAI. (2024). *GPT-4o*. [https://platform.openai.com/docs/guides/gpt](https://platform.openai.com/docs/guides/gpt)

Phoenix, J., & Taylor, M. (2024). *Prompt Engineering for Generative AI*. O'Reilly. [https://learning.oreilly.com/library/view/prompt-engineering-for/9781098153427/](https://learning.oreilly.com/library/view/prompt-engineering-for/9781098153427/)