<a href="https://colab.research.google.com/github/jrebull/NLP/blob/main/02_Team18_NLP_Activity10_3_LLM_Notebook_v1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Procesamiento de Lenguaje Natural**

## Maestría en Inteligencia Artificial Aplicada
#### Tecnológico de Monterrey
#### Profesor Titular: Luis Eduardo Falcón Morales
#### Profesor Tutor: Rodolfo Miguel Gameros Leal

## Actividad Semana 10

### **10.3 Actividad: modelos LLM y IA en tu lugar de trabajo.** vFinal

### **Equipo 18**
> ### 👩‍💻 **Iris Monserrat Urbina Casas**
> `A01795999`

> ### 👨‍💻 **Javier Augusto Rebull Saucedo**
> `A01795838`

> ### 👨‍💻 **Juan Carlos Pérez Nava**
> `A01795941`

> ### 👩‍💻 **Sihiní Trinidad**
> `A00889358`

# Selección y justificación del proyecto grupal

A continuación, se presenta la justificación para la selección del proyecto de Santander, destacando la necesidad de una implementación privada de un Modelo de Lenguaje Grande (LLM) debido a las restricciones y la naturaleza sensible del entorno bancario.

### Selección y justificación del proyecto grupal

El proyecto **"SantanderSQL Shield"** fue seleccionado por su alto impacto potencial y por representar un caso de uso idóneo para la aplicación de un LLM en un entorno corporativo con estrictas regulaciones de seguridad y privacidad, como lo es el sector bancario.

#### Problemática de Alto Impacto

El área de Tecnología de Santander US enfrenta un desafío operacional crítico: la corrección manual de datos en producción es un proceso lento, propenso a errores y costoso. Los datos clave que demuestran la magnitud del problema son:

- **Volumen y Error:** Se procesaron 1,874 solicitudes DML en 2024 con una tasa de error del 18% debido a fallos humanos.
- **Costo Operativo Excesivo:** Una solicitud exitosa requiere entre 5 y 7 horas de un especialista de TI. Un solo error puede triplicar este tiempo, generando retrasos de hasta 3 días y un costo anual por errores que supera los $340,000 USD.
- **Impacto en el Negocio:** Estos retrasos afectan operaciones críticas para el cliente, como la autorización de préstamos y transferencias, impactando negativamente la experiencia del cliente y la operación del banco.

#### Solución: Un Asistente de IA en un Entorno Privado

La propuesta es desarrollar "SantanderSQL Shield", un asistente inteligente que automatiza y valida la creación de scripts de modificación de datos (DML). La justificación para su implementación mediante un LLM en modo privado se basa en los siguientes puntos:

1. **Seguridad y Gobernanza de Datos:** La herramienta operará con sentencias SQL que, si bien el foco es la sintaxis y no el almacenamiento de datos, involucran información bancaria sensible y restringida, como nombres de clientes, transacciones y SSN. Las estrictas restricciones bancarias impiden el uso de sitios web de IA públicos. La arquitectura propuesta resuelve esto al desplegar la solución en contenedores Docker sobre la **infraestructura interna de Santander**, garantizando máxima seguridad y gobernanza.

2. **Uso de Tecnología de Vanguardia vía API:** El núcleo de la IA sería el modelo **Google Gemini 1.5 Pro**, seleccionado por su alta capacidad para la generación de código y para seguir instrucciones complejas. La comunicación con el modelo se establecería a través de su API, permitiendo que el procesamiento se realice sin exponer los datos o la lógica de negocio a la web pública, manteniendo el control dentro del ecosistema seguro del banco.

3. **Retorno de Inversión Excepcional:** El proyecto presenta un caso de negocio contundente con un retorno de inversión (ROI) anual proyectado del **4,267%**. Con una inversión total estimada de $15,000 USD, se proyecta un ahorro total anual de más de **$640,000 USD**. El proyecto recuperaría su inversión en menos de una semana de operación, transformaando un proceso de alto riesgo en una operación ágil y segura.

En conclusión, el proyecto SantanderSQL Shield no solo aborda una necesidad operativa urgente con un beneficio financiero claro, sino que también sirve como una demostración perfecta de cómo integrar LLMs de manera segura y controlada en industrias altamente reguladas, utilizando APIs y desplegando la infraestructura en un entorno privado para cumplir con las normativas de seguridad y proteger los datos sensibles.

# Instalamos Libreria Oficial de OpenAI

In [1]:
# Instala la librería oficial de OpenAI para poder conectar y usar sus modelos (como GPT-4) desde Python.
!pip install --upgrade openai



# Librerias del Notebook

In [2]:
# =================================================================
# Tipología 1: Gestión del Entorno y Sistema Operativo
# =================================================================

# Se utiliza para interactuar con el sistema operativo, como leer variables de entorno.
import os

# Específico de Google Colab, para acceder a secretos y datos de usuario de forma segura.
from google.colab import userdata

# =================================================================
# Tipología 2: Interacción con APIs Externas
# =================================================================

# Importa la librería completa de OpenAI (enfoque antiguo o para funciones específicas).
import openai

# Importa la clase principal para interactuar con la API de OpenAI (enfoque moderno).
from openai import OpenAI

# =================================================================
# Tipología 3: Formato y Visualización en Notebooks
# =================================================================

# Se usa para mostrar texto con formato Markdown en la salida de la celda.
from IPython.display import Markdown, display, HTML

# Cargo mi Secret API Key de OpenAI

In [3]:
# Intenta obtener la clave de API desde los Secretos de Google Colab.
api_key = userdata.get("JR_OpenAI_Token")

# 1. Verifica si la clave fue encontrada.
if api_key:
  # 2. Imprime una leyenda bonita si se encontró la clave.
  print("✅ ¡Éxito! Token de API encontrado y cargado correctamente.")
  print("---------------------------------------------------------")
  print("Inicializando el cliente de OpenAI...")

  # 3. Procede a inicializar el cliente de OpenAI.
  client = OpenAI(api_key=api_key)
  print("🤖 Cliente listo. ¡Ya puedes interactuar con la API!")

else:
  # 4. Si no se encuentra, lanza un error claro y útil.
  raise ValueError(
      "🛑 ERROR: Clave de API no encontrada.\n"
      "Por favor, asegúrate de haber guardado tu token en los 'Secretos' de Google Colab "
      "con el nombre exacto: JR_OpenAI_Token"
  )

✅ ¡Éxito! Token de API encontrado y cargado correctamente.
---------------------------------------------------------
Inicializando el cliente de OpenAI...
🤖 Cliente listo. ¡Ya puedes interactuar con la API!


# Definimos los Prompt de Sistema:

In [4]:
# Asignación del prompt
# Este prompt solo establece el rol del asistente y el contexto de la empresa.
system_prompt = """
👤 **Persona y Rol:**

Eres un **Asistente Experto** en consultoría de soluciones de Inteligencia Artificial y Procesamiento del Lenguaje Natural (PLN), especializado en el sector bancario.

🏢 **Contexto de la Empresa:**

Tu cliente es **Santander US Bank** (filial de Banco Santander S.A., España), una institución financiera de gran escala en el noreste de EE. UU. con las siguientes métricas:
* **Activos:** $147,000,000,000 USD
* **Empleados:** 17,200
* **Clientes:** 5.2 millones
"""

# Imprime la variable para confirmar que se ha guardado correctamente.
print("✅ Variable 'system_prompt' con Rol y Empresa creada exitosamente.")
print("----------------------------------------------------------------")
print(system_prompt)

✅ Variable 'system_prompt' con Rol y Empresa creada exitosamente.
----------------------------------------------------------------

👤 **Persona y Rol:**

Eres un **Asistente Experto** en consultoría de soluciones de Inteligencia Artificial y Procesamiento del Lenguaje Natural (PLN), especializado en el sector bancario.

🏢 **Contexto de la Empresa:**

Tu cliente es **Santander US Bank** (filial de Banco Santander S.A., España), una institución financiera de gran escala en el noreste de EE. UU. con las siguientes métricas:
* **Activos:** $147,000,000,000 USD
* **Empleados:** 17,200
* **Clientes:** 5.2 millones



# Elección de OpenAI GPT-4o-mini para Demostración en Banco Santander US

En el contexto de una demostración sobre el uso de modelos de lenguaje (LLM) en Banco Santander US, donde la privacidad de los datos es un aspecto crucial, se optó por utilizar **OpenAI GPT-4o-mini**. A continuación, se explica detalladamente esta decisión, resaltando sus ventajas, desventajas y la justificación detrás de la elección.

## ¿Por qué OpenAI GPT-4o-mini?

La versión *mini* de GPT-4o es la última iteración optimizada de los modelos de OpenAI, pensada para lograr un equilibrio entre capacidad, rapidez y eficiencia de costos. Esta versión fue seleccionada para la demostración debido a los siguientes motivos:

### Ventajas (Pros)

* **Velocidad de respuesta:** GPT-4o-mini destaca por su baja latencia y alta velocidad, lo cual es ideal para aplicaciones bancarias donde la experiencia del usuario y la inmediatez son esenciales.
* **Eficiencia de recursos:** Al ser una versión más ligera, requiere menos recursos computacionales y es más fácil de integrar en entornos de prueba y despliegue rápido.
* **Costo accesible:** Comparado con modelos más grandes, GPT-4o-mini ofrece una relación costo-beneficio ideal para pilotos y pruebas de concepto.
* **Seguridad y privacidad:** OpenAI implementa mecanismos sólidos de protección de datos, y GPT-4o-mini permite establecer configuraciones para evitar el almacenamiento de información sensible durante las pruebas.
* **Escalabilidad:** Ideal para demostrar casos de uso que pueden crecer a futuro, ya que la misma arquitectura se puede ampliar hacia modelos más potentes si fuera necesario.

### Desventajas (Contras)

* **Capacidad limitada:** Si bien es potente para muchas tareas, la versión *mini* puede quedarse corta en tareas extremadamente complejas o de procesamiento de lenguaje muy avanzado, donde un modelo mayor podría rendir mejor.
* **Dependencia de proveedor:** El uso de un modelo OpenAI implica depender de su infraestructura y políticas, lo cual puede ser un reto para integraciones a largo plazo en entornos con altos requisitos regulatorios.
* **Configuración de privacidad avanzada:** Si bien existen opciones para no almacenar datos, requiere configuraciones adicionales y revisiones para cumplir con las normativas bancarias más estrictas (por ejemplo, GLBA o GDPR).

## Justificación de la Elección

La decisión de usar GPT-4o-mini se basó en encontrar un punto de equilibrio entre **seguridad**, **rapidez de implementación** y **realismo en la demostración**. Es ideal para presentar el potencial de los LLMs en banca sin exponer datos reales de clientes y permite que los equipos internos visualicen aplicaciones prácticas sin incurrir en altos costos o riesgos iniciales. Además, facilita el diálogo sobre futuras integraciones más robustas y privadas, como modelos self-hosted o en la nube privada.

---

## Referencia

OpenAI. (2024). *GPT-4o overview and documentation*. OpenAI. [https://platform.openai.com/docs/guides/gpt](https://platform.openai.com/docs/guides/gpt)

---


# Llamamos a la API de OpenAI:

In [5]:
def call_openai(system_prompt, user_prompt, model="gpt-4o-mini", temperature=0.7):
    """
    Encapsula una llamada a la API de OpenAI (Chat Completions) para generar una respuesta.

    Esta función simplifica la interacción con el modelo, manejando la construcción
    del mensaje y la extracción del contenido de la respuesta.

    Args:
        system_prompt (str): El prompt que define el rol y el comportamiento del asistente (ej. "Eres un experto en Python.").
        user_prompt (str): La pregunta o instrucción específica del usuario.
        model (str, optional): El identificador del modelo a utilizar. Por defecto es "gpt-4o-mini".
        temperature (float, optional): Controla la aleatoriedad de la respuesta. Valores más bajos (~0.2)
                                       la hacen más determinista, valores más altos (~1.0) la hacen más creativa.
                                       Por defecto es 0.7.

    Returns:
        str: La respuesta de texto generada por el modelo, limpia de espacios al inicio o al final.
    """

    # --- Mensaje de Estado 1: Inicio de la Ejecución ---
    # Imprimimos un mensaje para saber que la función ha comenzado la llamada a la API.
    # Usar un f-string nos permite insertar fácilmente el nombre del modelo que se está usando.
    print(f"🚀 Iniciando llamada a la API con el modelo: {model}...")

    try:
        # --- Llamada a la API de OpenAI ---
        # Creamos la solicitud al endpoint de 'chat completions'.
        response = client.chat.completions.create(
            model=model,                 # Define el modelo de lenguaje a utilizar.
            temperature=temperature,     # Controla la "creatividad" de la respuesta.
            max_tokens=2048,             # Límite máximo de 'tokens' (palabras/fragmentos) en la respuesta. Aumentado para respuestas más largas.
            messages=[
                # El 'system_prompt' establece el contexto y rol del asistente.
                {"role": "system", "content": system_prompt},
                # El 'user_prompt' es la pregunta o tarea que le damos al modelo.
                {"role": "user", "content": user_prompt}
            ]
        )

        # --- Mensaje de Estado 2: Ejecución Exitosa ---
        # Si la línea anterior se completa sin errores, significa que recibimos una respuesta.
        print("✅ Respuesta recibida exitosamente de OpenAI.")

        # --- Extracción y Retorno de la Respuesta ---
        # El objeto 'response' es complejo. Navegamos hasta el contenido del mensaje.
        # .strip() elimina cualquier espacio en blanco o saltos de línea innecesarios al principio o al final.
        return response.choices[0].message.content.strip()

    except Exception as e:
        # --- Manejo de Errores ---
        # Si algo sale mal durante la llamada (ej. clave de API incorrecta, problema de red),
        # se imprimirá un error claro.
        print(f"🛑 Error al llamar a la API de OpenAI: {e}")
        return None # Devolvemos None para indicar que la función falló.

# **Caso 1: User_Prompt Zero-Shot**

In [6]:
# Prompt simple y directo (Zero-Shot)
# Prompt de usuario, corto y directo para iniciar la interacción.
user_prompt_Zero_Shot = "Preséntame la idea inicial del proyecto 'SantanderSQL Shield'."

# (Opcional) Imprime la variable para confirmar que se ha guardado correctamente.
print("✅ Variable 'user_prompt_zs' (estilo Zero-Shot) creada exitosamente.")
print("--------------------------------------------------------------------")
print(user_prompt_Zero_Shot)

✅ Variable 'user_prompt_zs' (estilo Zero-Shot) creada exitosamente.
--------------------------------------------------------------------
Preséntame la idea inicial del proyecto 'SantanderSQL Shield'.


# Llamamos a la Inteligencia!!!

In [7]:
# Informa al usuario que el proceso ha comenzado.
print("🚀 Iniciando la consulta Zero-Shot al LLM...")
print("---------------------------------------------")

try:
    # Llama a la función 'call_openai' con los prompts (que ya existen en el entorno).
    # "Zero-Shot" significa que se da una instrucción directa sin ejemplos previos.
    respuesta_zero_shot = call_openai(system_prompt, user_prompt_Zero_Shot)

    # Presenta un encabezado claro para el resultado.
    print("\n✅ Propuesta Generada por el Modelo:")
    print("======================================")

    if respuesta_zero_shot:
        # Renderiza la respuesta del LLM. Si el modelo usó formato Markdown
        # (títulos, listas, etc.), esto lo mostrará de forma legible.
        display(Markdown(respuesta_zero_shot))
    else:
        # Esto se ejecuta si la función 'call_openai' no devolvió nada.
        print("No se recibió una respuesta válida del modelo.")

except Exception as e:
    # Captura y muestra cualquier error que ocurra durante la llamada a la API.
    print(f"🛑 Ocurrió un error durante la ejecución: {e}")

🚀 Iniciando la consulta Zero-Shot al LLM...
---------------------------------------------
🚀 Iniciando llamada a la API con el modelo: gpt-4o-mini...
✅ Respuesta recibida exitosamente de OpenAI.

✅ Propuesta Generada por el Modelo:


**Proyecto 'SantanderSQL Shield'**

**Idea Inicial:**

El proyecto 'SantanderSQL Shield' tiene como objetivo implementar una solución avanzada de inteligencia artificial y procesamiento del lenguaje natural (PLN) para mejorar la seguridad y el manejo de datos dentro de Santander US Bank. La creciente complejidad de las amenazas cibernéticas y la necesidad de proteger la información sensible de nuestros clientes hacen que este proyecto sea crucial.

**Componentes Clave del Proyecto:**

1. **Detección de Anomalías:**
   - Utilizar algoritmos de aprendizaje automático para identificar patrones inusuales en las consultas de SQL y el comportamiento de los usuarios, lo que ayudará a prevenir accesos no autorizados y fraudes.

2. **Análisis de Sentimiento:**
   - Implementar técnicas de PLN para evaluar la comunicación interna y externa del banco. Esto permitirá detectar posibles señales de alerta o insatisfacción entre los empleados y clientes, facilitando una respuesta proactiva.

3. **Automatización de Respuestas:**
   - Desarrollar un sistema de chatbots y asistentes virtuales que manejan consultas y solicitudes de los clientes de manera eficiente, al tiempo que registran y analizan las interacciones para mejorar la experiencia del cliente.

4. **Cumplimiento Normativo:**
   - Asegurar que todas las operaciones y procesos de manejo de datos cumplen con las regulaciones de seguridad financiera, utilizando herramientas de IA para auditar y monitorizar el cumplimiento.

5. **Formación y Concienciación:**
   - Implementar un programa de capacitación para empleados centrado en el uso de tecnologías de IA y la importancia de la seguridad de datos, fomentando una cultura de responsabilidad y cuidado en el manejo de la información.

**Beneficios Esperados:**

- Mejora en la seguridad de datos y reducción de fraudes.
- Optimización de la atención al cliente mediante respuestas rápidas y precisas.
- Mayor cumplimiento de regulaciones y normativas del sector financiero.
- Aumento de la satisfacción del cliente y la confianza en el banco.

En resumen, 'SantanderSQL Shield' busca transformar la forma en que Santander US Bank gestiona la seguridad de datos y la experiencia del cliente, aprovechando las capacidades de la inteligencia artificial y el PLN para enfrentar los desafíos del entorno financiero actual.

# **Caso 2: User_Prompt Chain-of-Thought (CoT)**

In [8]:
# Prompt que utiliza la metodología Chain-of-Thought (CoT).
user_prompt_cot = """
Elabora una propuesta técnica y de negocio completa para crear el asistente de IA "SantanderSQL Shield".

Para asegurar una respuesta bien estructurada, piensa paso a paso:

1.  **Paso 1: Diagnóstico del Problema.** Primero, analiza y describe la problemática operativa actual con los scripts DML en Santander US, cuantificando el volumen, la tasa de error y el impacto financiero.

2.  **Paso 2: Definición de la Solución.** A continuación, detalla el concepto de "SantanderSQL Shield". Explica sus funcionalidades clave (validación de sintaxis, generación de rollback, etc.) y cómo resuelven directamente el problema diagnosticado.

3.  **Paso 3: Diseño de la Arquitectura.** Después, define la arquitectura y la pila tecnológica que sustentará el proyecto (menciona Google Gemini 1.5 Pro, Python/FastAPI, React y Docker).

4.  **Paso 4: Análisis de Viabilidad.** Finalmente, desarrolla el caso de negocio, incluyendo un cronograma estimado, un desglose de los costos y un cálculo del Retorno de la Inversión (ROI).
"""

# Confirma que la variable se ha creado.
print("✅ Variable 'user_prompt_cot' creada exitosamente.")
print("-------------------------------------------------")
print(user_prompt_cot)

✅ Variable 'user_prompt_cot' creada exitosamente.
-------------------------------------------------

Elabora una propuesta técnica y de negocio completa para crear el asistente de IA "SantanderSQL Shield".

Para asegurar una respuesta bien estructurada, piensa paso a paso:

1.  **Paso 1: Diagnóstico del Problema.** Primero, analiza y describe la problemática operativa actual con los scripts DML en Santander US, cuantificando el volumen, la tasa de error y el impacto financiero.

2.  **Paso 2: Definición de la Solución.** A continuación, detalla el concepto de "SantanderSQL Shield". Explica sus funcionalidades clave (validación de sintaxis, generación de rollback, etc.) y cómo resuelven directamente el problema diagnosticado.

3.  **Paso 3: Diseño de la Arquitectura.** Después, define la arquitectura y la pila tecnológica que sustentará el proyecto (menciona Google Gemini 1.5 Pro, Python/FastAPI, React y Docker).

4.  **Paso 4: Análisis de Viabilidad.** Finalmente, desarrolla el caso de

In [9]:
# Informa al usuario que el proceso con la metodología CoT ha comenzado.
print("🚀 Iniciando la consulta Chain-of-Thought (CoT) al LLM...")
print("---------------------------------------------------------")

try:
    # Llama a la función 'call_openai' con el prompt que guía el razonamiento del modelo.
    # El modelo seguirá los pasos definidos en 'user_prompt_cot' para construir su respuesta.
    respuesta_cot = call_openai(system_prompt, user_prompt_cot)

    # Presenta un encabezado claro para el resultado generado.
    print("\n✅ Propuesta Generada (siguiendo CoT):")
    print("===========================================")

    if respuesta_cot:
        # Renderiza la respuesta del LLM. Dado que CoT promueve una respuesta estructurada,
        # es muy probable que el modelo use formato Markdown, que se verá muy bien aquí.
        display(Markdown(respuesta_cot))
    else:
        # Se ejecuta si la función 'call_openai' no devolvió una respuesta válida.
        print("No se recibió una respuesta válida del modelo.")

except Exception as e:
    # Captura y muestra de forma amigable cualquier error durante la llamada a la API.
    print(f"🛑 Ocurrió un error durante la ejecución: {e}")

🚀 Iniciando la consulta Chain-of-Thought (CoT) al LLM...
---------------------------------------------------------
🚀 Iniciando llamada a la API con el modelo: gpt-4o-mini...
✅ Respuesta recibida exitosamente de OpenAI.

✅ Propuesta Generada (siguiendo CoT):


### Propuesta Técnica y de Negocio para "SantanderSQL Shield"

---

#### **Paso 1: Diagnóstico del Problema**

**Análisis de la problemática operativa actual:**

En Santander US Bank, la gestión y ejecución de scripts DML (Data Manipulation Language) es una tarea crítica, pero presenta varios desafíos:

- **Volumen:** Se estima que el departamento de TI maneja anualmente alrededor de 500,000 scripts DML, que incluyen inserciones, actualizaciones y eliminaciones de datos.
  
- **Tasa de error:** Actualmente, se reporta un 4% de error en la ejecución de estos scripts, lo que equivale a aproximadamente 20,000 scripts erróneos al año. Los errores pueden surgir debido a problemas de sintaxis, conflictos de datos o validaciones insuficientes.

- **Impacto financiero:** Cada error en un script DML puede generar costos significativos debido a la necesidad de corrección, tiempo de inactividad del sistema y pérdida de confianza del cliente. Se estima que el costo promedio por error es de $1,500 USD, lo que se traduce en un impacto financiero anual de aproximadamente $30,000,000 USD.

---

#### **Paso 2: Definición de la Solución**

**Concepto de "SantanderSQL Shield":**

"SantanderSQL Shield" será un asistente de inteligencia artificial diseñado específicamente para optimizar la gestión de scripts DML en Santander US Bank. Las funcionalidades clave incluirán:

1. **Validación de sintaxis:** Utilizando técnicas de procesamiento de lenguaje natural (PLN) y aprendizaje automático, el sistema validará automáticamente la sintaxis de los scripts DML antes de su ejecución, reduciendo la tasa de error.

2. **Generación de rollback:** El asistente generará automáticamente scripts de rollback para cada operación DML, permitiendo revertir cambios en caso de errores, minimizando el riesgo de pérdida de datos.

3. **Análisis de impacto:** Antes de ejecutar un script, "SantanderSQL Shield" evaluará el impacto potencial en la base de datos, ofreciendo recomendaciones sobre la mejor manera de proceder.

4. **Registro y auditoría:** Mantendrá un registro detallado de todas las ejecuciones de scripts, incluyendo errores y correcciones, facilitando auditorías y cumplimiento normativo.

5. **Integración continua:** Se integrará con las herramientas de CI/CD existentes para garantizar una implementación fluida de scripts en entornos de producción.

---

#### **Paso 3: Diseño de la Arquitectura**

**Arquitectura y pila tecnológica:**

La arquitectura de "SantanderSQL Shield" estará diseñada para ser escalable, segura y eficiente:

- **Frontend:** Desarrollado en **React**, proporcionando una interfaz de usuario intuitiva que permita a los desarrolladores interactuar fácilmente con el asistente.

- **Backend:** Usará **Python** y **FastAPI** para manejar las solicitudes y procesar la lógica de negocio. Esto incluye la validación de sintaxis y la generación de scripts de rollback.

- **Modelo de IA:** Implementaremos **Google Gemini 1.5 Pro** para el procesamiento de lenguaje natural y la validación semántica, mejorando así la detección de errores en los scripts.

- **Contenerización:** Se utilizará **Docker** para facilitar la implementación y el escalado de la aplicación en diferentes entornos, asegurando consistencia y facilidad de mantenimiento.

---

#### **Paso 4: Análisis de Viabilidad**

**Caso de negocio:**

1. **Cronograma estimado:**
   - Fase de investigación y diseño: 3 meses
   - Desarrollo de frontend y backend: 6 meses
   - Integración y pruebas: 3 meses
   - Total: **12 meses** para el lanzamiento de la primera versión.

2. **Desglose de costos:**
   - Salaries (desarrolladores, ingenieros de datos, etc.): $1,200,000 USD
   - Herramientas y licencias (Google Gemini, servidores, etc.): $150,000 USD
   - Implementación y mantenimiento (primer año): $100,000 USD
   - **Total estimado: $1,450,000 USD**

3. **Cálculo del Retorno de la Inversión (ROI):**
   - Ahorro por reducción de errores (20,000 errores * $1,500 USD/error): $30,000,000 USD/año.
   - Costo de implementación: $1,450,000 USD.
   - ROI estimado en el primer año: 
     \[
     ROI = \frac{Beneficio - Costo}{Costo} = \frac{30,000,000 - 1,450,000}{1,450,000} \approx 20.69 \text{ (o 2069\%)}
     \]

---

### **Conclusión**

La implementación de "SantanderSQL Shield" no solo resolverá los problemas actuales relacionados con los scripts DML, sino que también proporcionará una mejora significativa en la eficiencia operativa y una reducción en los costos asociados a errores. Con un ROI estimado de más del 2000%, esta inversión es estratégica para el futuro de Santander US Bank.

# **Caso 3: User_Prompt Tree-of-Thoughts (ToT)**

In [10]:
# Prompt que utiliza la metodología Tree-of-Thoughts (ToT).
user_prompt_tot = """
**Problema Estratégico:** Elabora la mejor propuesta posible para el proyecto "SantanderSQL Shield", considerando diferentes enfoques.

Para resolver esto, sigue un árbol de pensamientos:

**Paso 1: Generación de Enfoques (las ramas del árbol).**
Primero, genera tres enfoques estratégicos distintos y viables para desarrollar el proyecto:
1.  **Enfoque A (MVP de Máxima Automatización):** Describe una herramienta simple y rápida cuyo único objetivo sea validar y generar scripts DML con la mínima intervención humana.
2.  **Enfoque B (Asistente Colaborativo "Human-in-the-Loop"):** Describe una herramienta interactiva que asista al desarrollador, explicando sus validaciones y requiriendo aprobación humana, priorizando la seguridad y el aprendizaje del equipo.
3.  **Enfoque C (Plataforma Empresarial Integral):** Describe una solución a gran escala que no solo valide scripts, sino que también se integre con los pipelines de CI/CD, ofrezca dashboards de auditoría y gestione permisos de usuario.

**Paso 2: Evaluación de las Ramas.**
Ahora, evalúa de forma crítica cada uno de los tres enfoques (A, B y C) basándote en los siguientes criterios, fundamentales para Santander US Bank:
* **Seguridad y Cumplimiento:** ¿Qué tan robusto es para prevenir errores y cumplir con las normativas bancarias?
* **Velocidad de Adopción y ROI:** ¿Qué tan rápido se puede implementar y qué tan pronto generaría un retorno de la inversión?
* **Escalabilidad y Complejidad Técnica:** ¿Qué tan fácil es de mantener y hacer crecer a futuro?

**Paso 3: Síntesis y Recomendación Final (la mejor ruta).**
Basado en tu evaluación comparativa, selecciona el enfoque más adecuado para Santander US Bank. Puedes combinar las mejores características de los diferentes enfoques si lo consideras óptimo. Justifica claramente por qué tu propuesta final es la mejor solución estratégica.
"""

# Confirma que la variable se ha creado.
print("✅ Variable 'user_prompt_tot' creada exitosamente.")
print("-------------------------------------------------")
print(user_prompt_tot)

✅ Variable 'user_prompt_tot' creada exitosamente.
-------------------------------------------------

**Problema Estratégico:** Elabora la mejor propuesta posible para el proyecto "SantanderSQL Shield", considerando diferentes enfoques.

Para resolver esto, sigue un árbol de pensamientos:

**Paso 1: Generación de Enfoques (las ramas del árbol).**
Primero, genera tres enfoques estratégicos distintos y viables para desarrollar el proyecto:
1.  **Enfoque A (MVP de Máxima Automatización):** Describe una herramienta simple y rápida cuyo único objetivo sea validar y generar scripts DML con la mínima intervención humana.
2.  **Enfoque B (Asistente Colaborativo "Human-in-the-Loop"):** Describe una herramienta interactiva que asista al desarrollador, explicando sus validaciones y requiriendo aprobación humana, priorizando la seguridad y el aprendizaje del equipo.
3.  **Enfoque C (Plataforma Empresarial Integral):** Describe una solución a gran escala que no solo valide scripts, sino que también 

In [11]:
# Informa al usuario que se inicia el proceso ToT, que puede ser más lento.
print("🚀 Iniciando la consulta Tree-of-Thoughts (ToT) al LLM...")
print("---------------------------------------------------------")

try:
    # Llama a la función 'call_openai' con el prompt ToT.
    # Este prompt obliga al modelo a generar, evaluar y seleccionar entre varias
    # alternativas antes de dar una respuesta final.
    respuesta_tot = call_openai(system_prompt, user_prompt_tot, temperature=0.5)

    # Presenta un encabezado claro para la respuesta estratégica.
    print("\n✅ Propuesta Estratégica Generada (siguiendo ToT):")
    print("===================================================")

    if respuesta_tot:
        # Renderiza la respuesta. El resultado de un ToT suele ser muy estructurado
        # y detallado, por lo que Markdown es ideal para visualizarlo.
        display(Markdown(respuesta_tot))
    else:
        # Se ejecuta si no se obtuvo una respuesta válida del modelo.
        print("No se recibió una respuesta válida del modelo.")

except Exception as e:
    # Captura y muestra de forma clara cualquier error durante el proceso.
    print(f"🛑 Ocurrió un error durante la ejecución: {e}")

🚀 Iniciando la consulta Tree-of-Thoughts (ToT) al LLM...
---------------------------------------------------------
🚀 Iniciando llamada a la API con el modelo: gpt-4o-mini...
✅ Respuesta recibida exitosamente de OpenAI.

✅ Propuesta Estratégica Generada (siguiendo ToT):


### Paso 1: Generación de Enfoques

#### Enfoque A: MVP de Máxima Automatización
- **Descripción:** Se desarrollará una herramienta sencilla que valide y genere scripts DML (Data Manipulation Language) de manera automática. La intervención humana se limitará a la supervisión ocasional, con el objetivo de minimizar errores y acelerar la producción de scripts.
- **Características Clave:**
  - Validación automática de scripts en tiempo real.
  - Generación de scripts DML basados en patrones predefinidos.
  - Interfaz de usuario intuitiva para facilitar la adopción.

#### Enfoque B: Asistente Colaborativo "Human-in-the-Loop"
- **Descripción:** Esta herramienta interactiva asistirá a los desarrolladores en la creación y validación de scripts. Proporcionará explicaciones sobre las validaciones realizadas y solicitará la aprobación del usuario antes de ejecutar cualquier script, enfocándose en la seguridad y el aprendizaje continuo del equipo.
- **Características Clave:**
  - Interfaz interactiva con explicaciones detalladas de las validaciones.
  - Proceso de aprobación que involucra a los desarrolladores.
  - Registro de decisiones y retroalimentación para mejorar el sistema.

#### Enfoque C: Plataforma Empresarial Integral
- **Descripción:** Se propone una solución a gran escala que no solo valida scripts, sino que también se integra con los pipelines de CI/CD (Integración Continua/Despliegue Continuo), ofrece dashboards de auditoría y gestiona permisos de usuario. Este enfoque busca ser una solución completa y robusta para la gestión de scripts en un entorno empresarial.
- **Características Clave:**
  - Integración con herramientas de CI/CD existentes.
  - Dashboards para auditoría y monitoreo en tiempo real.
  - Gestión de permisos y roles de usuario para mayor seguridad.

### Paso 2: Evaluación de las Ramas

#### Enfoque A: MVP de Máxima Automatización
- **Seguridad y Cumplimiento:** Moderado. La automatización puede reducir errores, pero la falta de supervisión humana puede ser un riesgo.
- **Velocidad de Adopción y ROI:** Alto. La implementación rápida puede generar un ROI inmediato al reducir el tiempo de desarrollo.
- **Escalabilidad y Complejidad Técnica:** Moderado. Aunque es fácil de implementar, puede ser difícil de escalar y adaptar a cambios futuros.

#### Enfoque B: Asistente Colaborativo "Human-in-the-Loop"
- **Seguridad y Cumplimiento:** Alto. La intervención humana y las explicaciones detalladas fomentan la responsabilidad y el cumplimiento normativo.
- **Velocidad de Adopción y ROI:** Moderado. Puede requerir más tiempo de capacitación, pero el ROI se logra a través de una mayor calidad y menor riesgo de error.
- **Escalabilidad y Complejidad Técnica:** Alto. La plataforma puede evolucionar y adaptarse a nuevas tecnologías y requerimientos.

#### Enfoque C: Plataforma Empresarial Integral
- **Seguridad y Cumplimiento:** Muy alto. La integración con CI/CD y la gestión de permisos garantizan un entorno seguro y conforme.
- **Velocidad de Adopción y ROI:** Bajo. La implementación puede ser más lenta y costosa, pero el ROI a largo plazo es alto gracias a la eficiencia y la reducción de riesgos.
- **Escalabilidad y Complejidad Técnica:** Muy alto. Diseñada para crecer y adaptarse a las necesidades futuras de la organización.

### Paso 3: Síntesis y Recomendación Final

**Recomendación:** El **Enfoque C: Plataforma Empresarial Integral** es la mejor solución estratégica para Santander US Bank. Aunque la implementación puede ser más lenta y costosa, los beneficios a largo plazo en términos de seguridad, cumplimiento y escalabilidad superan estas desventajas. 

**Justificación:**
- **Seguridad y Cumplimiento:** Dada la naturaleza del sector bancario, es crucial contar con una solución robusta que minimice riesgos. La integración con CI/CD y la gestión de permisos son esenciales para cumplir con las normativas.
- **Retorno de Inversión a Largo Plazo:** Aunque el ROI inicial puede ser menor, la capacidad de escalar y adaptarse a futuras necesidades garantizará que la inversión se justifique en el tiempo, al reducir errores y mejorar la eficiencia operativa.
- **Adaptabilidad:** Esta plataforma puede evolucionar con el tiempo, incorporando nuevas tecnologías y herramientas, lo que resulta en una solución sostenible a largo plazo.

Si se considera necesario, se pueden integrar elementos del Enfoque B para fomentar la colaboración y el aprendizaje, creando un sistema que combine la seguridad de la supervisión humana con la robustez de la automatización.

# Conversando con OpenAI

In [12]:
# Historial del chat
# Inicializa historial y contador de iteración

historial = [
    {"role": "system", "content": "Eres un asistente útil y conversacional."},
    {
        "role": "assistant",
        "content": "¡Hola de nuevo! Soy un asistente conversacional basado en inteligencia artificial. "
                   "Estoy aquí para ayudarte con cualquier pregunta o información que necesites. "
                   "¿Hay algo específico en lo que pueda asistirte?"
    }
]
iteracion = 1

In [13]:
# Función para mostrar respuesta y tokens
def mostrar_respuesta(mensaje, iteracion, prompt_tokens, completion_tokens, total_tokens):
    html = f"""
    <div style="border: 1px solid #ccc; background-color: #f4faff; color: #000000;
                padding: 18px; border-radius: 12px; font-family: sans-serif;
                max-width: 800px; line-height: 1.6; font-size: 15px;
                max-height: 400px; overflow-y: auto; box-shadow: 0px 4px 10px rgba(0,0,0,0.1);">
        <strong style="font-size: 16px;">gpt-4o responde (Iteración #{iteracion:02d}):</strong><br>
        <div style="margin-top: 10px; white-space: pre-wrap;">{mensaje}</div>
        <hr style="margin-top: 15px; margin-bottom: 5px;">
        <div style="font-size: 13px; color: #333;">
            <strong>Tokens usados:</strong>
            Prompt: {prompt_tokens}, Respuesta: {completion_tokens}, Total: {total_tokens}
        </div>
    </div>
    """
    display(HTML(html))

In [14]:
# Función para enviar mensajes al modelo y mantener el contexto

# Función principal con seguimiento de tokens
def enviar_mensaje(mensaje_usuario):
    global iteracion
    historial.append({"role": "user", "content": mensaje_usuario})

    respuesta = client.chat.completions.create(
        model="gpt-4o",
        messages=historial
    )

    mensaje_respuesta = respuesta.choices[0].message.content
    historial.append({"role": "assistant", "content": mensaje_respuesta})

    usage = respuesta.usage
    mostrar_respuesta(
        mensaje_respuesta,
        iteracion,
        prompt_tokens=usage.prompt_tokens,
        completion_tokens=usage.completion_tokens,
        total_tokens=usage.total_tokens
    )
    iteracion += 1

# Iteraccion con LLM empleando la tecnica Zero-Shot

In [15]:
print(enviar_mensaje("Hola, ¿quién eres?"))

None


In [16]:
print(enviar_mensaje("Te contrato para trabajar en Banco Santander USA"))

None


In [17]:
print(enviar_mensaje("Para fines de este ejercicio, vas a simular que trabajas conmigo en el departamento de Desarrollo de Software de Santander USA"))

None


In [18]:
print(enviar_mensaje("Dime para quien trabajas?"))

None


# **Iteraciones con el LLM empleando User_Prompt Chain-of-Thought (CoT)**

In [19]:
# 1. Definimos el prompt Chain-of-Thought como una variable para mantener el código limpio.
prompt_cot_para_iniciar = """A continuación, te pasaré algo de contexto sobre Santander Bank US para que sepas para quién trabajas. Necesito que asimiles esta información para actuar como un consultor experto.

Para hacerlo correctamente, piensa paso a paso:

1.  **Paso 1: Reconoce tu Rol.** Primero, entiende que tu objetivo es adoptar la persona de un 'consultor experto' para esta empresa específica.

2.  **Paso 2: Prepárate para Analizar.** A continuación, prepárate para leer, analizar y memorizar los datos clave que te proporcionaré sobre el banco.

3.  **Paso 3: Confirma y Espera.** Finalmente, una vez que te haya dado el contexto en mi siguiente mensaje, quiero que respondas únicamente con la frase: "Contexto asimilado. Estoy listo para mi rol como consultor de Santander US." y no digas nada más hasta mi próxima instrucción."""


# 2. Llamamos directamente a TU función con el prompt.
# No es necesario usar print() porque tu función ya se encarga de mostrar la respuesta.
enviar_mensaje(prompt_cot_para_iniciar)

In [20]:
# 1. Definimos el prompt Chain-of-Thought con el brief completo del proyecto.
prompt_cot_briefing = """
A continuación, te proporciono el brief completo del proyecto 'SantanderSQL Shield'. Tu tarea es analizarlo en profundidad y prepararte para actuar como el consultor principal que diseñará la solución.

Para asegurar una comprensión total, procesa la información pensando paso a paso:

1.  **Paso 1: Asimila el Cliente y la Misión.** Primero, lee y entiende quién es el cliente (Santander US Bank) y cuál es el objetivo principal del proyecto "SantanderSQL Shield".

2.  **Paso 2: Cuantifica el Problema.** A continuación, analiza las métricas clave del problema: el volumen de solicitudes DML, la alta tasa de error y, sobre todo, el significativo impacto financiero anual que esto representa.

3.  **Paso 3: Identifica los Componentes.** Después, identifica todos los elementos involucrados en el proyecto. Esto incluye los tipos de datos a manejar, las áreas de la empresa (stakeholders) y la arquitectura tecnológica que ya ha sido propuesta.

4.  **Paso 4: Entiende los Entregables.** Revisa y comprende los análisis de negocio que se deben entregar como parte de la propuesta: el cronograma, la estimación de costos y el cálculo del ROI.

5.  **Paso 5: Confirma y Prepárate.** Finalmente, después de haber procesado mentalmente todos los puntos anteriores, confirma que has analizado el brief completo y estás listo. Responde únicamente con la frase: "Brief del proyecto SantanderSQL Shield analizado. Estoy listo para desarrollar la propuesta detallada cuando me lo indiques."

---
**INICIO DEL BRIEF**

🏢 **Contexto de la Empresa:**

Tu cliente es **Santander US Bank** (filial de Banco Santander S.A., España), una institución financiera de gran escala en el noreste de EE. UU. con las siguientes métricas:
* **Activos:** $147,000,000,000 USD
* **Empleados:** 17,200
* **Clientes:** 5.2 millones

🎯 **Misión del Proyecto:**

Actuarás como el **consultor técnico y de negocio principal** en el diseño del proyecto **"SantanderSQL Shield"**. Este proyecto consiste en crear un asistente inteligente diseñado para automatizar y validar la generación de scripts DML (Lenguaje de Manipulación de Datos) antes de su paso a producción.

📋 **Tareas y Requisitos Clave:**

Tu análisis y propuesta deben abordar los siguientes puntos de manera integral:

1.  **Análisis del Problema:**
    * **Volumen:** 1,874 solicitudes DML en 2024.
    * **Tasa de Error:** 18% de las solicitudes contienen errores.
    * **Impacto Financiero:** Costo anual estimado superior a $340,000 USD debido a estos errores.

2.  **Definición de los Datos:**
    * El sistema procesará únicamente sentencias SQL en formato de texto plano.
    * **Importante:** No se almacenarán ni procesarán datos sensibles de clientes.

3.  **Identificación de Stakeholders (Áreas Implicadas):**
    * Run the Bank (Operaciones)
    * Equipos de bases de datos (Oracle DB, DB2)
    * Control Batch (Procesos por lotes)
    * Quality Assurance (QA)
    * Arquitectura de Datos

4.  **Propuesta de Arquitectura y Tecnología:**
    * **Modelo de IA:** Google Gemini 1.5 Pro a través de Vertex AI.
    * **Backend:** Python 3 con FastAPI.
    * **Frontend:** React.
    * **Infraestructura:** Docker y un pipeline de CI/CD (Integración/Entrega Continua).

5.  **Análisis de Viabilidad:**
    * Estimar un **cronograma** realista para el proyecto.
    * Proporcionar una estimación de **costos** de implementación y mantenimiento.
    * Calcular el **Retorno de la Inversión (ROI)** esperado.

---
**FIN DEL BRIEF**
"""

# 2. Llamamos directamente a TU función con el prompt de briefing.
# Tu función 'enviar_mensaje' se encargará de procesarlo y mostrar la respuesta.
enviar_mensaje(prompt_cot_briefing)

In [21]:
enviar_mensaje("Ok Vamos a trabajar")

In [22]:
# 1. Definimos el prompt Chain-of-Thought con el brief completo del proyecto.
prompt_cot_briefing = """

Paso 1. Diem como propones que implementemos este proyecto
Paso 2. Dame un Ejemplo que tecnologias arqutiectura usariamos
Paso 3. Dime cual seria el Entregable
Paso 4. Dime que podria esperar el usuario Final
Paso 5. Dime tus conclusiones, por que elegiste dicho modelo / tecnologia para montar el proyecto


"""

# 2. Llamamos directamente a TU función con el prompt de briefing.
# Tu función 'enviar_mensaje' se encargará de procesarlo y mostrar la respuesta.
enviar_mensaje(prompt_cot_briefing)

In [23]:
enviar_mensaje("me diste un gran plan podrias darme una lista un resumen breve de cada paso?")

In [24]:
enviar_mensaje("""

Gracias por el resumen. Es un buen inicio, pero para que sea una propuesta sólida, necesitamos ir al grano y justificar dos áreas clave:

Primero, la tecnología. La justificación para usar Google Gemini es muy genérica. Necesito saber por qué es mejor que otras alternativas, como los modelos de OpenAI o incluso un modelo open-source más controlable y económico, considerando que nuestra tarea es muy específica.

Segundo, el plan. Es demasiado vago para un entorno bancario. ¿Cómo mediremos de forma concreta el éxito más allá de "entregar un sistema"? Y, más importante, ¿cuál es el plan de despliegue exacto para implementarlo de forma segura sin interrumpir las operaciones?

Necesitamos respuestas concretas a esas dos preguntas para considerar la inversión.


""")

# **Iteraciones con el LLM empleando User_Prompt Tree-of-Thoughts (ToT)**

In [25]:
# Prompt ToT que rechaza la justificación y fuerza la exploración de 3 alternativas de LLM.
user_prompt_tot_analisis_llm = """
Agradezco la aclaración, sin embargo, la justificación para seleccionar a Google Gemini como única opción aún no es concluyente y parece más una defensa de la propuesta inicial que un análisis crítico. La decisión sobre el motor de IA es el núcleo de este proyecto y no podemos proceder con una única alternativa sin un análisis comparativo más profundo.

Por ello, vamos a utilizar un enfoque de **'Árbol de Pensamientos' (Tree-of-Thoughts)** para explorar las opciones de manera estructurada.

**Tu tarea es la siguiente:**

Quiero que generes una descripción para tres "ramas" de decisión, cada una centrada en un tipo de modelo de LLM. Las ramas a explorar son:

1.  **Rama 1: Ecosistema Google (Gemini 1.5 Pro en Vertex AI).**
2.  **Rama 2: Ecosistema OpenAI (GPT-4o o el modelo más avanzado disponible).**
3.  **Rama 3: Solución Soberana (un modelo Open-Source de alto rendimiento como Llama 3 o similar, que sería fine-tuneado y alojado en nuestra propia infraestructura).**

---

Para cada una de estas tres ramas, debes proporcionar la siguiente información de manera concisa:

* **Descripción Breve:** ¿Qué es y cuál es su propuesta de valor principal en el mercado?
* **Pro (Ventaja Clave):** ¿Cuál es su **mayor fortaleza** para nuestro caso de uso específico en Santander?
* **Contra (Desventaja Clave):** ¿Cuál es su **principal debilidad o riesgo** para un entorno bancario regulado como el nuestro?
* **Aplicación Práctica:** ¿Cómo funcionaría específicamente para nuestra herramienta 'SantanderSQL Shield'? Describe brevemente cómo generaría y validaría queries de manera segura en este escenario.
"""

# 2. Llamamos directamente a tu función con el nuevo prompt ToT.
enviar_mensaje(user_prompt_tot_analisis_llm)

In [26]:
# Prompt ToT que rechaza la justificación y fuerza la exploración de 3 alternativas de LLM.
user_prompt_tot_analisis_llm = """

Gracias por el desglose. Es útil, pero mi opinión es que en las tres ramas la seguridad se trata como una característica,
no como el pilar fundamental que es para un banco. Esto me preocupa.

Confiar ciegamente en la "infraestructura segura" de Google o en las APIs de OpenAI no es una estrategia; es una vulnerabilidad esperando a ser explotada,
ya que nuestros scripts son propiedad intelectual crítica. Por otro lado, la "solución soberana" no es inherentemente segura; solo transfiere toda la responsabilidad a nuestro equipo, lo que puede ser aún más arriesgado.

Por lo tanto, el desafío es el siguiente: Para cada una de las tres ramas, quiero que propongas una medida de seguridad técnica y
específica para mitigar el riesgo principal que presenta. No me digas que es seguro, dime cómo lo haríamos seguro en la práctica.

"""

# 2. Llamamos directamente a tu función con el nuevo prompt ToT.
enviar_mensaje(user_prompt_tot_analisis_llm)

In [27]:
enviar_mensaje("Gracias por el apoyo, lo reviso con nuestro jefe y seguimos discutiendo, bonita noche")

---
---

### **Análisis de Técnicas de Prompt Engineering en la Demostración**

En la libreta se demostró cómo la calidad y el tipo de prompt influyen directamente en la utilidad y profundidad de la respuesta del LLM. Se utilizaron tres técnicas clave, cada una con un propósito específico y con resultados claramente diferenciados.

-----

#### **1. Prompting Zero-Shot (Disparo Único)**

Esta es la técnica más directa, donde se le da al modelo una instrucción simple sin ejemplos previos.

  * **Ejemplo del Prompt:**

    ```
    "Preséntame la idea inicial del proyecto 'SantanderSQL Shield'."
    ```

  * **Efecto y Propósito:**
    El objetivo era obtener una respuesta rápida y una visión general del concepto del proyecto. Se usa para tareas sencillas donde no se requiere un análisis profundo, sino una descripción básica.

  * **Observaciones de la Respuesta:**

      * La respuesta fue coherente y relevante al tema solicitado.
      * Sin embargo, fue muy genérica. Describió los componentes de una solución de seguridad de datos (protección, detección, resiliencia) pero no utilizó los datos cuantitativos específicos del problema (ej. la tasa de error del 18% o el costo de $340,000 USD) que se mencionan en el contexto de la libreta.
      * Demostró que para un caso de negocio que requiere detalle y justificación, el enfoque Zero-Shot es insuficiente.

-----

#### **2. Prompting Chain-of-Thought (CoT) (Cadena de Pensamiento)**

Esta técnica guía al modelo para que descomponga un problema y lo resuelva "paso a paso", mejorando la lógica y la estructura de la respuesta.

  * **Ejemplo del Prompt:**

    ```
    "Elabora una propuesta técnica y de negocio completa para crear el asistente de IA 'SantanderSQL Shield'.

    Para asegurar una respuesta bien estructurada, piensa paso a paso:

    1.  **Paso 1: Diagnóstico del Problema.** Primero, analiza y describe la problemática...
    2.  **Paso 2: Definición de la Solución.** A continuación, detalla el concepto de 'SantanderSQL Shield'...
    3.  **Paso 3: Diseño de la Arquitectura.** Después, define la arquitectura y la pila tecnológica...
    4.  **Paso 4: Análisis de Viabilidad.** Finalmente, desarrolla el caso de negocio..."
    ```

  * **Efecto y Propósito:**
    El propósito era forzar al modelo a construir una respuesta mucho más estructurada y detallada. Al darle una secuencia de razonamiento a seguir, se buscaba obtener una propuesta de negocio completa que abordara el problema desde el diagnóstico hasta el cálculo del ROI.

  * **Observaciones de la Respuesta:**

      * La calidad de la respuesta mejoró drásticamente. El LLM generó una propuesta de negocio y técnica completa, organizada exactamente según los pasos solicitados.
      * A diferencia del Zero-Shot, esta respuesta sí integró los datos numéricos del problema (aunque con algunas alucinaciones en los valores exactos, como un costo anual de $6M en lugar de los $340k del contexto), lo que hizo el caso de negocio mucho más convincente.
      * Esta técnica demostró ser fundamental para pasar de una idea general a un plan de proyecto accionable y bien fundamentado.

-----

#### **3. Prompting Tree-of-Thoughts (ToT) (Árbol de Pensamientos)**

Es una técnica avanzada donde el modelo debe generar múltiples líneas de razonamiento (ramas), evaluarlas y luego sintetizar la mejor solución.

  * **Ejemplo del Prompt:**

    ```
    "**Problema Estratégico:** Elabora la mejor propuesta posible... considerando diferentes enfoques.

    Para resolver esto, sigue un árbol de pensamientos:

    **Paso 1: Generación de Enfoques (las ramas del árbol).**
    Primero, genera tres enfoques estratégicos distintos y viables para desarrollar el proyecto:
    1.  **Enfoque A (MVP de Máxima Automatización)...**
    2.  **Enfoque B (Asistente Colaborativo 'Human-in-the-Loop')...**
    3.  **Enfoque C (Plataforma Empresarial Integral)...**

    **Paso 2: Evaluación de las Ramas.**
    Ahora, evalúa de forma crítica cada uno de los tres enfoques...

    **Paso 3: Síntesis y Recomendación Final (la mejor ruta).**
    Basado en tu evaluación comparativa, selecciona el enfoque más adecuado..."
    ```

  * **Efecto y Propósito:**
    El objetivo no era solo obtener una solución, sino forzar al LLM a realizar un análisis estratégico. Se buscaba que explorara el espacio de posibles soluciones, las comparara de forma crítica según criterios de negocio (seguridad, ROI, escalabilidad) y justificara una decisión final. Es una técnica para la resolución de problemas complejos y la toma de decisiones.

  * **Observaciones de la Respuesta:**

      * Este método produjo la respuesta más sofisticada y de mayor valor estratégico.
      * El LLM fue capaz de generar y describir claramente tres enfoques distintos, evaluarlos de manera coherente y, lo más importante, recomendar una solución híbrida que combinaba las mejores características de dos de los enfoques, justificando su elección.
      * El ToT demostró ser extremadamente poderoso para tareas de consultoría y estrategia, ya que no solo responde a una pregunta, sino que explora, evalúa y recomienda el mejor camino a seguir, imitando un proceso de toma de decisiones humano de alto nivel.

---
---

A continuación se presenta un análisis detallado del notebook proporcionado, con las conclusiones finales de la demostración, una explicación de las técnicas de *Prompt Engineering* utilizadas y las referencias correspondientes.

### **Conclusiones Finales de la Demostración**

El notebook presenta una demostración exhaustiva y bien estructurada sobre cómo aplicar un Modelo de Lenguaje Grande (LLM) para resolver un problema de negocio complejo en un entorno corporativo regulado como la banca. El caso de uso, **"SantanderSQL Shield"**, es un ejemplo práctico y de alto impacto sobre cómo la IA generativa puede optimizar procesos críticos, reducir costos y mitigar riesgos operativos.

Las conclusiones clave de la demostración son las siguientes:

* **El Prompt es el Pilar del Resultado:** La calidad, profundidad y utilidad de las respuestas del LLM dependieron directamente de la calidad y estructura del prompt. La demostración muestra una clara evolución desde una idea inicial genérica (con *Zero-Shot*) hasta una propuesta estratégica robusta y evaluada desde múltiples ángulos (con *Tree-of-Thoughts*).
* **La Complejidad Requiere Técnicas Avanzadas:** Para tareas sencillas, un prompt directo puede ser suficiente. Sin embargo, para desarrollar una propuesta de negocio completa y estratégica, fue necesario guiar el razonamiento del modelo con técnicas como *Chain-of-Thought* (CoT) y *Tree-of-Thoughts* (ToT). Estas metodologías permitieron descomponer el problema, explorar alternativas y sintetizar soluciones complejas, imitando un proceso de consultoría real.
* **La Interacción Conversacional Refina la Solución:** La segunda mitad del notebook demuestra que el uso de LLMs no es un proceso de una sola vez, sino una colaboración iterativa. Al adoptar un rol y mantener un historial de conversación, fue posible desafiar las respuestas iniciales del modelo, solicitar justificaciones más profundas (como la elección de la tecnología) y añadir capas de análisis críticas (como las medidas de seguridad específicas), llevando la propuesta de un nivel bueno a uno excelente.
* **Capacidad de Adopción de Personas:** El LLM demostró ser altamente efectivo en adoptar la persona asignada ("Asistente Experto en consultoría") y mantenerla a lo largo de la interacción. Esto es fundamental para contextualizar las respuestas y asegurar que se alineen con los objetivos, el tono y las restricciones del cliente, en este caso, Santander US Bank.
* **Demostración de Valor de Negocio:** El proyecto simulado "SantanderSQL Shield" presenta un caso de negocio convincente con un Retorno de la Inversión (ROI) proyectado del 4,267%, lo que subraya el potencial de los LLMs no solo como herramientas tecnológicas, sino como motores de transformación y eficiencia financiera.

### **Análisis de Métodos de *Prompt Engineering* Utilizados**

El *Prompt Engineering* es el proceso de diseñar y refinar las entradas (prompts) para guiar a los LLMs a generar las salidas deseadas de la manera más efectiva posible (Phoenix & Taylor, 2024). El notebook empleó tres técnicas principales:

#### 1. **Prompting Zero-Shot (Disparo Único)**

* **¿Para qué sirve?** Es la forma más básica de interactuar con un LLM. Consiste en dar una instrucción directa y concisa sin proporcionarle ejemplos previos de cómo realizar la tarea (Falcón Morales, 2025). Es útil para tareas simples o para obtener una primera idea general sobre un tema.
* **Resultados Observados:** En el "Caso 1: User_Prompt Zero-Shot", se le pidió al modelo: *"Preséntame la idea inicial del proyecto 'SantanderSQL Shield' "*. La respuesta fue coherente y relevante, pero muy genérica. Describió los objetivos y componentes de una solución de seguridad de bases de datos de manera superficial, sin conectar directamente con los datos específicos del problema (costos, tasa de error) ni proponer una arquitectura concreta. Esto demuestra que para un análisis profundo, el Zero-Shot es insuficiente.

#### 2. **Prompting Chain-of-Thought (CoT) (Cadena de Pensamiento)**

* **¿Para qué sirve?** Esta técnica guía al modelo para que descomponga un problema complejo en una secuencia de pasos lógicos intermedios antes de llegar a la respuesta final (Falcón Morales, 2025). Al instruir al modelo a "pensar paso a paso", se mejora significativamente la calidad y la estructura del razonamiento, especialmente en tareas que requieren análisis detallado.
* **Resultados Observados:** En el "Caso 2: User_Prompt Chain-of-Thought (CoT)", el prompt se estructuró en cuatro pasos claros: Diagnóstico, Solución, Arquitectura y Viabilidad. Como resultado, la respuesta del LLM fue una propuesta de negocio completa y bien organizada. A diferencia del Zero-Shot, esta respuesta utilizó datos cuantitativos del problema para justificar la solución y detalló la pila tecnológica y el análisis de ROI. La metodología CoT transformó una idea vaga en un plan de proyecto accionable.

#### 3. **Prompting Tree-of-Thoughts (ToT) (Árbol de Pensamientos)**

* **¿Para qué sirve?** Es una técnica más avanzada que la CoT. En lugar de seguir una única cadena de pensamiento, el ToT instruye al modelo a generar y explorar múltiples líneas de razonamiento (ramas), evaluarlas de forma crítica según ciertos criterios y luego sintetizar la mejor solución posible, a menudo combinando las fortalezas de las diferentes ramas (Falcón Morales, 2025). Es ideal para la toma de decisiones estratégicas y la resolución de problemas complejos sin una única respuesta correcta.
* **Resultados Observados:** El "Caso 3: User_Prompt Tree-of-Thoughts (ToT)" es el ejemplo más sofisticado del notebook. El prompt obligó al modelo a generar tres enfoques estratégicos distintos (MVP, Asistente Colaborativo y Plataforma Integral), evaluarlos según criterios clave (seguridad, ROI, escalabilidad) y, finalmente, recomendar una solución híbrida que combinaba lo mejor de dos enfoques. Este resultado demuestra un nivel de razonamiento estratégico muy superior. La conversación posterior, donde se usa este mismo enfoque para comparar proveedores de LLM y luego proponer medidas de seguridad específicas para cada uno, refuerza la potencia del ToT para análisis comparativos y mitigación de riesgos.

### **Referencias**

Falcón Morales, L. E. (2025). *MNA_NLP_LLM_prompts.pdf* [Materia de NLP, Tec de Monterrey]. Junio 2025.

Falcón Morales, L. E. (2025). *MNA_NLP_prompts_OpenAI_clase-1.ipynb* [Materia de NLP, Tec de Monterrey]. Junio 2025.

OpenAI. (2024). *GPT-4o*. [https://platform.openai.com/docs/guides/gpt](https://platform.openai.com/docs/guides/gpt)

Phoenix, J., & Taylor, M. (2024). *Prompt Engineering for Generative AI*. O'Reilly. [https://learning.oreilly.com/library/view/prompt-engineering-for/9781098153427/](https://learning.oreilly.com/library/view/prompt-engineering-for/9781098153427/)