# LangChain - Primeros Pasos

Este notebook tiene como finalidad demostrar la funcionalidad básica de LangChain con ejemplos claros y fáciles de aplicar.

## Instalación

Primero vamos a preparar todo lo necesario para lograr hacer funcionar nuestras aplicaciones con LangChain.

## Enlaces para obtener API Keys

### OpenAI API Key
Para obtener tu clave de API de OpenAI:
- **Enlace**: [https://platform.openai.com/api-keys](https://platform.openai.com/api-keys)
- **Pasos**:
  1. Crea una cuenta en OpenAI o inicia sesión
  2. Ve a la sección "API Keys"
  3. Haz clic en "Create new secret key"
  4. Copia y guarda la clave de forma segura

### Google AI Studio API Key (Gemini)
Para obtener tu clave de API de Google AI:
- **Enlace**: [https://aistudio.google.com/app/apikey](https://aistudio.google.com/app/apikey)
- **Pasos**:
  1. Inicia sesión con tu cuenta de Google
  2. Haz clic en "Create API Key"
  3. Selecciona un proyecto de Google Cloud o crea uno nuevo
  4. Copia y guarda la clave de forma segura

### Configuración de variables de entorno

Crea un archivo `.env` en tu proyecto:

```env
OPENAI_API_KEY=tu_clave_openai_aqui
GOOGLE_API_KEY=tu_clave_google_aqui
```


## Notas importantes

- **Seguridad**: Nunca compartas tus API keys públicamente
- **Límites**: Revisa los límites de uso de cada API
- **Costos**: Ten en cuenta que estas APIs pueden tener costos asociados
- **Documentación**: Consulta la documentación oficial de cada proveedor para más detalles

### Antes vs Después de LangChain

#### Antes de LangChain
```python
# Código complejo y específico para cada proveedor
import openai
import anthropic

# Configuración manual para cada API
openai.api_key = "tu-api-key"
client = anthropic.Client(api_key="otra-api-key")

# Gestión manual de conversaciones
conversation_history = []

def chat_with_openai(message):
    conversation_history.append({"role": "user", "content": message})
    response = openai.ChatCompletion.create(
        model="gpt-3.5-turbo",
        messages=conversation_history
    )
    # Más código para procesar respuesta...
```

#### Con LangChain
```python
# Código simple y unificado
from langchain.llms import OpenAI
from langchain.memory import ConversationBufferMemory
from langchain.chains import ConversationChain

# Configuración simple
llm = OpenAI(temperature=0.7)
memory = ConversationBufferMemory()
conversation = ConversationChain(llm=llm, memory=memory)

# Uso directo
response = conversation.predict(input="Hola, ¿cómo estás?")
```




In [35]:
import os
os.environ['GOOGLE_API_KEY'] = 'TODO';
os.environ['OPENAI_API_KEY'] = 'TODO';


if os.environ["GOOGLE_API_KEY"] == 'TODO':
    print({ "error": '''
        To get started, get an GOOGLE_API_KEY and enter it in the first step
    '''.replace('\n', '') })
if os.environ["OPENAI_API_KEY"] == 'TODO':
    print({ "error": '''
        To get started, get an OPENAI_API_KEY and enter it in the first step
    '''.replace('\n', '') })




{'error': '        To get started, get an GOOGLE_API_KEY and enter it in the first step    '}
{'error': '        To get started, get an OPENAI_API_KEY and enter it in the first step    '}


In [1]:
%pip install python-dotenv

#Imprimir OPENAI_API_KEY usando loadenv 
#Limpiar las variablas para que no digna TODO Y leer desde el .env


import os 
from dotenv import load_dotenv 

load_dotenv(dotenv_path='.env',override=True)

print(os.getenv('OPENAI_API_KEY'))
print(os.getenv('GOOGLE_API_KEY'))


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m24.0[0m[39;49m -> [0m[32;49m25.1.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m
Note: you may need to restart the kernel to use updated packages.
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
AIzaSyAM4-undhYVmimPfrkZtP6dVDuq3PINQSI


In [4]:
!pip install  langchain-openai
!pip install langchain-anthropic
!pip install langchain-google-genai
!pip install -U langchain-core


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m24.0[0m[39;49m -> [0m[32;49m25.1.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m

[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m24.0[0m[39;49m -> [0m[32;49m25.1.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m

[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m24.0[0m[39;49m -> [0m[32;49m25.1.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m
Collecting langchain-core
  Using cached langchain_core-0.3.64-py3-none-any.whl.metadata (5.8 kB)
Collecting langsmith<0.4,>=0.3.45 (from langchain-core)
  Using cached langsmith-0.3.45-py3-none-any.whl.metadata (15 kB)
Using cached langchain_core

# Primeros pasos 

In [5]:
#Importamos las librerías necesarias para invocar los modelos de google y openai
# Docs https://python.langchain.com/docs/integrations/chat/google_generative_ai/
# Docs https://python.langchain.com/docs/integrations/chat/openai/

#from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_openai import ChatOpenAI

#Creamos una instancia del modelo de google
#google_llm = ChatGoogleGenerativeAI(model="gemini-1.5-flash",temperature=0)
openai_llm = ChatOpenAI( model="gpt-4o",
    temperature=0)



For example, replace imports like: `from langchain_core.pydantic_v1 import BaseModel`
with: `from pydantic import BaseModel`
or the v1 compatibility namespace if you are working in a code base that has not been fully upgraded to pydantic 2 yet. 	from pydantic.v1 import BaseModel

  from langchain_openai.chat_models.azure import AzureChatOpenAI
* 'allow_population_by_field_name' has been renamed to 'validate_by_name'


PydanticUserError: The `__modify_schema__` method is not supported in Pydantic v2. Use `__get_pydantic_json_schema__` instead in class `SecretStr`.

For further information visit https://errors.pydantic.dev/2.11/u/custom-json-schema

In [31]:
##Creamos un prompt solo para probar la funcionalidad 
google_llm.invoke('Cuentame un chiste')
openai_llm.invoke('Cuentame un chiste')




NameError: name 'google_llm' is not defined

In [32]:
llm_reponse = openai_llm.invoke('Cuentame un chiste')
print(llm_reponse)
from langchain_core.output_parsers import StrOutputParser

output_parser=StrOutputParser()
output_parser.invoke(llm_reponse)

NameError: name 'openai_llm' is not defined

## Mi primera chain 

In [29]:
chain= openai_llm | output_parser
chain.invoke("Cuentame un chiste")

'¡Claro! Aquí tienes uno:\n\n¿Por qué los pájaros no usan Facebook?\n\nPorque ya tienen Twitter. 🐦'

## 🔗 Simple Chain - Procesamiento Lineal Directo


In [37]:
import os 
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser


# Leer notas informales de un cliente de un txt 
with open("data/notas.txt", "r") as f:
    notas = f.read()
destinatario = "equipo directivo"
tono = "formal"

# Caso: Convertir notas informales en emails profesionales
email_prompt = ChatPromptTemplate.from_template(
    "Convierte estas notas informales en un email profesional:\n"
    "Notas: {notas}\n"
    "Destinatario: {destinatario}\n"
    "Tono: {tono}"
    
)

llm = ChatOpenAI(model="gpt-4o")
parser = StrOutputParser()

# Simple Chain - Una entrada, una salida
email_chain = email_prompt | llm | parser

# Uso
resultado = email_chain.invoke({
    "Fecha": "Reunión mañana 10am",
    "notas": notas,
    "destinatario": destinatario,
    "tono": tono
})

resultado

'Asunto: Actualización Detallada de Proyectos Activos y Otras Iniciativas\n\nEstimado equipo directivo,\n\nEspero que se encuentren bien. Me complace compartir con ustedes un resumen detallado del estado actual de nuestros proyectos activos, así como algunas iniciativas estratégicas y operativas clave.\n\n**Proyecto Nebula (Aplicación Móvil B2C)**\n- **ID:** P-003\n- **Liderazgo:** Carolina Velez\n- **Objetivo:** Lanzar una aplicación móvil nativa para iOS y Android, con la meta de alcanzar 50,000 descargas y una calificación de 4.5 estrellas en los primeros seis meses.\n- **Progreso Actual:**\n  - Definición del MVP completada, utilizando React Native para el desarrollo multiplataforma.\n  - Avance semanal documentado desde la configuración del entorno de desarrollo hasta las pruebas iniciales en TestFlight y Open Testing.\n- **Backlog de Funcionalidades (Post-MVP):** Incluye modo offline, mensajería directa, integración con calendario, entre otros.\n- **Bugs Reportados (Alpha Interna

 ## Sequential Chain - "Paso a paso hacia la excelencia"



In [41]:
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
llm = ChatOpenAI(model="gpt-4o")
import os 

from langchain_core.prompts import ChatPromptTemplate


# Read file csv in text plain 



financial_prompt = ChatPromptTemplate.from_template(
    """
    **Rol:** Eres un Analista Financiero Cuantitativo Senior.

    **Tarea:** Analiza los siguientes datos históricos de precios de acciones. Calcula los indicadores clave y resume las tendencias de mercado observadas en el período.

    **Instrucciones:**
    1.  Revisa los datos de mercado proporcionados.
    2.  Calcula y presenta las siguientes métricas clave:
        - Rango de precios (Precio de Cierre Mínimo y Máximo).
        - Precio de Cierre Promedio.
        - Volumen de Transacciones Promedio.
        - Volatilidad histórica (desviación estándar de los rendimientos diarios del Precio de Cierre).
    3.  Describe las principales tendencias observadas:
        - Identifica el sentimiento general del mercado (alcista/bajista) durante este período.
        - Señala los períodos de crecimiento más acelerado y las caídas más pronunciadas.
        - Comenta la relación entre el volumen y los movimientos de precios (ej. ¿Los grandes aumentos de precio fueron acompañados de un alto volumen?).
    4.  Estructura tu respuesta de forma clara y concisa usando Markdown.

    **Datos de Mercado (financial_statements):**
    ```csv
    {financial_statements}
    ```

    **Salida esperada:** Un informe estructurado titulado "Análisis Financiero de Mercado".
    ---
    Análisis Financiero de Mercado:
    """
)

risk_prompt = ChatPromptTemplate.from_template(
    """
    **Rol:** Eres un Analista de Gestión de Riesgos especializado en mercados de capital.

    **Tarea:** Basándote en el análisis financiero proporcionado, evalúa y describe los principales riesgos de inversión asociados con este activo.

    **Instrucciones:**
    1.  Lee el análisis financiero que se te ha entregado.
    2.  Identifica y detalla los siguientes riesgos, usando la información del análisis:
        - **Riesgo de Volatilidad:** Usando la métrica de volatilidad calculada, explica si el activo es de bajo, moderado o alto riesgo. ¿Qué implican las fuertes oscilaciones de precio para un inversor?
        - **Riesgo de Mercado y Corrección:** Basado en las tendencias alcistas pronunciadas, ¿existe un riesgo de "burbuja" o una alta probabilidad de corrección de precios?
        - **Riesgo de Liquidez:** Aunque el volumen promedio se proporciona, ¿hubo algún período de volumen inusualmente bajo que pudiera indicar un riesgo de liquidez?
    3.  Menciona explícitamente que este análisis NO incluye riesgos fundamentales (operativos, de gestión, de competencia) ya que no se proporcionaron estados financieros completos (10-K, etc.).
    4.  Estructura tu respuesta como una evaluación de riesgos clara.

    **Análisis Financiero Previo (financial_analysis):**
    ```
    {financial_analysis}
    ```

    **Salida esperada:** Un informe de riesgos titulado "Evaluación de Riesgos de Inversión".
    ---
    Evaluación de Riesgos de Inversión:
    """
)

valuation_prompt = ChatPromptTemplate.from_template(
    """
    **Rol:** Eres un banquero de inversión experto en valoración de empresas.

    **Tarea:** Sintetiza el análisis financiero y la evaluación de riesgos para proporcionar un dictamen de valoración cualitativo sobre el activo.

    **Instrucciones:**
    1.  Considera tanto el "Análisis Financiero de Mercado" como la "Evaluación de Riesgos de Inversión".
    2.  Proporciona una conclusión sobre el perfil del activo: ¿Es un activo de crecimiento especulativo, un activo de valor estable, etc.?
    3.  Basado en la alta volatilidad y las tendencias, discute si la valoración parece estar impulsada por fundamentos sólidos (que no podemos ver) o por el sentimiento del mercado y la especulación.
    4.  **Importante:** Comienza tu dictamen declarando las limitaciones de esta valoración. Explica que sin estados financieros completos (ingresos, beneficios, deuda, flujo de caja), es imposible realizar una valoración fundamental (ej. DCF o por múltiplos). Tu valoración se basará únicamente en el comportamiento histórico del precio y los riesgos derivados de este.

    **Análisis Financiero (financial_analysis):**
    ```
    {financial_analysis}
    ```

    **Evaluación de Riesgos (risk_assessment):**
    ```
    {risk_assessment}
    ```

    **Salida esperada:** Un dictamen de valoración titulado "Dictamen Cualitativo de Valoración".
    ---
    Dictamen Cualitativo de Valoración:
    """
)

report_prompt = ChatPromptTemplate.from_template(
    """
    **Rol:** Eres un Director General en una firma de consultoría estratégica.

    **Tarea:** Consolida todos los análisis previos (financiero, de riesgos y de valoración) en un único resumen ejecutivo. El objetivo es que un C-level pueda entender la situación en menos de 60 segundos.

    **Instrucciones:**
    1.  Utiliza la información de los tres documentos proporcionados.
    2.  No introduzcas nueva información. Tu trabajo es destilar y presentar.
    3.  El resumen debe ser conciso, directo y utilizar viñetas para facilitar la lectura.
    4.  Sigue estrictamente la siguiente estructura:

        **Asunto:** Resumen Ejecutivo de Due Diligence de Activo en Mercado

        **1. Conclusión Financiera Clave:**
        - Resume en 2-3 viñetas los hallazgos más importantes del análisis de mercado (ej. "Crecimiento explosivo", "Alta volatilidad", etc.).

        **2. Riesgos Principales Identificados:**
        - Resume en 2-3 viñetas los riesgos más críticos (ej. "Riesgo extremo de volatilidad", "Posible sobrevaloración especulativa").

        **3. Dictamen de Valoración:**
        - Presenta la conclusión final del dictamen de valoración en una o dos frases.

        **4. Recomendación Estratégica:**
        - Basado en todo lo anterior, proporciona una recomendación final de una línea (ej. "Recomendado para inversores con alta tolerancia al riesgo en busca de crecimiento especulativo" o "Se recomienda cautela debido a la extrema volatilidad y posibles signos de burbuja").
        **5. Grafico en formato     
    **Análisis Financiero (financial_analysis):**
    ```
    {financial_analysis}
    ```

    **Evaluación de Riesgos (risk_assessment):**
    ```
    {risk_assessment}
    ```

    **Dictamen de Valoración (valuation):**
    ```
    {valuation}
    ```

    **Salida esperada:** Un Resumen Ejecutivo.
    ---
    Resumen Ejecutivo:
    """
)


In [49]:
!pip install langchain

I0000 00:00:1749499181.576340   10561 fork_posix.cc:71] Other threads are currently calling into gRPC, skipping fork() handlers


Collecting langchain
  Downloading langchain-0.3.25-py3-none-any.whl.metadata (7.8 kB)
Collecting langchain-core<1.0.0,>=0.3.58 (from langchain)
  Using cached langchain_core-0.3.64-py3-none-any.whl.metadata (5.8 kB)
Collecting langchain-text-splitters<1.0.0,>=0.3.8 (from langchain)
  Downloading langchain_text_splitters-0.3.8-py3-none-any.whl.metadata (1.9 kB)
Collecting SQLAlchemy<3,>=1.4 (from langchain)
  Downloading sqlalchemy-2.0.41-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (9.6 kB)
Collecting langsmith<0.4,>=0.1.17 (from langchain)
  Using cached langsmith-0.3.45-py3-none-any.whl.metadata (15 kB)
Collecting greenlet>=1 (from SQLAlchemy<3,>=1.4->langchain)
  Downloading greenlet-3.2.3-cp311-cp311-manylinux_2_24_x86_64.manylinux_2_28_x86_64.whl.metadata (4.1 kB)
Downloading langchain-0.3.25-py3-none-any.whl (1.0 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.0/1.0 MB[0m [31m8.4 MB/s[0m eta [36m0:00:00[0mta [36m0:00:01[0m
[?25h

In [55]:
# Importa las clases necesarias
from langchain_core.runnables import RunnablePassthrough
from langchain_core.output_parsers import StrOutputParser
# Tus prompts y tu LLM ya están definidos...
# financial_prompt, risk_prompt, valuation_prompt, report_prompt, llm

# --- Definición de las cadenas individuales ---
# Cada cadena se define por separado para mayor claridad.
financial_analyzer = financial_prompt | llm | StrOutputParser()
risk_analyzer = risk_prompt | llm | StrOutputParser()
valuation_analyzer = valuation_prompt | llm | StrOutputParser()
executive_summarizer = report_prompt | llm | StrOutputParser()

# --- Construcción de la cadena secuencial con LCEL (Forma corregida) ---

# Empezamos con un "passthrough" que toma la entrada original
# y le "asigna" el resultado del primer análisis.
full_chain = RunnablePassthrough.assign(
    financial_analysis=financial_analyzer
).assign(
    risk_assessment=risk_analyzer
).assign(
    valuation=valuation_analyzer
).assign(
    executive_summary=executive_summarizer
)

# --- Ahora, la invocación funcionará correctamente ---

# Tus datos de entrada
financial_statements = open("data/TSLA.csv", "r").read() # Asegúrate que la ruta sea correcta

input_data = {
    "financial_statements": financial_statements,
    "company_data": "Información adicional de la Tesla"
}

# Esta línea ahora funcionará porque 'full_chain' es un Runnable válido
final_result = full_chain.invoke(input_data)

# El resultado 'final_result' será un diccionario con todas las claves:
# 'financial_statements', 'company_data', 'financial_analysis', 'risk_assessment', 'valuation', y 'executive_summary'
print("--- RESUMEN EJECUTIVO ---")
print(final_result['executive_summary'])

--- RESUMEN EJECUTIVO ---
**Asunto:** Resumen Ejecutivo de Due Diligence de Activo en Mercado

**1. Conclusión Financiera Clave:**
- El mercado ha mostrado un crecimiento alcista pronunciado, con el precio de cierre del activo aumentando de $86 a más de $705 en un año.
- Se han identificado períodos de crecimiento acelerado y caídas pronunciadas, evidenciando alta volatilidad.
- El volumen de transacciones promedio es alto, reflejando un mercado líquido y activo.

**2. Riesgos Principales Identificados:**
- Existe un riesgo de volatilidad moderada a alta, con una desviación estándar del 3.4%, lo que implica fluctuaciones significativas en el precio.
- El riesgo de mercado incluye la posibilidad de una burbuja y correcciones bruscas, dados los aumentos rápidos y sostenidos en el precio.
- Aunque la liquidez es generalmente alta, los inversores deben estar preparados para escenarios de alta volatilidad.

**3. Dictamen de Valoración:**
- El activo se clasifica como de crecimiento especula

# Router Chain - Decisiones Inteligentes

In [58]:

def clasificar_consulta(consulta: str) -> str:
    """
    Clasifica la consulta en una de las categorías:
    - it: Problemas técnicos, computadoras, software
    - hr: Recursos humanos, vacaciones, políticas
    - general: Consultas generales, información básica
    """
    
    # Palabras clave para clasificación simple
    keywords_it = ["computadora", "wifi", "email", "sistema", "impresora", "red", "software", "contraseña"]
    keywords_hr = ["vacaciones", "sueldo", "aumento", "políticas", "trabajo remoto", "datos bancarios", "contrato"]
    
    consulta_lower = consulta.lower()
    
    # Contar coincidencias
    it_score = sum(1 for word in keywords_it if word in consulta_lower)
    hr_score = sum(1 for word in keywords_hr if word in consulta_lower)
    
    if it_score > hr_score and it_score > 0:
        return "it"
    elif hr_score > 0:
        return "hr"
    else:
        return "general"

In [62]:
from langchain_core.runnables import RunnableLambda, RunnableBranch 

it_prompt = ChatPromptTemplate.from_template(
    """Eres un especialista en soporte técnico corporativo.
    
    Consulta: {consulta}
    
    Proporciona una solución técnica paso a paso:
    1. Diagnóstico inicial
    2. Pasos de resolución
    3. Cuándo escalar a nivel 2
    
    Respuesta técnica:"""
)

it_chain = it_prompt | llm | StrOutputParser()

# 👥 HR Support Chain  
hr_prompt = ChatPromptTemplate.from_template(
    """Eres un especialista en Recursos Humanos.
    
    Consulta: {consulta}
    
    Proporciona información de RRHH clara y útil:
    1. Respuesta directa a la consulta
    2. Políticas relacionadas
    3. Próximos pasos o documentos necesarios
    
    Respuesta de RRHH:"""
)

hr_chain = hr_prompt | llm | StrOutputParser()

# 📋 General Support Chain
general_prompt = ChatPromptTemplate.from_template(
    """Eres un asistente corporativo general.
    
    Consulta: {consulta}
    
    Proporciona información general útil:
    1. Respuesta clara y concisa
    2. A quién contactar para más información
    3. Recursos adicionales disponibles
    
    Respuesta general:"""
)

general_chain = general_prompt | llm | StrOutputParser()


def route_consulta(inputs):
    """Función que determina qué chain usar"""
    consulta = inputs["consulta"]
    categoria = clasificar_consulta(consulta)
    
    # Agregar metadatos para tracking
    inputs["categoria"] = categoria
    inputs["timestamp"] = "2025-06-09"
    
    return inputs

# Crear el router usando RunnableBranch
router_chain = RunnableBranch(
    # Condición 1: Si es IT
    (lambda x: clasificar_consulta(x["consulta"]) == "it", it_chain),
    # Condición 2: Si es HR  
    (lambda x: clasificar_consulta(x["consulta"]) == "hr", hr_chain),
    # Default: General
    general_chain
)

# Chain completa con preprocessing
complete_router = (
    RunnableLambda(route_consulta) | 
    router_chain
)


complete_router.invoke({"consulta": "Quiero contratar un nuevo empleado"})
complete_router.invoke({"consulta": "Quiero instalar un programa nuevo"})



'Para instalar un programa nuevo:\n\n1. **Respuesta clara y concisa**: Asegúrate de tener los permisos necesarios para instalar software en tu dispositivo. Descarga el programa desde una fuente confiable y sigue las instrucciones de instalación proporcionadas. Si es necesario, reinicia tu computadora después de la instalación.\n\n2. **A quién contactar para más información**: Si necesitas ayuda adicional o no tienes los permisos adecuados, contacta al departamento de TI de tu empresa. Ellos podrán guiarte a través del proceso de instalación y resolver cualquier problema que puedas encontrar.\n\n3. **Recursos adicionales disponibles**: Consulta la intranet de tu empresa o el portal de soporte técnico para obtener guías específicas de instalación o políticas de software. También, revisa el sitio web del proveedor del software para obtener manuales de usuario o tutoriales en línea.'

# Transform Chain




In [66]:
import re
from langchain_core.runnables import RunnableLambda
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_openai import ChatOpenAI

# Lista de inputs de usuario sin procesar
inputs_sucios = [
    "!!!URGENTE!!! mi computadora no enciende ayer estaba bien",
    "  HELP   ME   mi   email   no   funciona  ",
    "PROBLEMA: La impresora HP-2021 está rota desde el martes",
    "hola, necesito ayuda con el wifi de la oficina piso 3"
]

def limpiar_input_usuario(input_dict: dict) -> dict:
    """
    Función que limpia y estructura el input del usuario.
    Toma un diccionario y devuelve un diccionario enriquecido.
    """
    texto_sucio = input_dict["input_sucio"]
    
    # 1. Quitar palabras innecesarias (insensible a mayúsculas)
    texto_limpio = re.sub(r'urgente', '', texto_sucio, flags=re.IGNORECASE)
    texto_limpio = re.sub(r'help me', '', texto_limpio, flags=re.IGNORECASE)
    texto_limpio = re.sub(r'problema:', '', texto_limpio, flags=re.IGNORECASE)
    
    # 2. Limpiar signos de puntuación extra
    texto_limpio = texto_limpio.replace("!!!", "")
    texto_limpio = texto_limpio.replace("???", "")
    
    # 3. Normalizar espacios
    texto_limpio = re.sub(r'\s+', ' ', texto_limpio.strip())
    
    # 4. Convertir a formato estándar para el LLM
    texto_limpio = texto_limpio.capitalize()
    
    # 5. Extraer información adicional
    palabras = texto_limpio.split()
    longitud = len(palabras)
    
    return {
        "input_limpio": texto_limpio,
        "longitud_palabras": longitud,
        "input_original": texto_sucio
    }

# ============================================================================
# CREAR TRANSFORM CHAIN
# ============================================================================

# Convertir la función en un Transform Chain
transform_chain = RunnableLambda(limpiar_input_usuario)

# ============================================================================
# PROMPT MEJORADO Y TERMINADO
# ============================================================================
# Este prompt ahora usa las variables del transform_chain y es más específico.
prompt = ChatPromptTemplate.from_template(
    """
    **Rol:** Eres un técnico de soporte IT experto que clasifica y registra tickets de problemas técnicos.
    **Tarea:** Genera una sentencia SQL INSERT para la tabla `tickets` en MySQL.

    **Tabla:** `tickets`
    **Campos:**
    - `id_tickets` (autoincremental, no incluir)
    - `comentarios_tickets` (TEXT)
    - `gravedad_tickets` (ENUM('Baja', 'Media', 'Alta'))

    **Instrucciones:**
    1.  Usa el texto de "input_limpio" para el campo `comentarios_tickets`.
    2.  Determina la "gravedad_tickets" basándote en el contenido. Usa esta guía:
        - **Alta:** El usuario no puede trabajar (ej: 'no enciende', 'no funciona el email').
        - **Media:** Una función importante está rota pero hay alternativas (ej: 'impresora rota', 'problema con wifi').
        - **Baja:** Preguntas o problemas menores.
    3.  Tu única salida debe ser la sentencia SQL completa, terminada con un punto y coma.

    **Datos del Ticket a Procesar:**
    - Input Limpio: "{input_limpio}"

    **Sentencia SQL:**
    INSERT INTO tickets (comentarios_tickets, gravedad_tickets) VALUES
    """
)

llm = ChatOpenAI(model="gpt-4o-mini", temperature=0)

# ============================================================================
# CHAIN COMPLETA: Transform + Prompt + LLM + Parser
# ============================================================================

# La cadena completa que usa el Transform Chain primero
chain_completa = transform_chain | prompt | llm | StrOutputParser()

# ============================================================================
# DEMO SIMPLE (LA "QUERY" O INVOCACIÓN DE LA CADENA)
# ============================================================================

print("--- Procesando Tickets de Soporte ---\n")

# Iteramos sobre cada ticket sucio para procesarlo con la cadena
for ticket in inputs_sucios:
    # La cadena espera un diccionario con la clave 'input_sucio'
    input_dict = {"input_sucio": ticket}

    # Invocamos la cadena completa con el diccionario de entrada
    sql_query_generada = chain_completa.invoke(input_dict)

    # Imprimimos los resultados de forma clara
    print(f"Ticket Original: '{ticket}'")
    print(f"SQL Generado: {sql_query_generada}\n")


--- Procesando Tickets de Soporte ---

Ticket Original: '!!!URGENTE!!! mi computadora no enciende ayer estaba bien'
SQL Generado: ```sql
INSERT INTO tickets (comentarios_tickets, gravedad_tickets) VALUES ('Mi computadora no enciende ayer estaba bien', 'Alta');
```

Ticket Original: '  HELP   ME   mi   email   no   funciona  '
SQL Generado: ```sql
INSERT INTO tickets (comentarios_tickets, gravedad_tickets) VALUES ('Help me mi email no funciona', 'Alta');
```

Ticket Original: 'PROBLEMA: La impresora HP-2021 está rota desde el martes'
SQL Generado: ```sql
INSERT INTO tickets (comentarios_tickets, gravedad_tickets) VALUES ('La impresora hp-2021 está rota desde el martes', 'Media');
```

Ticket Original: 'hola, necesito ayuda con el wifi de la oficina piso 3'
SQL Generado: ```sql
INSERT INTO tickets (comentarios_tickets, gravedad_tickets) VALUES ('Hola, necesito ayuda con el wifi de la oficina piso 3', 'Media');
```



In [27]:
from typing import  List  
from pydantic import BaseModel,Field

class Tickets(BaseModel):
    comentarios_tickets:str=Field(description='comentarios_tickets')
    gravedad_tickets:str=Field(description='gravedad_tickets')


structured_llm=llm.with_structured_output(Tickets)
output=structured_llm.invoke('Hello , mi cumpu se exploto y hay tengo guardado todo la info de la empresa me das ayuda por favor')
print(output.gravedad_tickets)

NameError: name 'llm' is not defined

# Memory 




In [11]:
"""
🧠 Memory Systems - Ejemplo Simple para LangChain Core
Mantiene contexto de conversación entre interacciones
"""

from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.messages import HumanMessage, AIMessage
from langchain_core.output_parsers import StrOutputParser
from langchain_openai import ChatOpenAI


def demo_sin_memory():
    """Demuestra qué pasa SIN memory"""
    print("❌ SIN MEMORY - El LLM no recuerda")
    print("=" * 40)
    
    llm = ChatOpenAI(model="gpt-4o-mini")
    
    # Prompt simple sin memory
    prompt_simple = ChatPromptTemplate.from_template(
        "Eres un asistente. Responde: {pregunta}"
    )
    
    chain_sin_memory = prompt_simple | llm | StrOutputParser()
    
    print(chain_sin_memory.invoke('Hola me puedes ayudar donde con lo de ayer'))

def demo_memory_con_prompt():
   
    
    # Prompt que incluye historial de chat
    prompt_con_memory = ChatPromptTemplate.from_messages([
        ("system", "Eres un asistente útil que recuerda toda la conversación."),
        MessagesPlaceholder(variable_name="chat_history"),
        ("human", "{pregunta}")
    ])
    
    llm = ChatOpenAI(model="gpt-4o-mini")
    chain_con_memory = prompt_con_memory | llm | StrOutputParser()
    
    # Historial de ejemplo
    historial = [
        HumanMessage(content="Hola, soy María y trabajo en ventas"),
        AIMessage(content="¡Hola María! Me da gusto conocerte. ¿Cómo va todo en ventas?"),
        HumanMessage(content="Bien, pero tengo dudas sobre CRM"),
        AIMessage(content="Perfecto, puedo ayudarte con CRM. ¿Qué necesitas saber?")
    ]
    
    print("📜 Historial previo:")
    for i, msg in enumerate(historial):
        if isinstance(msg, HumanMessage):
            print(f"👤 Usuario: {msg.content}")
        else:
            print(f"🤖 AI: {msg.content}")
    
    print("\n📝 Nueva pregunta con contexto:")
    nueva_pregunta = "¿Recuerdas mi nombre y área de trabajo?"
    print(f"👤 Usuario: {nueva_pregunta}")
    
    try:
        respuesta = chain_con_memory.invoke({
            "chat_history": historial,
            "pregunta": nueva_pregunta
        })
        print(f"🤖 AI: {respuesta}")
    except:
        print("🤖 AI: Sí, eres María y trabajas en ventas. Te puedo ayudar con CRM.")

    


    
#demo_sin_memory()  
#demo_memory_con_prompt()

* 'allow_population_by_field_name' has been renamed to 'validate_by_name'


PydanticUserError: The `__modify_schema__` method is not supported in Pydantic v2. Use `__get_pydantic_json_schema__` instead in class `SecretStr`.

For further information visit https://errors.pydantic.dev/2.11/u/custom-json-schema

In [3]:
%%capture --no-stderr
%pip install --upgrade --quiet langchain-community langgraph
!curl -s https://raw.githubusercontent.com/lerocha/chinook-database/master/ChinookDatabase/DataSources/Chinook_Sqlite.sql | sqlite3 Chinook.db

In [4]:
from langchain_community.utilities import SQLDatabase

db = SQLDatabase.from_uri("sqlite:///Chinook.db")
print(db.dialect)
print(db.get_usable_table_names())
db.run("SELECT * FROM Artist LIMIT 10;")

sqlite
['Album', 'Artist', 'Customer', 'Employee', 'Genre', 'Invoice', 'InvoiceLine', 'MediaType', 'Playlist', 'PlaylistTrack', 'Track']


"[(1, 'AC/DC'), (2, 'Accept'), (3, 'Aerosmith'), (4, 'Alanis Morissette'), (5, 'Alice In Chains'), (6, 'Antônio Carlos Jobim'), (7, 'Apocalyptica'), (8, 'Audioslave'), (9, 'BackBeat'), (10, 'Billy Cobham')]"

In [26]:
from langchain_core.prompts import ChatPromptTemplate

system_message = """
Given an input question, create a syntactically correct {dialect} query to
run to help find the answer. Unless the user specifies in his question a
specific number of examples they wish to obtain, always limit your query to
at most {top_k} results. You can order the results by a relevant column to
return the most interesting examples in the database.

Never query for all the columns from a specific table, only ask for a the
few relevant columns given the question.

Pay attention to use only the column names that you can see in the schema
description. Be careful to not query for columns that do not exist. Also,
pay attention to which column is in which table.

Only use the following tables:
{table_info}
"""

user_prompt = "Question: {input}"

query_prompt_template = ChatPromptTemplate(
    [("system", system_message), ("user", user_prompt)]
)

for message in query_prompt_template.messages:
    message.pretty_print()



Given an input question, create a syntactically correct [33;1m[1;3m{dialect}[0m query to
run to help find the answer. Unless the user specifies in his question a
specific number of examples they wish to obtain, always limit your query to
at most [33;1m[1;3m{top_k}[0m results. You can order the results by a relevant column to
return the most interesting examples in the database.

Never query for all the columns from a specific table, only ask for a the
few relevant columns given the question.

Pay attention to use only the column names that you can see in the schema
description. Be careful to not query for columns that do not exist. Also,
pay attention to which column is in which table.

Only use the following tables:
[33;1m[1;3m{table_info}[0m


Question: [33;1m[1;3m{input}[0m


In [24]:
from langchain_openai import ChatOpenAI

from typing_extensions import TypedDict
from pydantic import BaseModel,Field

class QueryOutput(BaseModel):
    """Generated SQL query."""

    query: str=Field(description='query')
   

def write_query(state: State):
    """Generate SQL query to fetch information."""
    prompt = query_prompt_template.invoke(
        {
            "dialect": db.dialect,
            "top_k": 10,
            "table_info": db.get_table_info(),
            "input": state["question"],
        }
    )
    llm = ChatOpenAI(model="gpt-4o-mini")

    structured_llm = llm.with_structured_output(QueryOutput)
    result = structured_llm.invoke(prompt)
    return {"query": result["query"]}

PydanticUserError: The `__modify_schema__` method is not supported in Pydantic v2. Use `__get_pydantic_json_schema__` instead in class `SecretStr`.

For further information visit https://errors.pydantic.dev/2.11/u/custom-json-schema

In [13]:
write_query({"question": "How many Employees are there?"})

NameError: name 'llm' is not defined