# Workshop: Introducci√≥n a Generative AI en Oracle y Creaci√≥n de Agentes con LangChain

Bienvenidos al workshop. En esta sesi√≥n vamos a explorar c√≥mo usar los **servicios de IA generativa de Oracle** para resolver problemas reales y luego **crear un agente inteligente** usando **LangChain** que pueda interactuar con estos servicios.

## Objetivos de la sesi√≥n
- Conocer la oferta de **Oracle Cloud Infrastructure (OCI Generative AI)** y c√≥mo integrarla desde Python.
- Ejecutar peticiones a modelos de lenguaje para **generar texto** de manera controlada.
- Construir un **agente con LangChain** que use herramientas  para responder preguntas de forma aut√≥noma.
- Aprender buenas pr√°cticas para **orquestar flujos de trabajo** y extender capacidades de los modelos.

## Requisitos previos
- Conocimientos b√°sicos de Python üêç
- Tener acceso a una cuenta de **Oracle Cloud** con permisos para usar **OCI Generative AI**
- Familiaridad b√°sica con entornos virtuales y Jupyter Notebooks.

> üí° **Tip:** este notebook est√° dise√±ado para ser pr√°ctico y paso a paso. Podr√°s copiar, ejecutar y modificar el c√≥digo para experimentar con los conceptos que vamos a explicar.

¬°Vamos a empezar!

## A continuaci√≥n... 

üì∞ Recopilaremos noticias sobre Innovaci√≥n y tecnolog√≠a chilena

ü§ñ Consumiremos un modelo de lenguaje alojado en Oracle Cloud 

üîç Construiremos un agente con langchain que es capaz de responder a preguntas relacionadas con las StartUps, tecnolog√≠a, IA y futuro digital en Chile.

## Instalaci√≥n

In [None]:
!pip install -U langchain==0.3.20 langchain-oci==0.1.6 tavily-python oci

In [None]:
import base64, pathlib
from IPython.display import HTML, display

def embed_png(path, width=520):
    data = base64.b64encode(pathlib.Path(path).read_bytes()).decode("ascii")
    return HTML(f'<img src="data:image/png;base64,{data}" width="{width}">')

display(HTML("<h3>ü™™ Registro en Tavily (paso a paso)</h3>"))
display(HTML("<p>1Ô∏è‚É£ Abre <a href='https://app.tavily.com/home' target='_blank'>https://app.tavily.com/home</a> y haz clic en <b>Sign Up</b>.</p>"))
display(embed_png("images/tavily_signup.png"))
display(HTML("<p>2Ô∏è‚É£ Inicia sesi√≥n y copia tu <b>API Key</b> desde la p√°gina principal.</p>"))
display(embed_png("images/api_key.png"))

In [None]:
# Pega la API Key de Tavily aqu√≠
TAVILY_API_KEY = "tvly-dev-RTqD..."  # Reemplaza con tu API Key de Tavily

In [None]:
assert TAVILY_API_KEY != "pega_aqui_tu_api_key", "Por favor, pega tu API Key de Tavily en la variable TAVILY_API_KEY"

## Configuraci√≥n de la autenticaci√≥n del SDK de OCI

Desde este notebook es necesario acceder a algunos servicios de Oracle, como el servicio de Generative AI, aunque ejecutes este notebook en cloud o de forma local, es necesario configurar las credenciales en la m√°quina que realiza el consumo del servicio. 

```
En los pasos anteriores fue necesario descargar un archivo terminado en .pem y copiar una configuraci√≥n con el siguiente estilo
[DEFAULT]
user=ocid1.user.oc1..
fingerprint=95:e1:09
tenancy=ocid1.tenancy.oc1..
region= 
```

A continuaci√≥n usaremos esos objetos.

In [None]:
# crea carpeta y permisos
!mkdir -p /home/datascience/.oci

In [None]:
!mkdir -p ~/.oci
!ls -la ~/.oci

Ahora vamos a ubicar la llave privada que descargamos en los pasos anteriores al generar el API Key. El archivo tendr√° un nombre similar a ‚Äútu_usuario-a√±o-mes-diaTHH_MM_SS.XXX.pem‚Äù.

Este archivo debe renombrarse como ‚Äúoci_api_key.pem‚Äù y cargarse en Data Science utilizando la opci√≥n ‚ÄúUpload Files‚Äù, o bien arrastr√°ndolo directamente en el men√∫ izquierdo del navegador.

Una vez que el archivo est√© cargado, podremos proceder con la ejecuci√≥n de la siguiente l√≠nea.

In [None]:
!mv ~/oci_api_key.pem ~/.oci/oci_api_key.pem
!chmod 600 ~/.oci/oci_api_key.pem
!ls -la ~/.oci

A continuaci√≥n, crearemos el archivo de configuraci√≥n en la ruta ~/.oci/config, vamos a copiar los valores de la configuraci√≥n mostrada en pantalla y a reemplazarlos en la siguiente l√≠nea.

Reemplazaremos _ocid1.user.oc1.._ por el ocid del usuario mostrado en pantalla
Reemplazaremos _fingerprint_ por el figerprint mostrado en pantalla
üö® No reemplazaremos _key_file_ por ninguna ruta si estamos ejecutando este notebook en DataScience. Si queremos ejecutar este notebook de forma local, podemos reemplazar la ruta por ~/.oci/nombre_de_la_key.pem

In [None]:
%%bash
cat > ~/.oci/config <<'CFG'

[DEFAULT]
user=ocid1.user.oc1..aaaaa...
fingerprint=ab:50:7a:...:..
tenancy=ocid1.tenancy.oc1..aaaaaaa..
region=us-chicago-1
key_file=/home/datascience/.oci/oci_api_key.pem
CFG

echo "Config creado en ~/.oci/config"
cat ~/.oci/config | sed 's/fingerprint=.*/fingerprint=<oculto>/'

In [None]:
# Descomenta √∫nicamente la l√≠nea que corresponda a tu regi√≥n
#REGION = "sa-saopaulo-1"
REGION = "us-chicago-1"
#REGION = "uk-london-1"
#REGION = "eu-frankfurt-1"
#REGION = "ap-osaka-1"

## ü§ñ Creaci√≥n del Agente LangChain

In [None]:
# CONFIGURACI√ìN DEL AGENTE LANGCHAIN + LLAMA 4
from langchain_oci import ChatOCIGenAI
from langchain.agents import create_react_agent, AgentExecutor
from langchain_core.prompts import PromptTemplate
from langchain_core.tools import tool
from tavily import TavilyClient

# Compartment ID en OCI ---
COMPARTMENT_ID = "ocid1.compartment.oc1..aaaaaaa..."  # Reemplaza con tu Compartment OCID

# ID del modelo (Llama 4 Maverick)
MODEL_ID = "ocid1.generativeaimodel.oc1.us-chicago-1.amaaaaaask7dceyayjawvuonfkw2ua4bob4rlnnlhs522pafbglivtwlfzta" #Llama 4 Maverick
#MODEL_ID = "ocid1.generativeaimodel.oc1.us-chicago-1.amaaaaaask7dceyarojgfh6msa452vziycwfymle5gxdvpwwxzara53topmq" #Llama 4 Scout

# Inicializamos el LLM
llm = ChatOCIGenAI(
    model_id=MODEL_ID,
    service_endpoint=f"https://inference.generativeai.{REGION}.oci.oraclecloud.com",
    compartment_id=COMPARTMENT_ID,
    provider="meta",
    model_kwargs={
        "temperature": 0.3,
        "max_tokens": 800,
        "top_p": 0.8
    },
    auth_type="API_KEY",
    auth_profile="DEFAULT"
)

# Creamos una herramienta
@tool
def get_chilean_innovation_news(pregunta: str) -> str:
    """Busca informaci√≥n sobre innovaci√≥n, ciencia y tecnolog√≠a en Chile."""
    client = TavilyClient(TAVILY_API_KEY)
    try:
        response = client.search(query=pregunta, max_results=5)
        results = response.get("results", [])
        formatted = "\n".join([f"- **{r['title']}** ({r['url']})" for r in results])
        return formatted if formatted else "No se encontraron resultados relevantes."
    except Exception as e:
        return f"Error en la b√∫squeda: {e}"

tools = [get_chilean_innovation_news]

# Plantilla ReAct
react_prompt_template = """Eres un experto en **innovaci√≥n y tecnolog√≠a chilena**.
Usa las herramientas cuando aporten valor.
Responde en espa√±ol neutro y con un tono profesional y actualizado.

Herramientas disponibles:
{tools}

Formato:
Question: la pregunta
Thought: qu√© vas a hacer
Action: una de [{tool_names}]
Action Input: el input
Observation: resultado
Thought: analiza y sintetiza
Final Answer: respuesta clara y √∫til.

Empecemos.
Question: {input}
Thought:{agent_scratchpad}
"""

prompt = PromptTemplate.from_template(react_prompt_template)

# Construcci√≥n del agente
agent = create_react_agent(llm, tools, prompt)

agent_executor = AgentExecutor(
    agent=agent,
    tools=tools,
    verbose=True,
    handle_parsing_errors=True
)

# Pregunta ---
pregunta = "¬øQu√© startups chilenas est√°n aplicando inteligencia artificial o tecnolog√≠as sostenibles en 2025?"
respuesta = agent_executor.invoke({"input": pregunta})

print("\n--- RESPUESTA DEL AGENTE ---\n")
print(respuesta["output"])

In [None]:
from langchain_oci import ChatOCIGenAI
from langchain.agents import create_react_agent, AgentExecutor
from langchain_core.prompts import PromptTemplate
from langchain_core.tools import tool
from langchain_core.messages import HumanMessage
from IPython.display import Markdown, display
import json

# --- Configuraci√≥n de OCI ---
COMPARTMENT_ID = "ocid1.compartment.oc1..aaaaaaa..."  # Reemplaza con tu Compartment OCID
REGION = "us-chicago-1"

MODEL_ID_LLAMA = "ocid1.generativeaimodel.oc1.us-chicago-1.amaaaaaask7dceyayjawvuonfkw2ua4bob4rlnnlhs522pafbglivtwlfzta" #Llama 4 Maverick


# === LLM principal ===
llm = ChatOCIGenAI(
    model_id=MODEL_ID_LLAMA,
    service_endpoint=f"https://inference.generativeai.{REGION}.oci.oraclecloud.com",
    compartment_id=COMPARTMENT_ID,
    provider="meta",
    model_kwargs={"temperature": 0.3, "max_tokens": 800, "top_p": 0.8},
    auth_type="API_KEY",
    auth_profile="DEFAULT"
)

# === Herramienta ===
@tool
def get_chilean_innovation_news(pregunta: str) -> str:
    """Busca informaci√≥n sobre innovaci√≥n, ciencia y tecnolog√≠a en Chile."""
    try:
        client = TavilyClient(api_key=TAVILY_API_KEY)
        response = client.search(query=pregunta, max_results=5)
        results = response.get("results", [])
        if not results:
            return "No se encontraron resultados relevantes."
        formatted = "\n".join([f"- **{r['title']}** ({r['url']})" for r in results])
        return formatted
    except Exception as e:
        return f"‚ö†Ô∏è Error al realizar la b√∫squeda: {e}"

tools = [get_chilean_innovation_news]

# === Prompt del agente ReAct ===
react_prompt_template = """Eres un experto en innovaci√≥n, ciencia y tecnolog√≠a chilena.
Usa las herramientas cuando sea necesario. Responde en espa√±ol neutro, tono profesional.

Herramientas disponibles:
{tools}

Formato EXACTO:
Question: la pregunta
Thought: qu√© vas a hacer
Action: una de [{tool_names}]
Action Input: el input
Observation: resultado
Thought: analiza y sintetiza
Final Answer: respuesta clara y √∫til.

Empecemos.
Question: {input}
Thought:{agent_scratchpad}
"""

prompt = PromptTemplate.from_template(react_prompt_template)

# === Construcci√≥n del agente ===
agent = create_react_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True, handle_parsing_errors=True)

# === Ejecuci√≥n del agente ===
pregunta = "¬øQu√© startups chilenas est√°n aplicando inteligencia artificial o tecnolog√≠as sostenibles en 2025?"
#pregunta = "¬øCu√°les son las √∫ltimas tendencias en innovaci√≥n tecnol√≥gica en Chile?"
#pregunta = "Qu√© es el EVIC de la U de Los Andes?"
#pregunta = "¬øQu√© impacto ha tenido la pandemia en la innovaci√≥n en Chile?"
respuesta = agent_executor.invoke({"input": pregunta})
texto_base = respuesta["output"]

# --- Post-procesamiento con formato Markdown ---
analysis_prompt = f"""
Convierte el siguiente texto en una respuesta en **formato Markdown profesional**:

TEXTO:
{texto_base}

Debes estructurarlo as√≠:

## üß† Resumen general
Breve descripci√≥n en 3‚Äì5 l√≠neas.

## üöÄ Startups chilenas destacadas
Lista de empresas, sector y tecnolog√≠a (en bullets).

## üå± Tecnolog√≠as o tendencias clave
Breve an√°lisis sobre innovaci√≥n, IA o sostenibilidad.

## üîç Conclusi√≥n
Resumen final con enfoque estrat√©gico o impacto pa√≠s.

Formato Markdown claro, limpio y con √≠conos donde apliquen.
"""

# Llama 4 vuelve a dar formato
formatted = llm.invoke([HumanMessage(content=analysis_prompt)])

display(Markdown(formatted.content))

## Agente usando Grok 4 fast razoning

In [None]:
from langchain_oci import ChatOCIGenAI
from langchain.agents import create_tool_calling_agent, AgentExecutor
from langchain_core.prompts import PromptTemplate
from langchain_core.tools import tool
from tavily import TavilyClient


# CONFIGURACI√ìN OCI
COMPARTMENT_ID = "ocid1.compartment.oc1..aaaaaa..."  # Reemplaza con tu Compartment OCID
REGION = "us-chicago-1"

MODEL_ID = "ocid1.generativeaimodel.oc1.us-chicago-1.amaaaaaask7dceyat2iycf2rksgjhlmrmsxakcyjbpxurwmfguxjzptogvqa"


# WRAPPER PARA GROK (Un traductor entre LangChain y Grok) m√°s seguro
class GrokSafeChat(ChatOCIGenAI):
    def _get_model_kwargs(self, **kwargs):
        kwargs.pop("stop", None)
        return super()._get_model_kwargs(**kwargs)

llm = GrokSafeChat(
    model_id=MODEL_ID,
    service_endpoint=f"https://inference.generativeai.{REGION}.oci.oraclecloud.com",
    compartment_id=COMPARTMENT_ID,
    provider="meta",
    model_kwargs={
        "temperature": 0.3,
        "top_p": 0.9,
        "max_tokens": 1000
    },
    auth_type="API_KEY",
    auth_profile="DEFAULT"
)

# TOOL DE B√öSQUEDA
@tool
def get_chilean_innovation_news(pregunta: str) -> str:
    """Busca noticias sobre innovaci√≥n tecnol√≥gica chilena."""
    client = TavilyClient(TAVILY_API_KEY)
    try:
        response = client.search(query=pregunta, max_results=5)
        results = response.get("results", [])
        return "\n".join([f"- {r['title']} ({r['url']})" for r in results]) \
               if results else "No se encontraron resultados."
    except Exception as e:
        return f"Error: {e}"

tools = [get_chilean_innovation_news]


# PROMPT COMPATIBLE CON GROK
prompt = PromptTemplate.from_template("""
Eres un experto en innovaci√≥n, tecnolog√≠a y sostenibilidad chilena.
Usa herramientas cuando aporten valor.
Responde en espa√±ol claro, profesional y actualizado.

Pregunta:
{input}

Razonamiento interno:
{agent_scratchpad}
""")

# AGENTE
agent = create_tool_calling_agent(llm, tools, prompt)

agent_executor = AgentExecutor(
    agent=agent,
    tools=tools,
    verbose=True
)


# EJECUCI√ìN
pregunta = "¬øQu√© startups chilenas est√°n usando inteligencia artificial o tecnolog√≠as sostenibles en 2025?"
respuesta = agent_executor.invoke({"input": pregunta})
texto_base = respuesta["output"]

print("\n--- RESPUESTA DEL AGENTE GROK-4 ---\n")
print(texto_base)


# FORMATEO MARKDOWN

analysis_prompt = f"""
Convierte el siguiente texto en una respuesta en **formato Markdown profesional**:

TEXTO:
{texto_base}

Debes estructurarlo as√≠:

## üß† Resumen general
Breve descripci√≥n en 3‚Äì5 l√≠neas.

## üöÄ Startups chilenas destacadas
Lista de empresas, sector y tecnolog√≠a (en bullets).

## üå± Tecnolog√≠as o tendencias clave
Breve an√°lisis sobre innovaci√≥n, IA o sostenibilidad.

## üîç Conclusi√≥n
Resumen final con enfoque estrat√©gico o impacto pa√≠s.

Formato Markdown claro, limpio y con √≠conos donde apliquen.
"""

# Llamada directa al modelo
formatted = llm.invoke([
    HumanMessage(content=analysis_prompt)
])


# DISPLAY EN NOTEBOOK

display(Markdown(formatted.content))

In [None]:
from langchain_oci import ChatOCIGenAI
from langchain.agents import create_tool_calling_agent, AgentExecutor
from langchain_core.prompts import PromptTemplate
from langchain_core.tools import tool
from langchain_core.messages import HumanMessage
from tavily import TavilyClient
from IPython.display import display, Markdown

# CONFIGURACI√ìN OCI

COMPARTMENT_ID = "ocid1.compartment.oc1..aaaaaaaap..."  # Reemplaza con tu Compartment OCID
REGION = "us-chicago-1"
MODEL_ID = "ocid1.generativeaimodel.oc1.us-chicago-1.amaaaaaask7dceyat2iycf2rksgjhlmrmsxakcyjbpxurwmfguxjzptogvqa"


# WRAPPER PARA GROK

class GrokSafeChat(ChatOCIGenAI):
    def _get_model_kwargs(self, **kwargs):
        kwargs.pop("stop", None)
        return super()._get_model_kwargs(**kwargs)

llm = GrokSafeChat(
    model_id=MODEL_ID,
    service_endpoint=f"https://inference.generativeai.{REGION}.oci.oraclecloud.com",
    compartment_id=COMPARTMENT_ID,
    provider="meta",
    model_kwargs={
        "temperature": 0.3,
        "top_p": 0.9,
        "max_tokens": 1000
    },
    auth_type="API_KEY",
    auth_profile="DEFAULT"
)


# TOOL: BUSQUEDA EXTERNA
@tool
def get_chilean_innovation_news(pregunta: str) -> str:
    """Busca informaci√≥n p√∫blica sobre innovaci√≥n en Chile."""
    client = TavilyClient(TAVILY_API_KEY)
    try:
        response = client.search(query=pregunta, max_results=5)
        results = response.get("results", [])
        return "\n".join([f"- {r['title']} ({r['url']})" for r in results]) \
            if results else "No se encontraron resultados."
    except Exception as e:
        return f"Error: {e}"


# TOOL: DETECT INTENT
@tool
def detect_intent(question: str) -> str:
    """Detecta intenci√≥n de la pregunta."""
    q = question.lower()

    if any(p in q for p in ["qui√©n es", "quien es", "participa", "perfil", "trabaja en"]):
        return "persona"

    if any(p in q for p in ["evento", "evic", "congreso", "seminario"]):
        return "evento"

    if any(p in q for p in ["startup", "empresa", "emprendimiento"]):
        return "startup"

    return "general"


# PROMPT PARA EL AGENTE
prompt = PromptTemplate.from_template("""
Eres un asistente experto en innovaci√≥n chilena.

Reglas:
- Si la pregunta requiere informaci√≥n actual o p√∫blica, debes usar la herramienta.
- Si no es necesario, responde normalmente.

Pregunta:
{input}

Razonamiento:
{agent_scratchpad}
""")


# AGENTE
tools = [get_chilean_innovation_news]

agent = create_tool_calling_agent(llm, tools, prompt)

agent_executor = AgentExecutor(
    agent=agent,
    tools=tools,
    verbose=True
)


# EJECUCI√ìN
#pregunta = "¬øQu√© startups chilenas est√°n usando inteligencia artificial en 2025?"
#pregunta = "¬øKarina Galindez participa en el EVIC 2025?"
pregunta = "¬øCarla Vairetti participa en el EVIC 2025?"

# 1. Detectar intenci√≥n
intent = detect_intent.run(pregunta)

print("\n--- INTENT DETECTADO ---")
print(intent)

# 2. Decidir si usar tool
usar_tool = any([
    intent in ["startup", "evento"],
    any(word in pregunta.lower() for word in ["2025", "2024", "actual", "√∫ltimo"]),
    any(word in pregunta.lower() for word in ["participa", "qui√©n", "quien"])
])


# 3. Ejecutar
if usar_tool:
    respuesta = agent_executor.invoke({"input": pregunta})
    texto_base = respuesta["output"]
else:
    raw = llm.invoke([HumanMessage(content=pregunta)])
    texto_base = raw.content

print("\n--- RESPUESTA DEL AGENTE ---\n")
print(texto_base)


# ETAPA MARKDOWN
analysis_prompt = f"""
Convierte el siguiente texto en una respuesta en **formato Markdown profesional**:

TEXTO:
{texto_base}

Estructura:

## üß† Resumen general
3‚Äì5 l√≠neas.

## üöÄ Puntos clave
Bullets claros.

## üå± Tendencias o tecnolog√≠as
Breve an√°lisis.

## üîç Conclusi√≥n
Enfoque estrat√©gico.

 Usa √≠conos y formato limpio.
"""

formatted = llm.invoke([
    HumanMessage(content=analysis_prompt)
])

# DISPLAY
display(Markdown(formatted.content))
