# Workshop: Introducci√≥n a Generative AI en Oracle y Creaci√≥n de Agentes con LangChain

Bienvenidos al workshop. En esta sesi√≥n vamos a explorar c√≥mo usar los **servicios de IA generativa de Oracle** para resolver problemas reales y luego **crear un agente inteligente** usando **LangChain** que pueda interactuar con estos servicios.

## Objetivos de la sesi√≥n
- Conocer la oferta de **Oracle Cloud Infrastructure (OCI Generative AI)** y c√≥mo integrarla desde Python.
- Ejecutar peticiones a modelos de lenguaje para **generar texto** de manera controlada.
- Construir un **agente con LangChain** que use herramientas (como SQL o RAG) para responder preguntas de forma aut√≥noma.
- Aprender buenas pr√°cticas para **orquestar flujos de trabajo** y extender capacidades de los modelos.

## Requisitos previos
- Conocimientos b√°sicos de Python üêç
- Tener acceso a una cuenta de **Oracle Cloud** con permisos para usar **OCI Generative AI**
- Familiaridad b√°sica con entornos virtuales y Jupyter Notebooks.

> üí° **Tip:** este notebook est√° dise√±ado para ser pr√°ctico y paso a paso. Podr√°s copiar, ejecutar y modificar el c√≥digo para experimentar con los conceptos que vamos a explicar.

¬°Vamos a empezar!

## A continuaci√≥n... 

üì∞ Recopilaremos noticias sobre el F√∫tbol argentino 

ü§ñ Consumiremos un modelo de lenguaje alojado en Oracle Cloud 

üîç Construiremos un agente con langchain que es capaz de responder a preguntas relacionadas con el F√∫tbol argentino

## Instalaci√≥n

In [None]:
!pip install tavily-python
!pip install -U langchain-community langchain-core oci

In [None]:
import requests
from langchain_core.tools import tool
from typing import Dict, List
import re
from tavily import TavilyClient
import oci
import json
from oci.auth.signers import get_resource_principals_signer
from oci.config import from_file
from langchain_core.messages import HumanMessage
from langchain_community.chat_models import ChatOCIGenAI
from langchain.agents import AgentExecutor, create_react_agent
from langchain_core.prompts import PromptTemplate
from IPython.display import Markdown, display
import json


Nuestro agente necesita acceso a la web para acceder a las √∫ltimas noticias del tema que le hemos indicado, para esto, es necesario configurar una herramienta que le permita a nuestro agente navegar por portales de noticias, por eso usaremos [Tavily](https://www.tavily.com/).

## ü™™ Registro en Tavily (paso a paso)

1) Abre **https://app.tavily.com/home** y haz clic en **Sign Up**. Verifica tu correo electr√≥nico para activar la cuenta. ![image1](./images/tavily_signup.png)
2) Inicia sesi√≥n: en la **p√°gina principal** ver√°s tu **API Key**. Haz **Copy** para copiarla. ![image2](./images/api_key.png)


In [None]:
# Pega la API Key de Tavily aqu√≠
TAVILY_API_KEY = "pega_aqui_tu_api_key"

In [None]:
assert TAVILY_API_KEY != "pega_aqui_tu_api_key", "Por favor, pega tu API Key de Tavily en la variable TAVILY_API_KEY"

In [None]:
ARG_FUTBOL_DOMAINS = [
    "ole.com.ar", "tycsports.com", "espn.com.ar", "lanacion.com.ar",
    "clarin.com", "infobae.com", "afa.com.ar", "promiedos.com.ar"
]
@tool
def get_futbol_argentino_comprehensive_news(pregunta:str=" Busca info de f√∫tbol argentino (fixtures, TV, entradas, tabla, √°rbitros, etc.") -> str:
    """Devuelve info/noticias de Fiestas Patrias en Chile (fondas, ramadas, Parada Militar, feriados, normas)."""

    client = TavilyClient(TAVILY_API_KEY)
    response = client.search(
    query=pregunta,
    #include_domains=ARG_FUTBOL_DOMAINS,
    #topic="news",
    #days=45,
    #max_results=10
    )
    return response

## Configuraci√≥n de la autenticaci√≥n del SDK de OCI

Desde este notebook es necesario acceder a algunos servicios de Oracle, como el servicio de Generative AI, aunque ejecutes este notebook en cloud o de forma local, es necesario configurar las credenciales en la m√°quina que realiza el consumo del servicio. 

```
En los pasos anteriores fue necesario descargar un archivo terminado en .pem y copiar una configuraci√≥n con el siguiente estilo
[DEFAULT]
user=ocid1.user.oc1..
fingerprint=95:e1:09
tenancy=ocid1.tenancy.oc1..
region= 
```

A continuaci√≥n usaremos esos objetos.

In [None]:
# crea carpeta y permisos
!mkdir -p /home/datascience/.oci

In [None]:
# Ver tu HOME y listar (incluye ocultos)
!echo $HOME
!ls -la $HOME | head -n 30

In [None]:
!mkdir -p ~/.oci
!ls -la ~/.oci


Ahora vamos a ubicar la llave privada que descargamos en los pasos anteriores al generar el API Key. El archivo tendr√° un nombre similar a ‚Äútu_usuario-a√±o-mes-diaTHH_MM_SS.XXX.pem‚Äù.

Este archivo debe renombrarse como ‚Äúoci_api_key.pem‚Äù y cargarse en Data Science utilizando la opci√≥n ‚ÄúUpload Files‚Äù, o bien arrastr√°ndolo directamente en el men√∫ izquierdo del navegador.

Una vez que el archivo est√© cargado, podremos proceder con la ejecuci√≥n de la siguiente l√≠nea.

In [None]:
!mv ~/oci_api_key.pem ~/.oci/oci_api_key.pem
!chmod 600 ~/.oci/oci_api_key.pem
!ls -la ~/.oci

A continuaci√≥n, crearemos el archivo de configuraci√≥n en la ruta ~/.oci/config, vamos a copiar los valores de la configuraci√≥n mostrada en pantalla y a reemplazarlos en la siguiente l√≠nea.

Reemplazaremos _ocid1.user.oc1.._ por el ocid del usuario mostrado en pantalla
Reemplazaremos _fingerprint_ por el figerprint mostrado en pantalla
Reemplazaremos _fingerprint_ por el figerprint mostrado en pantalla
Reemplazaremos _fingerprint_ por el figerprint mostrado en pantalla
üö® No reemplazaremos _key_file_ por ninguna ruta si estamos ejecutando este notebook en DataScience. Si queremos ejecutar este notebook de forma local, podemos reemplazar la ruta por ~/.oci/nombre_de_la_key.pem 

In [None]:
%%bash
cat > ~/.oci/config <<'CFG'
[DEFAULT]
user=ocid1.user.oc1..
fingerprint=95:e1:09
tenancy=ocid1.tenancy.oc1..
region=
key_file=/home/datascience/.oci/oci_api_key.pem
CFG

echo "Config creado en ~/.oci/config"
cat ~/.oci/config | sed 's/fingerprint=.*/fingerprint=<oculto>/'

In [None]:
# Quita posibles finales de l√≠nea de Windows (CRLF)
!sed -i 's/\r$//' ~/.oci/config

# mostrar
!sed -n '1,200p' ~/.oci/config

In [None]:
config = from_file()

In [None]:
# Descomenta √∫nicamente la l√≠nea que corresponda a tu regi√≥n
#REGION = "sa-saopaulo-1"
#REGION = "us-chicago-1"
#REGION = "uk-london-1"
#REGION = "eu-frankfurt-1"
#REGION = "ap-osaka-1"

In [None]:
assert REGION in ["sa-saopaulo-1", "us-chicago-1", "uk-london-1", "eu-frankfurt-1", "ap-osaka-1"], "Por favor, descomenta la l√≠nea que corresponda a tu regi√≥n"

In [None]:
# Aqu√≠ debes pegar el OCID de tu compartimento
# Encuentra el OCID de tu compartimento en la consola de Oracle Cloud, en la secci√≥n de Compartments https://cloud.oracle.com/identity/compartments
COMPARTMENT_ID = "ocid1.compartment.oc1...."

In [None]:
SERVICE_ENDPOINT = f"https://inference.generativeai.{REGION}.oci.oraclecloud.com"
MODEL_ID = "ocid1.generativeaimodel.oc1.us-chicago-1.amaaaaaask7dceya6dvgvvj3ovy4lerdl6fvx525x3yweacnrgn4ryfwwcoq"

In [None]:
if MODEL_ID is None:
    from oci.generative_ai import GenerativeAiClient
    genai = GenerativeAiClient()
    models = genai.list_models(
        compartment_id=COMPARTMENT_ID,
        capability=["CHAT"],
        lifecycle_state="ACTIVE"
    ).data.items
    assert models, "No hay modelos CHAT visibles en el compartimento. Revisa permisos/compartimento."
    MODEL_ID = models[0].id
    print("Usando modelo:", MODEL_ID)

# === Cliente de inferencia ===
inf = oci.generative_ai_inference.GenerativeAiInferenceClient(
    config=config,
    service_endpoint=SERVICE_ENDPOINT
)

# === Prompt del usuario ===
user_input = "Qu√© partidos se juegan esta semana y d√≥nde verlos??"

# --- Construcci√≥n del request ---
content = oci.generative_ai_inference.models.TextContent(text=user_input)
message = oci.generative_ai_inference.models.Message(role="USER", content=[content])

chat_request = oci.generative_ai_inference.models.GenericChatRequest(
    api_format=oci.generative_ai_inference.models.BaseChatRequest.API_FORMAT_GENERIC,
    messages=[message],
    max_tokens=600,
    temperature=1.0,
    frequency_penalty=0.0,
    presence_penalty=0.0,
    top_p=0.75,
)

chat_detail = oci.generative_ai_inference.models.ChatDetails(
    serving_mode=oci.generative_ai_inference.models.OnDemandServingMode(model_id=MODEL_ID),
    chat_request=chat_request,
    compartment_id=COMPARTMENT_ID,
)

# === Llamada ===
resp = inf.chat(chat_detail)

# === Resultado ===
choices = resp.data.chat_response.choices
response_text = choices[0].message.content[0].text if choices else "No se gener√≥ respuesta."
print(json.dumps({"response": response_text}, indent=2, ensure_ascii=False))

## ü§ñ Creaci√≥n del Agente LangChain

In [None]:
# Configura tu endpoint y compartimento
ENDPOINT = f"https://inference.generativeai.{REGION}.oci.oraclecloud.com"

llm = ChatOCIGenAI(
  model_id="meta.llama-4-maverick-17b-128e-instruct-fp8",
  service_endpoint=ENDPOINT,
  compartment_id=COMPARTMENT_ID,
  provider="meta",
  model_kwargs={
    "temperature": 0.3, 
    "max_tokens": 800,   
    "top_p": 0.8,  
    "frequency_penalty": 0,
    "presence_penalty": 0,
  },
  auth_type="API_KEY",
  auth_profile="DEFAULT"
)

tools = [get_futbol_argentino_comprehensive_news]

react_prompt_template = """Sos un asistente experto en **f√∫tbol argentino**.
Respond√© en espa√±ol rioplatense y us√° las herramientas cuando sumen valor.

Reglas:
- Tras usar una herramienta, **resum√≠ con tus palabras** (no pegues el JSON).
- Prioriz√° info **reciente y confiable** (AFA, medios DEPORTIVOS locales).
- Inclu√≠ **fecha**, **hora**, **canal/stream**, **estadio**, **entradas** cuando aplique.
- Si hay versiones distintas entre medios, se√±alalo breve.

Herramientas disponibles:
{tools}

Formato EXACTO:
Question: la pregunta
Thought: qu√© vas a hacer
Action: una de [{tool_names}]
Action Input: el input
Observation: resultado de la acci√≥n
Thought: analiz√° y sintetiz√°
Final Answer: respuesta clara y √∫til

Empecemos.
Question: {input}
Thought:{agent_scratchpad}"""

prompt = PromptTemplate.from_template(react_prompt_template)
agent = create_react_agent(llm, tools, prompt)

agent_executor = AgentExecutor(
    agent=agent,
    tools=tools,
    verbose=True,
    max_iterations=6,
    stream_runnable=False,
    handle_parsing_errors=True
)
preguntas_demo = [
    "¬øQu√© partidos se juegan esta semana en la Copa de la Liga y d√≥nde verlos?",
    "Entradas para River vs. Boca, ¬øprecios y c√≥mo comprar?",
    "Tabla y promedios actualizados, ¬øqui√©n pelea el descenso?",
    "¬øQui√©n es el √°rbitro de Racing esta fecha?"
]
for p in preguntas_demo:
    print("\n\n=== PREGUNTA ===\n", p)
    out = agent_executor.invoke({"input": p})
    print("\n--- RESPUESTA ---\n", out["output"])

In [None]:
# === 1) Ejecutamos UNA PREGUNTA y guardamos 'respuesta' ===
pregunta = "¬øQu√© partidos se juegan esta semana en la Copa de la Liga y d√≥nde verlos?"
respuesta = agent_executor.invoke({"input": pregunta})
print("\n--- RESPUESTA DEL AGENTE ---\n", respuesta["output"])

# === 2) Post-procesado / an√°lisis en Markdown con la misma 'pregunta' y 'respuesta' ===
from IPython.display import Markdown, display
from langchain_core.messages import HumanMessage
import json

def _to_text(x):
    if isinstance(x, dict):
        return x.get("output") or json.dumps(x, ensure_ascii=False, indent=2)
    return str(x)

insumos = _to_text(respuesta)

analysis_prompt = f"""
Sos un analista especializado en **f√∫tbol argentino**.
Us√° solo los datos entregados m√°s abajo para responder en **espa√±ol rioplatense**, claro y √∫til.

**DATOS RECOLECTADOS** (pueden incluir JSON):  
{insumos}

---

### TAREAS
1. Respond√© directamente a la pregunta: **"{pregunta}"**.
2. Extra√© y organiz√°, si est√° disponible:
   - **torneo / fecha**
   - **partidos (local vs. visitante)**
   - **d√≠a y hora**
   - **estadio / ciudad**
   - **TV / streaming (canales, apps)**
   - **√°rbitro y VAR**
   - **entradas (venta, precios, links oficiales)**
   - **bajas/lesionados/suspendidos o convocados**
   - **tabla / posiciones / promedios**
   - **enlaces √∫tiles**
3. Si hay diferencias entre medios, mencion√° brevemente el conflicto y cu√°l parece m√°s confiable.
4. Si algo **no figura en los datos**, marc√°: *No disponible*.

---

### FORMATO (Markdown)

## Resumen
- 3‚Äì5 l√≠neas con lo esencial (partidos clave, horarios, TV, nota destacada).

## Partidos y TV (si hay datos)
- **Partido** ‚Äî Estadio ‚Äî **D√≠a/Hora** ‚Äî **TV/Streaming** ‚Äî Enlace

## Entradas y acceso (si hay datos)
- Punto breve con c√≥mo comprar, precios y link oficial.

## √Årbitros y Bajas (si hay datos)
- √Årbitro/VAR; lesionados/suspendidos/convocados relevantes.

## Tabla y promedios (si hay datos)
- Nota corta o links a la tabla si aparece en los datos.

## Fuentes
- Lista de URLs citadas (solo si aparecen en los datos).

---

### REGLAS
- **No inventes** datos ni enlaces.
- Prioriz√° informaci√≥n **reciente y confiable** (AFA, TyC, Ol√©, ESPN, Promiedos).
"""

analysis_response = llm.invoke([HumanMessage(content=analysis_prompt)])
display(Markdown(analysis_response.content))