# ‚öôÔ∏è Ejercicio 03 ‚Äì Uso de Oracle Generative AI (LLM) con SDK de Python

## üéØ Objetivo del laboratorio

Este laboratorio muestra c√≥mo **ejecutar solicitudes a modelos de lenguaje (LLM)** disponibles en **Oracle Cloud Infrastructure (OCI)** usando el **SDK de Python** y autenticaci√≥n mediante **Resource Principal** o **archivo de configuraci√≥n local** (`~/.oci/config`).

A trav√©s de un ejemplo pr√°ctico, aprender√°s a:

* Configurar correctamente el entorno local y las credenciales del SDK.
* Crear y verificar la conexi√≥n con el servicio **Generative AI Inference**.
* Construir una solicitud (*chat request*) tipo conversaci√≥n con texto.
* Invocar un modelo de lenguaje y obtener una respuesta en formato JSON.

El objetivo final es entender c√≥mo el SDK gestiona los par√°metros del modelo (tokens, temperatura, `top_p`, etc.) y c√≥mo integrar esta llamada dentro de flujos de inferencia, notebooks o pipelines en OCI Data Science.

---

## üß© Contexto

Oracle ofrece una serie de modelos **Generative AI** accesibles por API, compatibles con chat, summarization, embeddings, clasificaci√≥n, entre otros.

En este laboratorio se usa un **modelo de tipo ‚ÄúCHAT‚Äù**, identificado mediante su **OCID** (`MODEL_ID`), desplegado en la regi√≥n `us-chicago-1`. El flujo emplea el cliente `GenerativeAiInferenceClient` del SDK `oci`, que permite conectarse directamente al endpoint:

```python
SERVICE_ENDPOINT = "https://inference.generativeai.us-chicago-1.oci.oraclecloud.com"
```

---

## ‚öôÔ∏è Pasos principales

1. **Configuraci√≥n de autenticaci√≥n**

   * Crear la carpeta `~/.oci/` y colocar el archivo `config` con los par√°metros: `user`, `tenancy`, `region`, `fingerprint`, `key_file`. # Si ya hiciste el ejercicio 01 omite el primer punto)
 
2. **Inicializaci√≥n del cliente**

   * Importar y configurar `GenerativeAiInferenceClient` con el `signer` y el `SERVICE_ENDPOINT`.

3. **Creaci√≥n de la solicitud**

   * Construir un objeto `GenericChatRequest` con el texto del usuario, los par√°metros del modelo (`temperature`, `max_tokens`, `top_p`, etc.), y el rol `"USER"`.

4. **Ejecuci√≥n e interpretaci√≥n de la respuesta**

   * Enviar la solicitud mediante `inf.chat(chat_detail)` y visualizar la respuesta formateada en JSON.

---

## üß† Ejemplo de salida

```json
{
  "response": "\"Llama\" puede tener diferentes significados dependiendo del contexto..."
}
```

El modelo interpreta el prompt textual y devuelve una respuesta estructurada con contexto, demostrando el flujo completo de **pregunta ‚Üí inferencia ‚Üí respuesta generativa**.

---



In [None]:
!oci --version

## 01 - Configuraci√≥n de la autenticaci√≥n del SDK de OCI ( si ya ejecutaste el ejercicio 01, no es necesario ejecutar estos pasos, puedes pasar al paso 2)

In [None]:
# crea carpeta y permisos
#!mkdir -p /home/datascience/.oci

In [None]:
# Ver tu HOME y listar (incluye ocultos)
#!echo $HOME
#!ls -la $HOME | head -n 30

In [None]:
#!mkdir -p ~/.oci
#!ls -la ~/.oci

In [None]:
# %%bash
# cat > ~/.oci/config <<'CFG'
# [DEFAULT]
# user=ocid1.user.oc1..
# tenancy=ocid1.tenancy.oc1..a
# region=us-chicago-1
# fingerprint=6d:a2:b6:25:24:40:11:
# key_file=/home/datascience/.oci/oci_api_key.pem
# CFG

# echo "Config creado en ~/.oci/config"
# cat ~/.oci/config | sed 's/fingerprint=.*/fingerprint=<oculto>/'

In [None]:
# Quita posibles finales de l√≠nea de Windows (CRLF)
# !sed -i 's/\r$//' ~/.oci/config

# # mostrar
# !sed -n '1,200p' ~/.oci/config

# 2. Usando los Modelos de LLM usando Python

In [None]:
user_input = "qu√© es llama?"

In [None]:
import oci
import json
from oci.auth.signers import get_resource_principals_signer

In [None]:
# === Config ===
REGION = "us-chicago-1"
SERVICE_ENDPOINT = f"https://inference.generativeai.{REGION}.oci.oraclecloud.com" #NO MODIFICAR
COMPARTMENT_ID = "ocid1.compartment.oc1...." #PARAMETRO A ACTUALIZAR
MODEL_ID = "ocid1.generativeaimodel.oc1.us-chicago-1.amaaaaaask7dceya6dvgvvj3ovy4lerdl6fvx525x3yweacnrgn4ryfwwcoq" #NO MODIFICAR

In [None]:

# === Signer===
signer = get_resource_principals_signer()
cfg = {"region": REGION}

# (opcional)
if MODEL_ID is None:
    from oci.generative_ai import GenerativeAiClient
    genai = GenerativeAiClient(config=cfg, signer=signer)
    models = genai.list_models(
        compartment_id=COMPARTMENT_ID,
        capability=["CHAT"],
        lifecycle_state="ACTIVE"
    ).data.items
    assert models, "No hay modelos CHAT visibles en el compartimento. Revisa permisos/compartimento."
    MODEL_ID = models[0].id
    print("Usando modelo:", MODEL_ID)

# === Cliente de inferencia ===
inf = oci.generative_ai_inference.GenerativeAiInferenceClient(
    config=cfg, signer=signer, service_endpoint=SERVICE_ENDPOINT
)

# === Prompt del usuario ===
user_input = user_input

# --- Construcci√≥n del request ---
content = oci.generative_ai_inference.models.TextContent(text=user_input)
message = oci.generative_ai_inference.models.Message(role="USER", content=[content])

chat_request = oci.generative_ai_inference.models.GenericChatRequest(
    api_format=oci.generative_ai_inference.models.BaseChatRequest.API_FORMAT_GENERIC,
    messages=[message],
    max_tokens=600,
    temperature=1.0,
    frequency_penalty=0.0,
    presence_penalty=0.0,
    top_p=0.75,
)

chat_detail = oci.generative_ai_inference.models.ChatDetails(
    serving_mode=oci.generative_ai_inference.models.OnDemandServingMode(model_id=MODEL_ID),
    chat_request=chat_request,
    compartment_id=COMPARTMENT_ID,
)



In [None]:
# === Llamada ===
resp = inf.chat(chat_detail)

# === Resultado ===
choices = resp.data.chat_response.choices
response_text = choices[0].message.content[0].text if choices else "No se gener√≥ respuesta."
print(json.dumps({"response": response_text}, indent=2, ensure_ascii=False))