# OpenAI
---

[OpenAI](https://openai.com/) es una empresa de investigación y desarrollo de inteligencia artificial (IA) con sede en San Francisco, California. Fue fundada en 2015 con el objetivo de promover y desarrollar IA amigable y beneficios para la humanidad. OpenAI se dedica a avanzar en el campo de la IA y realizar investigaciones novedosas en áreas como el procesamiento del lenguaje natural, la visión por computadora y la robótica.

<center> <img src="https://drive.google.com/uc?export=view&id=1wNUZyK7x3nkM-i-Q-AYPNqldJrNiKAx8" width="50%"> </center>

OpenAI ha creado y publicado una serie de modelos y herramientas de IA de alta importancia, incluido el modelo de lenguaje GPT (Generative Pre-trained Transformer) y su sucesor GPT-3. Estos modelos han demostrado una capacidad impresionante para generar texto coherente y comprensible, y se han utilizado en una amplia gama de aplicaciones, desde chatbots y asistentes virtuales hasta la redacción automática y la traducción automática.

Actualmente, podemos utilizar varios de los modelos que ha implementado OpenAI. Más precisamente, con la librería `openai` en _Python_ podemos realizar inferencia de forma sencilla, veamos la instalación:

In [None]:
!pip install openai

Adicional a esto, vamos a importar algunas utilidades generales:

In [None]:
from IPython.display import display

## **1. Autenticación**
---

Para poder utilizar los modelos de OpenAI debemos [crear una cuenta](https://platform.openai.com/signup) para uso con el API:

In [None]:
#@markdown ##**Ejecute esta celda para ver el video.**
from IPython.display import IFrame
IFrame(
        src="https://drive.google.com/file/d/1WS56kzn6SyfCizDGA4i6Fpws5Cc6HH22/preview",
        width="768px",
        height="432px"
        )

> **Nota**: para esto debe introducir una tarjeta bancaria válida. A nivel personal los gastos son mínimos pero es importante que tenga cuidado al momento de manejar los datos de acceso.

Adicional a esto, para poder conectarnos con los servidores de OpenAI, necesitamos los siguientes dos elementos:

- **Organization ID**: es un identificador personal (usuario) o de la empresa correspondiente.

In [None]:
#@markdown ##**Ejecute esta celda para ver el video.**
from IPython.display import IFrame
IFrame(
        src="https://drive.google.com/file/d/12muJDDxJlSTW-UWAniDn-yC3lj6Qfjqy/preview",
        width="768px",
        height="432px"
        )

Debe agregar el id de la organización en la siguiente variable:

In [None]:
org_id = ...

- **API Key**: es una clave de acceso que funciona como una contraseña para la autenticación con OpenAI.

In [None]:
#@markdown ##**Ejecute esta celda para ver el video.**
from IPython.display import IFrame
IFrame(
        src="https://drive.google.com/file/d/15nroVfNSd6aETB6MYKveUnyyx6DbTIg8/preview",
        width="768px",
        height="432px"
        )

Debe agregar la clave en la siguiente variable:

> **Nota**: debe tener mucho cuidado de **NO COMPARTIR** su API Key con ninguna persona. Con esta llave cualquier persona puede usar los servicios pagos de OpenAI y esto puede implicar pérdidas económicas. Evite compartir este notebook en ningún medio.

In [None]:
api_key = ...

Con estos dos elementos, podemos definir la autenticación con la librería `openai`:

In [None]:
import openai

openai.api_key = api_key
openai.organization = org_id

## **2. Modelos**
---

OpenAI ofrece distintos LLMs basados en la arquitectura GPT, originalmente había dos variantes:

1. **GPT (Generative Pre-trained Transformer)**: Es uno de los modelos más conocidos de OpenAI y ha pasado por varias iteraciones, incluyendo GPT-2 y GPT-3. Estos modelos se entrenaron en una gran cantidad de datos no supervisados y son capaces de generar texto coherente y relevante en diferentes contextos. Actualmente, es usado en herramientas como ChatGPT o BingChat.
2. **Codex**: OpenAI también ha lanzado Codex, un modelo de lenguaje específicamente diseñado para programación. Codex puede comprender y generar código fuente en varios lenguajes de programación; ha demostrado ser una herramienta útil para desarrolladores y programadores. Actualmente, es usado en herramientas como Github Copilot o AWS CodeWhisperer.

Estos modelos se utilizaban en tareas como autocompletado o edición de texto. No obstante, con la salida de GPT-3.5 (usado en ChatGPT) estos tipos de enfoques pasaron a estar desactualizados. Los modelos actuales cumplen ambas tareas y muchas otras más en forma de un chat inteligente, donde las tareas más específicas se pueden lograr por medio de instrucciones, lineamientos y guías. Más específicamente, estos modelos pueden cumplir tareas como:

- Seguir instrucciones.
- Question-answening.
- Generación de texto.
- Traducción automática.
- Corrección de textos
- Entre otras.

Actualmente, en aplicaciones con texto se suelen usar principalmente dos modelos:

- `GPT-3.5`: modelos que pueden entender y generar lenguaje natural y código.
- `GPT-4`: modelos que tienen un mejor desempeño en comparación con GPT-3.5 y que pueden llegar a incluir otras modalidades de información como imágenes.

Veamos los modelos disponibles desde _Python_:

In [None]:
models = openai.Model.list()["data"]
names = list(map(lambda x: x["id"], models))
display(names)

Como podemos ver, hay varios modelos. No obstante, la gran mayoría hacen parte de modelos de segunda y tercera generación que aún son soportados, pero no se recomienda su uso en aplicaciones nuevas. En este caso vamos a utilizar un modelo GPT-3.5 como el que se usa en ChatGPT:

In [None]:
model_name = "gpt-3.5-turbo"

## **3. Chat**
---

Empezar a utilizar los LLMs de OpenAI desde _Python_ es un proceso sencillo y no requiere mucho entendimiento del funcionamiento de los modelos. Es decir, a diferencia de cuando trabajamos con la librería `transformers`, en este caso nunca llegaremos a interactuar directamente con un modelo, únicamente obtendremos la respuesta de la inferencia y el histórico de la conversación.

Es necesario acotar los elementos generales de una conversación en OpenAI:

<center> <img src="https://drive.google.com/uc?export=view&id=1un8x9v1hLiH_2_ZUOilLEdGEmdWpI7NA" width="100%"> </center>

- **Conversación**: secuencia de mensajes.
- **Mensaje**: Texto asociado a un rol.
- **Rol**: específica quién emitió el mensaje. Este puede ser `user` (la persona que interactúa con el chat), `assistant` (el modelo) o `system` (información del contexto).

Adicionalmente, es importante entender que un **contexto** hace referencia a una temática general que se conserva a lo largo de toda la conversación. Normalmente, se usa para especializar el asistente con el que estamos conversando.

Veamos un ejemplo de contexto:

In [None]:
context = "Eres un programador experto en Python con conocimientos en procesamiento de lenguaje natural."

> **Nota**: el contexto muchas veces se utiliza para especificar la tarea que va a cumplir el modelo. Por esto, ya no es tan común seleccionar un tipo de modelo específico para una tarea puntual. En lugar usamos un modelo general y lo especializamos durante la conversación.

Con esto, podemos comenzar a definir una conversación inicializada con el contexto. Cada mensaje debe ser un diccionario que contenga los campos `role` (Rol) y `content` (contenido del mensaje):

In [None]:
conversation = [{"role": "system", "content": context}]

Ahora, agregamos un mensaje con lo que deseamos consultar al modelo siguiendo la misma estructura de mensaje:

In [None]:
msg = {"role": "user", "content": "Cómo puedo tokenizar un texto?"}

Agregamos el mensaje a la conversación:

In [None]:
conversation.append(msg)

Finalmente, utilizamos la utilidad de chat de `openai` para obtener una respuesta.

In [None]:
response = openai.ChatCompletion.create(model=model_name, messages=conversation)

Veamos la respuesta:

In [None]:
display(response)

Vamos a agregar la respuesta a la conversación:

In [None]:
conversation.append(dict(response["choices"][0]["message"]))

Podemos ver la conversación hasta este punto:

In [None]:
display(conversation)

Vamos a agregar otro mensaje como respuesta:

In [None]:
msg = {"role": "user", "content": "dame un ejemplo con spacy"}
conversation.append(msg)

Generamos la respuesta:

In [None]:
response = openai.ChatCompletion.create(
    model=model_name,
    messages=conversation,
)

Veamos la respuesta:

In [None]:
display(response)

Por último, podemos utilizar hiperparámetros adicionales para modificar el comportamiento de los modelos con el método `create`. Entre estos tenemos:

- `temperature`: Valor entre 0 y 2 que indica qué tan deterministas son las respuestas de los modelos. Entre más alto sea este valor, las respuestas pueden ser más creativas, pero también pueden ser incoherentes.
- `top_p`: Es una alternativa al valor de temperatura. Se trata de una probabilidad acumulada (entre 0 y 1) para seleccionar los tokens más probables durante la generación.
- `n`: Número de respuestas que se generarán.
- `max_tokens`: Número máximo de tokens a generar en la respuesta.
- `presence_penalty`: Número entre -2 y 2. Los valores positivos penalizan los nuevos tokens basado en si ya han sido usados anteriormente.
- `frequency_penalty`: Número entre -2 y 2. Los valores positivos penalizan los nuevos tokens en dependencia de su ocurrencia en el texto.

Veamos un ejemplo del efecto de la temperatura. Primero veamos un caso determinista con temperatura baja, la siguiente celda siempre generará la misma salida cuando la ejecute:

In [None]:
conv = [
        {"role": "system", "content": "Act as a linux terminal interpreter, I'll give you commands and you must generate the output as it the command was executed in a real terminal."},
        {"role": "user", "content": "ls"}
        ]
response = openai.ChatCompletion.create(
    model=model_name,
    messages=conv,
    temperature=0.0
)
print(response)

Veamos un ejemplo con un valor mayor de temperatura (si ejecuta la celda varias veces, el resultado puede variar) y acotando el número máximo de tokens a generar `max_tokens` :

In [None]:
conv = [
        {"role": "system", "content": "Act as a linux terminal interpreter, I'll give you commands and you must generate the output as it the command was executed in a real terminal."},
        {"role": "user", "content": "ls"}
        ]
response = openai.ChatCompletion.create(
    model=model_name,
    messages=conv,
    temperature=2.0,
    max_tokens=10
)
print(response)

## **Recursos Adicionales**
---

Los siguentes enlaces corresponden a las sitios donde encontrará información util para profundizar en los temas vistos en este taller guiado:

- [OpenAI libraries](https://platform.openai.com/docs/libraries).
- [OpenAI Models](https://platform.openai.com/docs/models).