# OpenAI API

## Instalar la librería de OpenAI

En primer lugar, para poder usar la API de OpenAI, es necesario instalar la librería de OpenAI. Para ello, ejecutamos el siguiente comando

In [None]:
%pip install --upgrade openai

## Importar la librería de OpenAI

Una vez está instalada la librería, la importamos para poder usarla en nuestro código.

In [1]:
import openai

## Obtener una API Key

Para poder usar la API de OpenAI, es necesario obtener una API Key. Para ello, nos dirigimos a la página de [OpenAI](https://openai.com/), y nos registramos. Una vez registrados, nos dirigimos a la sección de [API Keys](https://platform.openai.com/api-keys), y creamos una nueva API Key.

![open ai api key](https://raw.githubusercontent.com/maximofn/alfred/main/gifs/openaix2.gif)

Una vez la tenemos le decimoa a la API de openai cúal es nuestra API Key.

In [None]:
api_key = "Pon aquí tu API key"

In [5]:
api_key = "..."

## Creamos nuestro primer chatbot

Con la API de OpenAI es muy sencillo crear un simple chatbot, al que le vamos a pasar un prompt, y nos va a devolver una respuesta

En primer lugar tenemos que elgir qué modelo vamos a usar, en mi caso voy a usar el modelo `gpt-3.5-turbo-1106` que a día de hoy es un buen modelo para este post, ya que para lo que vamos a hacer no necesitamos usar el mejor modelo. OpenAI tiene una lista con todos sus [modelos](https://platform.openai.com/docs/models) y una página con los [precios](https://openai.com/pricing)

In [104]:
model = "gpt-3.5-turbo-1106"

Ahora tenemos que crear un cliente que será el que se comunique con la API de OpenAI.

In [6]:
client = openai.OpenAI(api_key=api_key, organization=None)

Como vemos le hemos pasado nuestra API Key. Además se le puede pasar la organización, pero en nuestro caso no es necesario.

Creamos el prompt

In [105]:
promtp = "Cuál es el mejor lenguaje de programación para aprender?"

Y ya podemos pedirle una respuesta a OpenAI

In [106]:
response = client.chat.completions.create(
  model=model,
  messages=[{"role": "user", "content": f"{promtp}"}],
)

Veamos cómo es la respuesta

In [107]:
type(response), response

(openai.types.chat.chat_completion.ChatCompletion,
 ChatCompletion(id='chatcmpl-8OhC6yRcFXQI7yqx0oOSHc6sGaaP4', choices=[Choice(finish_reason='stop', index=0, message=ChatCompletionMessage(content='No hay un "mejor" lenguaje de programación para aprender, ya que depende de tus objetivos y de qué tipo de desarrollo te interesa. Algunos lenguajes populares para principiantes incluyen Python, JavaScript, Java, C# y Ruby. Sin embargo, es importante tener en cuenta qué tipo de proyectos quieres realizar en el futuro, ya que cada lenguaje tiene sus propias ventajas y desventajas. Lo mejor es investigar un poco sobre cada lenguaje y decidir cuál se adapta mejor a tus intereses y objetivos.', role='assistant', function_call=None, tool_calls=None))], created=1700896602, model='gpt-3.5-turbo-1106', object='chat.completion', system_fingerprint='fp_eeff13170a', usage=CompletionUsage(completion_tokens=124, prompt_tokens=21, total_tokens=145)))

In [108]:
print(f"response.id = {response.id}")
print(f"response.choices = {response.choices}")
for i in range(len(response.choices)):
    print(f"response.choices[{i}] = {response.choices[i]}")
    print(f"\tresponse.choices[{i}].finish_reason = {response.choices[i].finish_reason}")
    print(f"\tresponse.choices[{i}].index = {response.choices[i].index}")
    print(f"\tresponse.choices[{i}].message = {response.choices[i].message}")
    content = response.choices[i].message.content.replace('\n\n', '\n\t\t')
    print(f"\t\tresponse.choices[{i}].message.content = \n\t\t{content}")
    print(f"\t\tresponse.choices[{i}].message.role = {response.choices[i].message.role}")
    print(f"\t\tresponse.choices[{i}].message.function_call = {response.choices[i].message.function_call}")
    print(f"\t\tresponse.choices[{i}].message.tool_calls = {response.choices[i].message.tool_calls}")
print(f"response.created = {response.created}")
print(f"response.model = {response.model}")
print(f"response.object = {response.object}")
print(f"response.system_fingerprint = {response.system_fingerprint}")
print(f"response.usage = {response.usage}")
print(f"\tresponse.usage.completion_tokens = {response.usage.completion_tokens}")
print(f"\tresponse.usage.prompt_tokens = {response.usage.prompt_tokens}")
print(f"\tresponse.usage.total_tokens = {response.usage.total_tokens}")

response.id = chatcmpl-8OhC6yRcFXQI7yqx0oOSHc6sGaaP4
response.choices = [Choice(finish_reason='stop', index=0, message=ChatCompletionMessage(content='No hay un "mejor" lenguaje de programación para aprender, ya que depende de tus objetivos y de qué tipo de desarrollo te interesa. Algunos lenguajes populares para principiantes incluyen Python, JavaScript, Java, C# y Ruby. Sin embargo, es importante tener en cuenta qué tipo de proyectos quieres realizar en el futuro, ya que cada lenguaje tiene sus propias ventajas y desventajas. Lo mejor es investigar un poco sobre cada lenguaje y decidir cuál se adapta mejor a tus intereses y objetivos.', role='assistant', function_call=None, tool_calls=None))]
response.choices[0] = Choice(finish_reason='stop', index=0, message=ChatCompletionMessage(content='No hay un "mejor" lenguaje de programación para aprender, ya que depende de tus objetivos y de qué tipo de desarrollo te interesa. Algunos lenguajes populares para principiantes incluyen Python, Jav

Como podemos ver nos devuelve muchísima información

Por ejemplo `response.choices[0].finish_reason = stop` significa que el modelo ha parado de generar texto porque ha llegado al final del prompt. Esto nos viene muy bien para depurar, ya que los posibles valores son `stop` que significa que la API devolvió el mensaje completo, `length` que significa que la salida del modelo fue incompleta debido a que era más larga que `max_tokens` o límite de token del modelo, `function_call` el modelo decidió llamar a una función, `content_filter` que significa que el contenido fue omitido por una limitación de contenido de OpenAI y `null` que significa que la respuesta de la API fue incompleta

También nos da información de los tokens para poder llevar un control del dinero gastado

### Parámetros

A la hora de pedir una respuesta a OpenAI, podemos pasarle una serie de parámetros para que nos devuelva una respuesta más acorde a lo que queremos. Vamos a ver cuáles son los parámetros que podemos pasarle

 * `messages`: Lista de mensajes que se le han enviado al chatbot
 * `model`: Modelo que queremos usar
 * `frequency_penalty`: Penalización de frecuencia. Cuanto mayor sea el valor, menos probable será que el modelo repita la misma respuesta
 * `max_tokens`: Número máximo de tokens que puede devolver el modelo
 * `n`: Número de respuestas que queremos que nos devuelva el modelo
 * `presence_penalty`: Penalización de presencia. Cuanto mayor sea el valor, menos probable será que el modelo repita la misma respuesta
 * `seed`: Semilla para la generación de texto
 * `stop`: Lista de tokens que indican que el modelo debe parar de generar texto
 * `stream`: Si es `True` la API devolverá una respuesta cada vez que el modelo genere un token. Si es `False` la API devolverá una respuesta cuando el modelo haya generado todos los tokens
 * `temperature`: Cuanto mayor sea el valor, más creativo será el modelo
 * `top_p`: Cuanto mayor sea el valor, más creativo será el modelo
 * `user`: ID del usuario que está hablando con el chatbot
 * `timeout`: Tiempo máximo que queremos esperar a que la API nos devuelva una respuesta

Veamos algunos

#### Messages

Podemos pasarle a la API una lista de mensajes que se le han enviado al chatbot. Esto es útil para pasarle el historial de conversaciones al chatbot, y que así pueda generar una respuesta más acorde a la conversación. Y para condicionar la respuesta del chatbot a lo que se le ha dicho anteriormente.

Además podemos pasarle un mensaje de sistema para indicarle cómo se tiene que comportar

##### Historial de conversaciones

Vamos a ver un ejemplo del hisotrial de conversaciones, primero le preguntamos que cómo está

In [112]:
promtp = "Hola, soy MaximoFN, ¿Cómo estás?"

response = client.chat.completions.create(
  model=model,
  messages=[{"role": "user", "content": f"{promtp}"}],
)
content = response.choices[0].message.content.replace('\n\n', '\n\t\t')
print(content)

Hola MaximoFN, soy un modelo de inteligencia artificial diseñado para conversar y ayudar en lo que necesites. ¿En qué puedo ayudarte hoy?


Nos ha respondido que no tiene sentimientos y que en qué puede ayudarnos. Así que si ahora le pregunto cómo me llamo no va a saber responderme

In [113]:
promtp = "¿Me puedes decir cómo me llamo?"

response = client.chat.completions.create(
  model=model,
  messages=[{"role": "user", "content": f"{promtp}"}],
)
content = response.choices[0].message.content.replace('\n\n', '\n\t\t')
print(content)

Lo siento, no tengo esa información. Pero puedes decírmelo tú.


Para solucionar esto, le pasamos el historial de conversaciones

In [117]:
promtp = "¿Me puedes decir cómo me llamo?"

response = client.chat.completions.create(
  model=model,
  messages=[
      {"role": "user", "content": "Hola, soy MaximoFN, ¿Cómo estás?"},
      {"role": "assistant", "content": "Hola MaximoFN, soy un modelo de inteligencia artificial diseñado para conversar y ayudar en lo que necesites. ¿En qué puedo ayudarte hoy?"},
      {"role": "user", "content": f"{promtp}"},
  ],
)
content = response.choices[0].message.content.replace('\n\n', '\n\t\t')
print(content)

Tu nombre es MaximoFN.


##### Condicionamiento mediante ejemplos

Ahora veamos un ejemplo de cómo condicionar la respuesta del chatbot a lo que se le ha dicho anteriormente. Ahora le preguntamos cómo obtener la lista de archivos en un directorio en la terminal

In [121]:
promtp = "¿Cómo puedo listar los archivos de un directorio en la terminal?"

response = client.chat.completions.create(
  model=model,
  messages=[{"role": "user", "content": f"{promtp}"}],
)
content = response.choices[0].message.content.replace('\n\n', '\n\t\t')
print(content)

En la terminal de un sistema operativo Unix o Linux, puedes listar los archivos de un directorio utilizando el comando `ls`. Por ejemplo, si quieres listar los archivos del directorio actual, simplemente escribe `ls` y presiona Enter. Si deseas listar los archivos de un directorio específico, puedes proporcionar la ruta del directorio después del comando `ls`, por ejemplo `ls /ruta/del/directorio`. Si deseas ver más detalles sobre los archivos, puedes usar la opción `-l` para obtener una lista detallada o `-a` para mostrar también los archivos ocultos.


Si ahora le condicionamos con ejemplos de respuestas cortas, veamos qué nos contesta

In [124]:
promtp = "¿Cómo puedo listar los archivos de un directorio en la terminal?"

response = client.chat.completions.create(
  model=model,
  messages=[
      {"role": "user", "content": "Obtener las 10 primeras líneas de un archivo"},
      {"role": "assistant", "content": "head -n 10"},
      {"role": "user", "content": "Encontrar todos los archivos con extensión .txt"},
      {"role": "assistant", "content": "find . -name '*.txt"},
      {"role": "user", "content": "Dividir un archivo en varias páginas"},
      {"role": "assistant", "content": "split -l 1000"},
      {"role": "user", "content": "Buscar la dirección IP 12.34.56.78"},
      {"role": "assistant", "content": "nslookup 12.34.56.78"},
      {"role": "user", "content": "Obtener las 5 últimas líneas de foo.txt"},
      {"role": "assistant", "content": "tail -n 5 foo.txt"},
      {"role": "user", "content": "Convertir ejemplo.png en JPEG"},
      {"role": "assistant", "content": "convert example.png example.jpg"},
      {"role": "user", "content": "Create a git branch named 'new-feature"},
      {"role": "assistant", "content": "git branch new-feature"},
      {"role": "user", "content": f"{promtp}"},
  ],
)
content = response.choices[0].message.content.replace('\n\n', '\n\t\t')
print(content)

Puede usar el comando `ls` en la terminal para listar los archivos de un directorio. Por ejemplo:
```
ls
```
Muestra los archivos y directorios en el directorio actual.


Hemos conseguido que de una respuesta más corta

##### Condicionamiento con mensaje de sistema

Le podemos pasar un mensaje de sistema para indicarle cómo se tiene que comportar.

In [126]:
promtp = "¿Cómo puedo listar los archivos de un directorio en la terminal?"

response = client.chat.completions.create(
  model=model,
  messages=[
      {"role": "system", "content": "Eres un experto asistente de terminal de ubuntu que responde solo con comandos de terminal"},
      {"role": "user", "content": f"{promtp}"},
  ],
)
content = response.choices[0].message.content.replace('\n\n', '\n\t\t')
print(content)

Puedes listar los archivos de un directorio en la terminal usando el comando `ls`. Por ejemplo, para listar los archivos del directorio actual, simplemente escribe `ls` y presiona Enter. Si quieres listar los archivos de un directorio específico, puedes utilizar `ls` seguido de la ruta del directorio. Por ejemplo, `ls /ruta/del/directorio`.


In [128]:
promtp = "¿Cómo puedo listar los archivos de un directorio en la terminal?"

response = client.chat.completions.create(
  model=model,
  messages=[
      {"role": "system", "content": "Eres un experto asistente de terminal de ubuntu que responde solo con comandos de terminal"},
      {"role": "user", "content": "Obtener las 10 primeras líneas de un archivo"},
      {"role": "assistant", "content": "head -n 10"},
      {"role": "user", "content": "Encontrar todos los archivos con extensión .txt"},
      {"role": "assistant", "content": "find . -name '*.txt"},
      {"role": "user", "content": "Dividir un archivo en varias páginas"},
      {"role": "assistant", "content": "split -l 1000"},
      {"role": "user", "content": "Buscar la dirección IP 12.34.56.78"},
      {"role": "assistant", "content": "nslookup 12.34.56.78"},
      {"role": "user", "content": "Obtener las 5 últimas líneas de foo.txt"},
      {"role": "assistant", "content": "tail -n 5 foo.txt"},
      {"role": "user", "content": "Convertir ejemplo.png en JPEG"},
      {"role": "assistant", "content": "convert example.png example.jpg"},
      {"role": "user", "content": "Create a git branch named 'new-feature"},
      {"role": "assistant", "content": "git branch new-feature"},
      {"role": "user", "content": f"{promtp}"},
  ],
)
content = response.choices[0].message.content.replace('\n\n', '\n\t\t')
print(content)

Puedes listar los archivos de un directorio en la terminal utilizando el comando "ls". Por ejemplo, para listar los archivos en el directorio actual, puedes ejecutar el comando "ls". Si deseas listar los archivos de otro directorio, simplemente especifica el directorio después del comando "ls", por ejemplo "ls /ruta/al/directorio".


#### Número máximo de tokens de la respuesta

Podemos limitar el número de tokens que puede devolver el modelo. Esto es útil para que el modelo no se pase de la respuesta que queremos.

In [136]:
promtp = "¿Cuál es el mejor lenguaje de programación para aprender?"

response = client.chat.completions.create(
  model = model,
  messages = [{"role": "user", "content": f"{promtp}"}],
  max_tokens = 50,
)

content = response.choices[0].message.content.replace('\n\n', '\n\t\t')
print(content)
print(f"\nresponse.choices[{i}].finish_reason = {response.choices[i].finish_reason}")

La respuesta a esta pregunta puede variar dependiendo de los intereses y objetivos individuales, ya que cada lenguaje de programación tiene sus propias ventajas y desventajas. Sin embargo, algunos de los lenguajes más

response.choices[0].finish_reason = length


Como vemos la respuesta se corta a medias porque superaría el límite de tokens. Además ahora el motivo de parada es `length` en vez de `stop`

#### Creatividad del modelo mediante la temperatura

Podemos hacer que el modelo sea más creativo mediante la temperatura. Cuanto mayor sea el valor, más creativo será el modelo

In [152]:
promtp = "¿Cuál es el mejor lenguaje de programación para aprender?"
temperature = 0

response = client.chat.completions.create(
  model = model,
  messages = [{"role": "user", "content": f"{promtp}"}],
  temperature = temperature,
)

content_0 = response.choices[0].message.content.replace('\n\n', '\n\t\t')
print(content_0)

No hay un "mejor" lenguaje de programación para aprender, ya que la elección depende de los intereses y objetivos individuales. Algunos lenguajes populares para principiantes incluyen Python, JavaScript, Java y C#. Cada uno tiene sus propias ventajas y desventajas, por lo que es importante investigar y considerar qué tipo de desarrollo de software te interesa antes de elegir un lenguaje para aprender.


In [153]:
promtp = "¿Cuál es el mejor lenguaje de programación para aprender?"
temperature = 1

response = client.chat.completions.create(
  model = model,
  messages = [{"role": "user", "content": f"{promtp}"}],
  temperature = temperature,
)

content_1 = response.choices[0].message.content.replace('\n\n', '\n\t\t')
print(content_1)

No hay un "mejor" lenguaje de programación para aprender, ya que la elección depende de los objetivos y preferencias individuales del programador. Sin embargo, algunos lenguajes populares para principiantes incluyen Python, JavaScript, Java y C++. Estos lenguajes son relativamente fáciles de aprender y tienen una amplia gama de aplicaciones en la industria de la tecnología. Es importante considerar qué tipo de proyectos o campos de interés te gustaría explorar al momento de elegir un lenguaje de programación para aprender.


In [154]:
print(content_0)
print(content_1)

No hay un "mejor" lenguaje de programación para aprender, ya que la elección depende de los intereses y objetivos individuales. Algunos lenguajes populares para principiantes incluyen Python, JavaScript, Java y C#. Cada uno tiene sus propias ventajas y desventajas, por lo que es importante investigar y considerar qué tipo de desarrollo de software te interesa antes de elegir un lenguaje para aprender.
No hay un "mejor" lenguaje de programación para aprender, ya que la elección depende de los objetivos y preferencias individuales del programador. Sin embargo, algunos lenguajes populares para principiantes incluyen Python, JavaScript, Java y C++. Estos lenguajes son relativamente fáciles de aprender y tienen una amplia gama de aplicaciones en la industria de la tecnología. Es importante considerar qué tipo de proyectos o campos de interés te gustaría explorar al momento de elegir un lenguaje de programación para aprender.


#### Creatividad del modelo mediante el top_p

Podemos hacer que el modelo sea más creativo mediante el parámetro `top_p`. Cuanto mayor sea el valor, más creativo será el modelo

In [155]:
promtp = "¿Cuál es el mejor lenguaje de programación para aprender?"
top_p = 0

response = client.chat.completions.create(
  model = model,
  messages = [{"role": "user", "content": f"{promtp}"}],
  top_p = top_p,
)

content_0 = response.choices[0].message.content.replace('\n\n', '\n\t\t')
print(content_0)

No hay un "mejor" lenguaje de programación para aprender, ya que la elección depende de los intereses y objetivos individuales. Algunos lenguajes populares para principiantes incluyen Python, JavaScript, Java y C#. Cada uno tiene sus propias ventajas y desventajas, por lo que es importante investigar y considerar qué tipo de desarrollo de software te interesa antes de elegir un lenguaje para aprender.


In [156]:
promtp = "¿Cuál es el mejor lenguaje de programación para aprender?"
top_p = 1

response = client.chat.completions.create(
  model = model,
  messages = [{"role": "user", "content": f"{promtp}"}],
  top_p = top_p,
)

content_1 = response.choices[0].message.content.replace('\n\n', '\n\t\t')
print(content_1)

El mejor lenguaje de programación para aprender depende de los objetivos del aprendizaje y del tipo de programación que se quiera realizar. Algunos lenguajes de programación populares para principiantes incluyen Python, Java, JavaScript y Ruby. Sin embargo, cada lenguaje tiene sus propias ventajas y desventajas, por lo que es importante considerar qué tipo de proyectos o aplicaciones se quieren desarrollar antes de elegir un lenguaje de programación para aprender. Python es a menudo recomendado por su facilidad de uso y versatilidad, mientras que JavaScript es ideal para la programación web.


In [157]:
print(content_0)
print(content_1)

No hay un "mejor" lenguaje de programación para aprender, ya que la elección depende de los intereses y objetivos individuales. Algunos lenguajes populares para principiantes incluyen Python, JavaScript, Java y C#. Cada uno tiene sus propias ventajas y desventajas, por lo que es importante investigar y considerar qué tipo de desarrollo de software te interesa antes de elegir un lenguaje para aprender.
El mejor lenguaje de programación para aprender depende de los objetivos del aprendizaje y del tipo de programación que se quiera realizar. Algunos lenguajes de programación populares para principiantes incluyen Python, Java, JavaScript y Ruby. Sin embargo, cada lenguaje tiene sus propias ventajas y desventajas, por lo que es importante considerar qué tipo de proyectos o aplicaciones se quieren desarrollar antes de elegir un lenguaje de programación para aprender. Python es a menudo recomendado por su facilidad de uso y versatilidad, mientras que JavaScript es ideal para la programación w

#### Número de respuestas

Podemos pedirle a la API que nos devuelva más de una respuesta. Esto es útil para que el modelo nos devuelva varias respuestas y así poder elegir la que más nos guste, para esto vamos a poner los parámetros `temperature` y `top_p` a 1 para que el modelo sea más creativo

In [151]:
promtp = "¿Cuál es el mejor lenguaje de programación para aprender?"
temperature = 1
top_p = 1

response = client.chat.completions.create(
  model = model,
  messages = [{"role": "user", "content": f"{promtp}"}],
  temperature = temperature,
  top_p = top_p,
  n = 4
)

content_0 = response.choices[0].message.content.replace('\n\n', '\n\t\t')
content_1 = response.choices[1].message.content.replace('\n\n', '\n\t\t')
content_2 = response.choices[2].message.content.replace('\n\n', '\n\t\t')
content_3 = response.choices[3].message.content.replace('\n\n', '\n\t\t')
print(content_0)
print(content_1)
print(content_2)
print(content_3)

El mejor lenguaje de programación para aprender depende de tus objetivos y del tipo de aplicaciones que te interese desarrollar. Algunos de los lenguajes más populares para aprender son:
		1. Python: Es un lenguaje de programación versátil, fácil de aprender y con una amplia comunidad de desarrolladores. Es ideal para principiantes y se utiliza en una gran variedad de aplicaciones, desde desarrollo web hasta inteligencia artificial.
		2. JavaScript: Es el lenguaje de programación más utilizado en el desarrollo web. Es imprescindible para aquellos que quieren trabajar en el ámbito del desarrollo frontend y backend.
		3. Java: Es un lenguaje de programación muy popular en el ámbito empresarial, por lo que aprender Java puede abrirte muchas puertas laborales. Además, es un lenguaje estructurado que te enseñará conceptos importantes de la programación orientada a objetos.
		4. C#: Es un lenguaje de programación desarrollado por Microsoft que se utiliza especialmente en el desarrollo de apl

## Reentrenar modelo de OpenAI

OpenAI ofrece la posibilidad de reentrenar sus modelos de la API para obtener mejores resultados sobre nuestros propios datos. Esto tiene las siguientes ventajas

 + Se obtienen resultados de mayor calidad para nuestros datos
 + En un prompt podemos darle ejemplos para que se comporte como queramos, pero solo unos pocos. De esta manera, reentrenándolo podemos darle muchos más.
 + Ahorro de tokens debido a indicaciones más cortas. Como ya le hemos entrenado para nuestro caso de uso, podemos darle menos indicaciones para que resuelva nuestras tareas
 + Solicitudes de menor latencia. Al llamar a modelos propios tendremos menos latencia

### Preparación de los datos

La API de OpenAI nos pide que le demos los datos en el siguiente formato

``` python
{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What's the capital of France?"}, {"role": "assistant", "content": "Paris, as if everyone doesn't know that already."}]}
{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "Who wrote 'Romeo and Juliet'?"}, {"role": "assistant", "content": "Oh, just some guy named William Shakespeare. Ever heard of him?"}]}
{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "How far is the Moon from Earth?"}, {"role": "assistant", "content": "Around 384,400 kilometers. Give or take a few, like that really matters."}]}
```

Con un máximo de 4096 tokens

#### Validación de los datos

Podemos recolectar nuestros datos en formatos más cómodos, como por ejemplo `CSV`s y mediante un script que nos dan en OpenAI convertirlos a su formato. Por lo que yo he preparado un `CSV` para cada uno de los post de mi blog con el siguiente formato

``` csv
prompt,completion
¿Qué cubre la Introducción a Python en el material proporcionado?,"La Introducción a Python cubre temas como tipos de datos, operadores, uso de funciones y clases, manejo de objetos iterables y uso de módulos. [Más información](https://maximofn.com/python/)"
¿Cuáles son los tipos de datos básicos en Python?,"Python tiene 7 tipos de datos básicos: texto (`str`), numéricos (`int`, `float`, `complex`), secuencias (`list`, `tuple`, `range`), mapping (`dict`), sets (`set`, `frozenset`), booleanos (`bool`) y binarios (`bytes`, `bytearray`, `memoryview`). [Más información](https://maximofn.com/python/)"
¿Qué son y cómo se utilizan los operadores en Python?,"Los operadores en Python son símbolos especiales que se utilizan para realizar operaciones como suma, resta, multiplicación y división entre variables y valores. También incluyen operadores lógicos para comparaciones. [Más información](https://maximofn.com/python/)"
¿Cómo se define y se utiliza una función en Python?,"En Python, una función se define usando la palabra clave `def`, seguida del nombre de la función y paréntesis. Las funciones pueden tener parámetros y devolver valores. Se utilizan para encapsular lógica que se puede reutilizar a lo largo del código. [Más información](https://maximofn.com/python/)"
¿Qué son las clases en Python y cómo se utilizan?,"Las clases en Python son la base de la programación orientada a objetos. Permiten crear objetos que encapsulan datos y funcionalidades. Las clases se definen usando la palabra clave `class`, seguida del nombre de la clase. [Más información](https://maximofn.com/python/)"
...
```

Cada `CSV` tiene 10 `FAQ`s

Voy a hacer un código que coja cada `CSV` y genere dos nuevos, uno de entrenamiento y otro de validación

In [None]:
import os

CSVs_path = "openai"

for file in os.listdir(CSVs_path):
    if file.endswith(".csv"):
        print(os.path.join(CSVs_path, file))

: 