# Creación de un Chatbot Básico usando **Fine-Tuning** de OpenAI en Google Colab

## Configuración del Entorno

In [1]:
!pip install openai

Collecting openai
  Downloading openai-1.52.1-py3-none-any.whl.metadata (24 kB)
Collecting httpx<1,>=0.23.0 (from openai)
  Downloading httpx-0.27.2-py3-none-any.whl.metadata (7.1 kB)
Collecting jiter<1,>=0.4.0 (from openai)
  Downloading jiter-0.6.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (5.2 kB)
Collecting httpcore==1.* (from httpx<1,>=0.23.0->openai)
  Downloading httpcore-1.0.6-py3-none-any.whl.metadata (21 kB)
Collecting h11<0.15,>=0.13 (from httpcore==1.*->httpx<1,>=0.23.0->openai)
  Downloading h11-0.14.0-py3-none-any.whl.metadata (8.2 kB)
Downloading openai-1.52.1-py3-none-any.whl (386 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m386.9/386.9 kB[0m [31m7.2 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading httpx-0.27.2-py3-none-any.whl (76 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m76.4/76.4 kB[0m [31m2.9 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading httpcore-1.0.6-py3-none-any.whl (78 kB)
[2K   [90m━━

## Importar las Bibliotecas Necesarias

In [2]:
import openai
import json
import ipywidgets as widgets
from IPython.display import display

openai: Permite interactuar con los servicios de OpenAI (como GPT-3 o GPT-4)

json: Se usa para trabajar con datos en formato JSON, útil para procesar las respuestas de la API

ipywidgets: Crea elementos interactivos en notebooks Jupyter (botones, campos de texto, etc.)

display: Función para mostrar contenido en notebooks

## Configurar la API Key

In [3]:
import os

os.environ['OPENAI_API_KEY'] = 'sk-svcacct-jW7aj1jhhhM4NWeNN1FYmeaGC1qW9WEGx61Pb3W9CxvvteAbD8qqkuqsYtrN-2jcmT3BlbkFJMQeSXMGT5PX_o_hmW_dn4iJCL-MApQKDxWdssSSQNMjYXWkAD6SX3V-KSdyuQ97SwA'


**Explicación:**

import os: Importa el módulo para interactuar con el sistema operativo. os.environ['OPENAI_API_KEY']: Establece una variable de entorno para almacenar la clave API.

## Verificar la Configuración

In [4]:
import os
from openai import OpenAI

# Configura el cliente de OpenAI
client = OpenAI(api_key=os.getenv('OPENAI_API_KEY'))

# Verificar la conexión realizando una solicitud simple
try:
    response = client.models.list()
    print("Conexión exitosa a la API de OpenAI.")
    print(response)
except Exception as e:
    print(f"Error al conectar con la API: {e}")

Conexión exitosa a la API de OpenAI.
SyncPage[Model](data=[Model(id='gpt-4-turbo', created=1712361441, object='model', owned_by='system'), Model(id='gpt-4-turbo-2024-04-09', created=1712601677, object='model', owned_by='system'), Model(id='tts-1', created=1681940951, object='model', owned_by='openai-internal'), Model(id='tts-1-1106', created=1699053241, object='model', owned_by='system'), Model(id='chatgpt-4o-latest', created=1723515131, object='model', owned_by='system'), Model(id='dall-e-2', created=1698798177, object='model', owned_by='system'), Model(id='whisper-1', created=1677532384, object='model', owned_by='openai-internal'), Model(id='gpt-4-turbo-preview', created=1706037777, object='model', owned_by='system'), Model(id='gpt-4o-2024-08-06', created=1722814719, object='model', owned_by='system'), Model(id='gpt-4o', created=1715367049, object='model', owned_by='system'), Model(id='gpt-3.5-turbo-instruct', created=1692901427, object='model', owned_by='system'), Model(id='gpt-4-01

**Explicación:**

openai.Engine.list(): Lista los motores disponibles para verificar la conexión.

## Preparar los Datos para el Fine-Tuning

Vamos a crear un conjunto de datos más amplio en formato .jsonl. En este formato, cada línea representa un ejemplo de entrenamiento y debe tener las claves prompt y completion.

Ejemplo de Datos en JSONL:
Supongamos que estás creando un chatbot educativo y deseas entrenarlo para responder preguntas de manera informativa y educada.

In [5]:
data = [
    {
        "messages": [
            {
                "role": "system",
                "content": "Eres un asistente experto en programación especializado en explicar conceptos de manera clara y concisa."
            },
            {
                "role": "user",
                "content": "¿Qué es un algoritmo?"
            },
            {
                "role": "assistant",
                "content": "Un algoritmo es un conjunto de instrucciones paso a paso diseñadas para realizar una tarea específica o resolver un problema. Puede ser implementado en un programa para automatizar procesos."
            }
        ]
    },
    {
        "messages": [
            {
                "role": "system",
                "content": "Eres un asistente experto en programación especializado en explicar conceptos de manera clara y concisa."
            },
            {
                "role": "user",
                "content": "¿Qué significa 'front-end' en desarrollo web?"
            },
            {
                "role": "assistant",
                "content": "El 'front-end' se refiere a la parte visible de una aplicación web con la que los usuarios interactúan. Incluye tecnologías como HTML, CSS y JavaScript para construir interfaces de usuario."
            }
        ]
    },
    {
        "messages": [
            {
                "role": "system",
                "content": "Eres un asistente experto en programación especializado en explicar conceptos de manera clara y concisa."
            },
            {
                "role": "user",
                "content": "¿Para qué se utiliza Python?"
            },
            {
                "role": "assistant",
                "content": "Python es un lenguaje de programación versátil utilizado para desarrollo web, análisis de datos, inteligencia artificial, automatización de tareas y más. Es conocido por su sintaxis simple y legible."
            }
        ]
    },
    {
        "messages": [
            {
                "role": "system",
                "content": "Eres un asistente experto en programación especializado en explicar conceptos de manera clara y concisa."
            },
            {
                "role": "user",
                "content": "¿Qué es SQL?"
            },
            {
                "role": "assistant",
                "content": "SQL (Structured Query Language) es un lenguaje utilizado para gestionar y manipular bases de datos. Permite realizar consultas, insertar, actualizar y eliminar datos de las tablas de una base de datos."
            }
        ]
    },
    {
        "messages": [
            {
                "role": "system",
                "content": "Eres un asistente experto en programación especializado en explicar conceptos de manera clara y concisa."
            },
            {
                "role": "user",
                "content": "¿Qué es un framework en desarrollo de software?"
            },
            {
                "role": "assistant",
                "content": "Un framework es una estructura predefinida que facilita el desarrollo de software. Proporciona herramientas, bibliotecas y buenas prácticas para construir aplicaciones de manera más rápida y organizada."
            }
        ]
    },
    {
        "messages": [
            {
                "role": "system",
                "content": "Eres un asistente experto en programación especializado en explicar conceptos de manera clara y concisa."
            },
            {
                "role": "user",
                "content": "¿Cuál es la diferencia entre una clase y un objeto?"
            },
            {
                "role": "assistant",
                "content": "Una clase es un molde o plantilla que define las propiedades y comportamientos que tendrán los objetos. Un objeto es una instancia de una clase, es decir, un ejemplar que tiene los atributos y métodos definidos por la clase."
            }
        ]
    },
    {
        "messages": [
            {
                "role": "system",
                "content": "Eres un asistente experto en programación especializado en explicar conceptos de manera clara y concisa."
            },
            {
                "role": "user",
                "content": "¿Qué es JavaScript?"
            },
            {
                "role": "assistant",
                "content": "JavaScript es un lenguaje de programación utilizado principalmente para el desarrollo web. Permite añadir interactividad a las páginas web, como animaciones, formularios dinámicos y efectos visuales."
            }
        ]
    },
    {
        "messages": [
            {
                "role": "system",
                "content": "Eres un asistente experto en programación especializado en explicar conceptos de manera clara y concisa."
            },
            {
                "role": "user",
                "content": "¿Qué es el desarrollo 'back-end'?"
            },
            {
                "role": "assistant",
                "content": "El 'back-end' se refiere a la parte del desarrollo web que gestiona la lógica del servidor, bases de datos y las interacciones que no son visibles para el usuario. Incluye la creación de APIs y el manejo de datos."
            }
        ]
    },
    {
        "messages": [
            {
                "role": "system",
                "content": "Eres un asistente experto en programación especializado en explicar conceptos de manera clara y concisa."
            },
            {
                "role": "user",
                "content": "¿Qué es una base de datos?"
            },
            {
                "role": "assistant",
                "content": "Una base de datos es una colección organizada de datos que se almacena y gestiona electrónicamente. Las bases de datos permiten almacenar grandes cantidades de información de forma estructurada para facilitar su consulta y manipulación."
            }
        ]
    },
    {
        "messages": [
            {
                "role": "system",
                "content": "Eres un asistente experto en programación especializado en explicar conceptos de manera clara y concisa."
            },
            {
                "role": "user",
                "content": "¿Qué es una variable en programación?"
            },
            {
                "role": "assistant",
                "content": "Una variable es un espacio en la memoria de un programa que se utiliza para almacenar datos. Las variables pueden cambiar de valor a lo largo de la ejecución del programa."
            }
        ]
    },
    {
        "messages": [
            {
                "role": "system",
                "content": "Eres un asistente experto en programación especializado en explicar conceptos de manera clara y concisa."
            },
            {
                "role": "user",
                "content": "¿Qué es el lenguaje HTML?"
            },
            {
                "role": "assistant",
                "content": "HTML (HyperText Markup Language) es el lenguaje de marcado estándar para crear páginas web. Define la estructura del contenido, usando etiquetas para elementos como texto, imágenes y enlaces."
            }
        ]
    },
    {
        "messages": [
            {
                "role": "system",
                "content": "Eres un asistente experto en programación especializado en explicar conceptos de manera clara y concisa."
            },
            {
                "role": "user",
                "content": "¿Qué es el protocolo HTTP?"
            },
            {
                "role": "assistant",
                "content": "HTTP (HyperText Transfer Protocol) es un protocolo que permite la comunicación entre clientes (como navegadores web) y servidores. Es la base de la transferencia de datos en la web, permitiendo solicitar y recibir recursos como páginas HTML."
            }
        ]
    },
    {
        "messages": [
            {
                "role": "system",
                "content": "Eres un asistente experto en programación especializado en explicar conceptos de manera clara y concisa."
            },
            {
                "role": "user",
                "content": "¿Qué es la herencia en POO?"
            },
            {
                "role": "assistant",
                "content": "La herencia es un concepto de la programación orientada a objetos que permite que una clase (llamada subclase) herede propiedades y métodos de otra clase (llamada superclase). Esto facilita la reutilización de código."
            }
        ]
    },
    {
        "messages": [
            {
                "role": "system",
                "content": "Eres un asistente experto en programación especializado en explicar conceptos de manera clara y concisa."
            },
            {
                "role": "user",
                "content": "¿Qué es Git?"
            },
            {
                "role": "assistant",
                "content": "Git es un sistema de control de versiones que permite a los desarrolladores rastrear cambios en el código fuente, colaborar en proyectos y revertir a versiones anteriores si es necesario. Es ampliamente utilizado en desarrollo de software."
            }
        ]
    },
    {
        "messages": [
            {
                "role": "system",
                "content": "Eres un asistente experto en programación especializado en explicar conceptos de manera clara y concisa."
            },
            {
                "role": "user",
                "content": "¿Qué significa depurar un programa?"
            },
            {
                "role": "assistant",
                "content": "Depurar un programa significa encontrar y corregir errores o fallos en el código. Es un proceso importante para garantizar que el software funcione correctamente y sin problemas inesperados."
            }
        ]
    }
]


# Guardar los datos en un archivo JSONL
with open("fine_tune_data.jsonl", "w") as f:
    for item in data:
        f.write(json.dumps(item) + "\n")

**Explicación:**

Estructura general:

**data** es un array que contiene varios objetos.
Cada objeto en el array representa una conversación completa.
messages:

Es una lista de mensajes que forman una interacción.

Cada mensaje tiene:

**role:** Define el rol de quien envía el mensaje (system, user, o assistant).
content: Contiene el texto del mensaje.
Roles:

**"system":** Describe el contexto o las reglas bajo las cuales el asistente debe operar. Aquí, se especifica que el asistente es un experto en programación que explica conceptos de manera clara y concisa.

**"user":** Representa al usuario haciendo preguntas.

**"assistant":** Contiene las respuestas del asistente.

Ejemplos de conversaciones:

Primera conversación: El usuario pregunta qué es una API REST, y el asistente responde explicando el concepto.

Segunda conversación: El usuario pregunta sobre la programación orientada a objetos (POO), y el asistente explica los conceptos clave de este paradigma.

**with open("fine_tune_data.jsonl", "w") as f:**

Abre un archivo llamado "fine_tune_data.jsonl" en modo escritura ("w")
El formato .jsonl es para "JSON Lines", donde cada línea es un objeto JSON válido

Usa with para manejar el archivo de forma segura (se cerrará automáticamente)


**for item in data:**

Itera sobre una lista llamada data que contiene los elementos a guardar

Cada item probablemente es un diccionario con los datos a guardar


**f.write(json.dumps(item) + "\n")**

**json.dumps(item):**

Convierte cada elemento (diccionario) a una cadena JSON

**+ "\n":** Añade un salto de línea después de cada elemento

**f.write():** Escribe la línea en el archivo



La idea de este codigo es

Preparar datos para fine-tuning de modelos de IA

Guardar datos estructurados de manera que cada línea sea un registro independiente

Crear archivos que puedan ser procesados línea por línea

## Subir el Archivo a OpenAI

In [6]:
from openai import OpenAIError

try:
    # Abrir el archivo usando with para asegurar que se cierre correctamente
    with open("fine_tune_data.jsonl", "rb") as file:
        file_response = client.files.create(
            file=file,
            purpose='fine-tune'
        )

        # Obtener el ID del archivo
        file_id = file_response.id
        print(f"File ID: {file_id}")

except FileNotFoundError:
    print("Error: No se encontró el archivo fine_tune_data.jsonl")
except OpenAIError as e:
    print(f"Error de OpenAI: {str(e)}")
except Exception as e:
    print(f"Error inesperado: {str(e)}")

File ID: file-2gwD7tZLj4eVWH9pPc2oZbyk


**Explicacion:**

OpenAIError: Clase para manejar errores específicos de OpenAI

open("fine_tune_data.jsonl", "rb"): Abre el archivo en modo lectura binaria

client.files.create(): Sube el archivo a OpenAI

purpose='fine-tune': Indica que el archivo se usará para fine-tuning

**file_id = file_response.id**

**print(f"File ID: {file_id}")**

openai.File.create: Sube el archivo de datos a OpenAI y lo etiqueta para el propósito de fine-tuning.

file_id: Se necesita este ID para referenciar el archivo al iniciar el fine-tuning.

## Iniciar el Fine-Tuning

Usa el ID del archivo para iniciar el proceso de fine-tuning:


In [7]:
try:
    # Crear el trabajo de fine-tuning
    fine_tune_response = client.fine_tuning.jobs.create(
        training_file=file_id,
        model="gpt-3.5-turbo"
    )

    # Obtener el ID del proceso de fine-tuning
    fine_tune_id = fine_tune_response.id
    print(f"Fine-tune ID: {fine_tune_id}")

except OpenAIError as e:
    print(f"Error de OpenAI: {str(e)}")
except Exception as e:
    print(f"Error inesperado: {str(e)}")

Fine-tune ID: ftjob-f3nOT3sKvMzojUifg1jiFupk


Explicacion:

**client.fine_tuning.jobs.create():** Crea un nuevo trabajo de fine-tuning

**training_file:** El ID del archivo que subimos previamente

**model:** El modelo base a utilizar (en este caso gpt-3.5-turbo)

**fine_tune_id = fine_tune_response.id**
**print(f"Fine-tune ID: {fine_tune_id}")**

Guarda el ID del proceso de fine-tuning

Lo muestramos en pantalla

## Verificar el Estado del Fine-Tuning

El proceso de entrenamiento puede tomar tiempo, así que puedes verificar el estado usando:

In [8]:
try:

    failed_job = client.fine_tuning.jobs.retrieve(fine_tune_id)

    # Obtener los errores y detalles
    print("\nDetalles del error:")
    print(f"Estado: {failed_job.status}")
    print(f"Mensaje de error: {failed_job.error}")

    # Obtener los logs para más detalles
    logs = client.fine_tuning.jobs.list_events(fine_tune_id)
    print("\nRegistro de eventos:")
    for event in logs.data:
        print(f"{event.created_at}: {event.message}")

except OpenAIError as e:
    print(f"Error de OpenAI: {str(e)}")
except Exception as e:
    print(f"Error inesperado: {str(e)}")


Detalles del error:
Estado: validating_files
Mensaje de error: Error(code=None, message=None, param=None)

Registro de eventos:
1729651843: Validating training file: file-2gwD7tZLj4eVWH9pPc2oZbyk
1729651843: Created fine-tuning job: ftjob-f3nOT3sKvMzojUifg1jiFupk


**Explciacion:**

**client.fine_tuning.jobs.retrieve():** Obtiene información sobre el trabajo de fine-tuning

**fine_tune_id**: El ID del trabajo que queremos consultar

**print(f"Estado: {failed_job.status}")**


Accede al estado actual del proceso
Los estados posibles incluyen:

"validating"

"queued"

"running"

"succeeded"

"failed"

"cancelled"

**print(f"\nDetalles del trabajo:")**
**print(f"Modelo base: {status_response.model}")**
**print(f"Tiempo de creación: {status_response.created_at}")**
**print(f"Estado final: {status_response.finished_at if status_response.finished_at else 'En proceso'}")**

Muestra información adicional útil

Incluye el modelo base usado

Muestra timestamps de creación y finalización

## Usar el Modelo Fine-Tuneado

Una vez que el modelo esté listo, puedes probarlo realizando peticiones:

In [9]:
models = client.models.list()
for model in models.data:
    print(model.id)

# Crear la caja de texto para el prompt
prompt_input = widgets.Textarea(
    placeholder='Escribe tu pregunta aquí...',
    description='Prompt:',
    layout=widgets.Layout(width='90%', height='100px')
)

# Crear el botón para enviar la pregunta
submit_button = widgets.Button(
    description='Generar Respuesta',
    button_style='primary'
)

# Crear el área de texto para mostrar la respuesta
response_output = widgets.Output()

#Modelo con Fine tuning
model_fine_tuning ="ft:gpt-3.5-turbo-0125:personal::AKxiv3c4"

print(model_fine_tuning)

# Función para manejar el evento del botón
def generate_response(b):
    with response_output:
        response_output.clear_output()
        try:
            # Llamar a la API de OpenAI para obtener la respuesta
            response = client.chat.completions.create(
                model=model_fine_tuning,
                messages=[
                     {"role": "user", "content": prompt_input.value}
               ],
              max_tokens=100,
              temperature=0.7
            )

            # Mostrar la respuesta
            print("Respuesta:", response.choices[0].message.content.strip())
        except Exception as e:
            print("Error:", e)

# Asignar la función al botón
submit_button.on_click(generate_response)

# Mostrar los elementos de la GUI
display(prompt_input, submit_button, response_output)

gpt-4-turbo
gpt-4-turbo-2024-04-09
tts-1
tts-1-1106
chatgpt-4o-latest
dall-e-2
whisper-1
gpt-4-turbo-preview
gpt-4o-2024-08-06
gpt-4o
gpt-3.5-turbo-instruct
gpt-4-0125-preview
gpt-3.5-turbo
gpt-3.5-turbo-0125
babbage-002
davinci-002
gpt-4o-realtime-preview-2024-10-01
dall-e-3
gpt-4o-realtime-preview
gpt-4o-mini
gpt-4o-2024-05-13
gpt-4o-mini-2024-07-18
gpt-4o-audio-preview-2024-10-01
gpt-4o-audio-preview
tts-1-hd
tts-1-hd-1106
gpt-4-1106-preview
text-embedding-ada-002
gpt-3.5-turbo-16k
text-embedding-3-small
text-embedding-3-large
gpt-3.5-turbo-1106
gpt-4-0613
gpt-4
gpt-3.5-turbo-instruct-0914
ft:gpt-3.5-turbo-0125:personal::AKxiv11U:ckpt-step-60
ft:gpt-3.5-turbo-0125:personal::AKxivOyL:ckpt-step-75
ft:gpt-3.5-turbo-0125:personal::AKxiv3c4
ft:gpt-3.5-turbo-0125:personal::AKxiv3c4


Textarea(value='', description='Prompt:', layout=Layout(height='100px', width='90%'), placeholder='Escribe tu …

Button(button_style='primary', description='Generar Respuesta', style=ButtonStyle())

Output()