# Motivación

El propósito principal del siguiente código es elaborar una documentación detallada y completa sobre un script en Python que implementa un modelo de clasificación binaria. Esta documentación busca describir de manera clara y estructurada todos los aspectos relevantes del código, incluyendo su funcionalidad, la lógica detrás de su implementación, las bibliotecas utilizadas, los pasos del proceso de clasificación binaria, y cualquier parámetro configurable. Además, se incluirán ejemplos prácticos, buenas prácticas y recomendaciones para facilitar su uso y adaptación a diferentes contextos.

# 1. Creación del espacio necesario.

Para ejecutar el ejercicio se instalan las librerias a utilizar.

1.1 Librerías de tratamiento de datos

In [None]:
!pip install openai==0.27.0

Collecting openai==0.27.0
  Downloading openai-0.27.0-py3-none-any.whl.metadata (13 kB)
Downloading openai-0.27.0-py3-none-any.whl (70 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m70.1/70.1 kB[0m [31m2.0 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: openai
  Attempting uninstall: openai
    Found existing installation: openai 1.54.4
    Uninstalling openai-1.54.4:
      Successfully uninstalled openai-1.54.4
Successfully installed openai-0.27.0


In [None]:
!pip install fpdf

Collecting fpdf
  Downloading fpdf-1.7.2.tar.gz (39 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Building wheels for collected packages: fpdf
  Building wheel for fpdf (setup.py) ... [?25l[?25hdone
  Created wheel for fpdf: filename=fpdf-1.7.2-py2.py3-none-any.whl size=40704 sha256=263add8d3b99d14ce99c74f813187457e8b0e2386182282885a899c18cba4d62
  Stored in directory: /root/.cache/pip/wheels/f9/95/ba/f418094659025eb9611f17cbcaf2334236bf39a0c3453ea455
Successfully built fpdf
Installing collected packages: fpdf
Successfully installed fpdf-1.7.2


1.2 Se importan las librerías.

Para abrir archivos python, estructurarlos, procesarlos y documentarlos usando GenIa.

In [None]:
import numpy as np
import pandas as pd

In [None]:
from google.colab import files
import nbformat

In [None]:
import openai

In [None]:
from fpdf import FPDF

# 2. Lectura del archivo

La idea es leer el archivo desde un laptop se hace de manera local, desde un dispositivo móvil se tiene la opción de leerlo desde drive.

In [None]:
# Subir el archivo .ipynb
uploaded = files.upload()
for fn in uploaded.keys():
  print('User uploaded file "{name}" with length {length} bytes'.format(
      name=fn, length=len(uploaded[fn])))

# Cargar el notebook
with open(fn, 'r') as f:
  nb = nbformat.read(f, as_version=4)


Saving GenIA_modelo_gb1.ipynb to GenIA_modelo_gb1.ipynb
User uploaded file "GenIA_modelo_gb1.ipynb" with length 60245 bytes


Ahora la idea es procesar el archivo ipynb para dejarlo idóneo en su procesamiento.

In [None]:
# Acceder a la primera celda
first_cell = nb['cells'][0]

# Verificar el tipo de celda
if first_cell['cell_type'] == 'code':
    print("La primera celda es de código:")
    print(first_cell['source'])
elif first_cell['cell_type'] == 'markdown':
    print("La primera celda es de Markdown:")
    print(first_cell['source'])
else:
    print("La primera celda es de otro tipo:")
    print(first_cell)

nb['cells'].pop(5)

# 3. Preparación del modelo generativo

A continuación se especifican los modelos generativos mediante OpenAI con parámetros y prompt necesarios.

In [None]:
#prompt = "Te entregaré una lista que contiene cell_type markdown y code. Cuando es markdown explica lo que la siguiente celda code hará. Necesito que puedas hacer un resumen de lo que hace el código."
prompt = "Te entregaré una lista que contiene cell_type markdown y code. Cuando es markdown explica lo que la siguiente celda code hará. Necesito que puedas hacer un texto para un documento tipo manual de usuario, para que un data scientist pueda entenderlo y poder realizar actualizaciones si así lo requiere. Se pide que el documento sea extenso, con índice y sus secciones."
codigo = nb['cells']

codigo = "; ".join(str(item) for item in codigo)

prompt = prompt + codigo

In [None]:
api_key = ""  # Reemplaza con tu clave API
openai.api_key = api_key

In [None]:
response = openai.ChatCompletion.create(
    #model="gpt-4",  # Puedes usar "gpt-3.5-turbo" si es necesario
    model="gpt-3.5-turbo",  # Puedes usar "gpt-3.5-turbo" si es necesario
    messages=[
        {"role": "system", "content": "Eres un experto en análisis de código y documentando procesos."},
        {"role": "user", "content": prompt}
    ],
    max_tokens=1024,
    temperature=0.7
)

In [None]:
texto_ordenado = response.choices[0].message['content']

# 4. Resultados

Se exporta a un pdf el documento que contiene el resultado del modelo GenIA.

In [None]:
# Clase personalizada para el PDF
class PDF(FPDF):
    def __init__(self):
        super().__init__()
        self.set_auto_page_break(auto=True, margin=15)
        self.add_page()
        self.set_font('Arial', size=12)

# Crear PDF
pdf = PDF()
pdf.multi_cell(0, 10, texto_ordenado)

# Guardar el archivo
archivo_nombre = "documento_modelo_titanic.pdf"
pdf.output(archivo_nombre)

# Descargar el archivo
files.download(archivo_nombre)

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>