![title](./images/logo_nao_digital.png)

# 1 Interactuando con ChatGPT para el análisis de información 

## 1. Objetivo

El presente reporte tiene por objeto introducir los elementos básicos que nos permitan entender las capacidades de ChatGPT, los principios en los que se basa dicha herramienta y la forma en que podemos interactuar con el mismo para analizar información texto a partir de su API (interfaz de programación de aplicaciones, por sus siglas en inglés).

En adición, también se presentarán algunas librerias para interactuar con ChatGPT a partir de información en texto presente en documentos con diferentes formatos.

# 2. Elementos sobre ChatGPT

## 2.1 ¿Qué es ChatGPT?

[ChatGPT](https://chat.openai.com/) en una herramienta de inteligencia articifial lanzada en el año 2022 por la empresa OpenAI. Su funcionamiento es el de un chatbot interactivo capaz de mantener conversaciones con usuarios, responder preguntas y proporcionar información relevante sobre una variedad de temas.

Dicha herramienta pertenece a los modelos generativos de lenguaje, es decir, un modelo computacional diseñado para comprender y generar texto de manera coherente y contextual a partir de indicaciones en texto introducidar por las personas.

Para ejemplificar sus capacidades, a continuación se presenta la interacción con este Chatbot:

**Figura 1: Ejemplo de conversación de ChatGPT**

![chatgpt_1.png](attachment:chatgpt_1.png)

Aquí se obtuvo una respuesta informativa acerca de la pregunta que le hicimos al bot con respecto a los eclipses.

Al respecto cabe destacar las siguientes partes de la interacción

* **Prompt:** el conjunto de instrucciones de entrada. En esta caso el prompt consistió en el texto `Explica un eclipse solar en términos simples.`
* **Respuesta o salida (output):** Se refiere al texto que el Chatbot nos proporcionó como resultado de nuestra instrucción. 

ChatGPT está disponible al público en general de manera gratuita para realizar consultar con algunas limitaciones al tiempo que también ofrece versiones comerciales.


## 2.2 ¿Cuál es la teoría detrás de ChatGPT?

ChatGPT se basa en modelos de aprendizaje profundo, llamados *redes neuronales*, que se especializan en aprender la información subyacentes de un conjunto de datos de texto que se les proveen como ejemplo y luego usar ese conocimiento para generar nuevos datos relacionados con las preguntas que reciben como entrada.

El diseño de tales redes utiliza una arquitectura de red neural llamada GPT (*Generative Pre-trained Transformer*), que permite capturar patrones complejos del lenguaje humano (como similaridad en significado, importancia de la posición del texto, etcétera).

El punto de partida de tal proceso es entrenar un modelo al que se le presentan grandes cantidades de texto de ejemplo para aprender patrones y estructuras del lenguaje. En una etapa posterior, se realiza un ajuste en el que se incorpora 

Luego, en la etapa de ajuste fino, donde al modelo se especializa en tareas específicas de conversación como ChatBot en el que se introduce retroalimentación con un framework de aprendizaje por refuerzo, de forma que se puede mejorar su capacidad para producir respuestas coherentes y cohesivas a partir de las interacciones con los usuarios.

Por otro lado, se debe mencionar que a éste tipo de modelo generativos, se les ha denominado en tiempos recientes como *Large Language Models*, donde la palabra inglesa *Large* se emplean por dos razones principales:

1) Generalmente necesitan un cantidad de datos de entrenamiento con un volumen enorme, como datos de foros de internet o post de redes sociales y
2) Cuentan con una cantidad enorme de parámetros -cantidades numéricas que codifican la información aprende- a ser calibrados. De hecho los modelos actuales rondan el orden de billones de parámetros y por ello  su entrenamiento de modelos requiere de amplio poder computacional.

Adicionalmente, podemos añadir que en la práctica obtener un buen resultado a partir de instrucciones de entrada para ChatGPT depende además de un diseño adecuado del texto de entrada. Las prácticas y técnicas para optimizar el diseño de las instrucciones que le damos a modelos generativos se denomina **prompt engineering**, algunas recomendaciones de  principios de diseño se pueden consultar en [OpenAI](https://help.openai.com/en/articles/6654000-best-practices-for-prompt-engineering-with-openai-api#h_1951f30f08)
 y [DeepLearning.ai](https://www.deeplearning.ai/short-courses/chatgpt-prompt-engineering-for-developers/)





## 2.3 ¿Cuáles son los elementos principales de ChatGPT?

Existen otros elementos que debemos tener presentes para el funcionamiento de ChatGPT y que desempeñan un papel crucial en la generación de texto coherente y contextualmente relevante durante las interacciones con los usuarios.

1. **Tokens:** Los tokens son unidades individuales en las que se divide el texto de entrada y salida para que el modelo pueda procesarlo. En el contexto de ChatGPT, un token puede ser una palabra, un número, un signo de puntuación o incluso una parte de una palabra. Cada token tiene su propia representación numérica (ver encajes) y, al considerar contextos más amplios, el modelo puede generar respuestas más coherentes y precisas.
2. **Encajes (Embeddings):** Los embeddings son representaciones numéricas de las palabras o tokens en el texto. En el caso de ChatGPT, se utilizan embeddings para codificar el significado y contexto de las palabras en vectores numéricos de alta dimensión. Esto ayuda al modelo a comprender las relaciones semánticas y sintácticas entre las palabras en las oraciones.
3. **Número de tokens máximos:** Para controlar la longitud de las respuestas generadas, se establece un límite en el número máximo de tokens que el modelo puede producir. Esto es útil para garantizar que las respuestas sean de una longitud razonable y fáciles de leer.
   
4. **Temperatura:** La temperatura es un parámetro de control en el proceso de generación de texto. Un valor alto de temperatura (por ejemplo, 1.0) hace que el modelo sea más creativo y generará respuestas más diversas pero potencialmente menos coherentes. Por otro lado, una temperatura baja (por ejemplo, 0.2) producirá respuestas más determinísticas y más repetitivas. Ajustar la temperatura permite equilibrar la creatividad con la coherencia en las respuestas generadas.

Al respecto, conviene notar que ChatGPT nos permite configurar la cantidad máxima de tokens en la respuesta generada por el modelo, así como la temperatura correspondiente. Por otro lado, los encajes son parte de la representación numérica calibrar en la fase de pre-entrenamiento del modelo y permite obtener respuesta al traducir las indicaciones que hacemos a chatbot hacia un espacio numérico con el que se generan las respuestas correspondientes.

# 3. Interacción con ChatGPT a través de API's

Sumado a la interfaz de interacción de usuario a través de un ChatBot, la empresa OpenAI también proporciona un API que acepta peticiones HTTP para interactuar con sus servicios:

 https://platform.openai.com/docs/api-reference/introduction

Cabe destacar que OpenAI pode a disposición del público ejemplos y guias de como usar dicha API a través del siguiente repositorio de Github https://github.com/openai/openai-cookbook/

## 3.1 Generalidades del API de ChatGPT

### 3.1.1 Autenticación

El API necesita la creación de un API Key para identificar al usuario que hará las peticiones correspondientes. Para crearla, basta ingresar en la dirección electrónica https://platform.openai.com/account/api-keys y hacer click en el botón `Create new secret key`

![title](./images/api_key.png)

A partir de este punto, es importante que salvemos copiemos y salvemos la llave en una ubicación segura, pues será la única ocasión en que ésta información será visible para nosotros dentro de la platarforma:

![title](./images/api_key_2.png)

Cabe destacar que OpenAI provee consejos acerca de las mejores prácticas para el manejo seguro de las API Key de la aplicación https://help.openai.com/en/articles/5112595-best-practices-for-api-key-safety, pero que, como es usual en el desarrollo de software, se resumen en 1) controlar el acceso a las claves, 2) no colocarlas en ambientes donde se puedan compartir de forma no intenciona y 3) leerlas en nuestro código desde variables de ambiente del sistema operativo para que no se encuentren expuestas en repositorios de trabajo.

### 3.1.2 Modelos

El API nos permite emplear diferentes versiones de modelos generativos de texto-a-texto, texto-a-imagen y otros que se encuentran listados en ésta dirección https://platform.openai.com/docs/models. Para nuestro interés, destacan los siguientes:

* **GPT-3.5:** https://platform.openai.com/docs/models/gpt-3-5
* **GPT-4:** https://platform.openai.com/docs/models/gpt-4

Es muy importante remarcar que el acceso a ChatGPT a través del API tiene un modelo de **cobro basado en la longitud de tokens en los inputs y outputs de la interacción**. En general, se trata de precio en milésimas o centavos de dolar en paquetes de 1,000 tokens. No se debe perder de vista el uso que se hace de la herramienta para evitar cobros inesperados. Para mayor información consultar https://openai.com/pricing

### 3.1.3 Peticiones hacia el API

La interacción con ésta herramienta nos permite hacer peticiones mediante el protocolo HTTP; es decir, podemos realizar peticiones mediante métodos GET y POST a rutas del API con herramientas con cURL (disponible es sistemas basados en Unix y GNU/Linux), Postman, Request de Python o bien de librerías de nuestro lenguaje favorito diseñadas para tal efecto.

A este respecto, la documentación correspondiente se encuentra en la dirección https://platform.openai.com/docs/api-reference/making-requests.

Para ejemplificar lo anterior, a continuación se muestra la respuesta del API tras hacer una petición `GET https://api.openai.com/v1/models` median cURL, cuyo propósito es conocer los detalles de los modelos disponibles:

```
### Script en bash

# Define el API Key
OPENAI_API_KEY="<introduce_tu_clave_personal>"

# Realiza operacion GET y muestra las primeras 50 lineas
curl https://api.openai.com/v1/models -H "Authorization: Bearer $OPENAI_API_KEY" | head -n 50
```

![title](./images/api_curl.png)


Entre las peticiones disponibles destacan:

* **Completaciones de Chats:** Dada una **lista de mensajes** de una conversación, el API entrega la respuesta correspondiente del modelo. Ver https://platform.openai.com/docs/api-reference/chat
* **Completaciones:** Dado un **prompt**, el modelo devolverá una o más texto para completar la instrucción, y también puede devolver las probabilidades de tokens alternativos en cada posición. Véase https://platform.openai.com/docs/api-reference/completions


**Completaciones de Chats**

Estás peticiones son del tipo POST y se realizan en la ruta `POST https://api.openai.com/v1/chat/completions`. Emplean una serie de parámetros obligatorios:

* *model:* relativo al identificador del modelo a emplearse, ver https://platform.openai.com/docs/models,
* *messages:* En una conversación en forma de una lista ordenada de *roles* (parámetro  `role`) y *contenido* (parámetro `content`). Al respecto del primero, éste puede tomar tres valores (`user`, `assistant` y `system`) con los significados:

  * **user:** se refiere al usuario de la plataforma (normalmente sería un humano),
  * **assistant:** se refiere al chatbot,
  * **system:** instrucciones de alto nivel en la conversación, a manera contextual o imperativas.

  En contraparte *content* se refiere al texto del mensaje que cada rol va a expresar. Para mayor detalle, consultar https://help.openai.com/en/articles/7042661-chatgpt-api-transition-guide

  Para ejemplificarlo, podemos considerar la siguiente especificación, donde se le pide al sistema de ChatGPT que actúe como un experto en redacciones para marketing digital y que con ello cree 3 propuestas de slogan para un equipo de baseball que tiene de mascota a un zorro.

  ```
  'messages': [
    {'role':'system', 'content':'Actúa como experto en redacciones para marketing digital'}, 
    {'role':'User', 'content':'Ayudame a crear 3 propuestas de slogan para un equipo de baseball que tiene a un zorro como mascota en 5 palabras'}, 
  ]
  ```
La forma hacer esta petición mediante cURL es la siguiente

```
curl https://api.openai.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -d '{
    "model": "gpt-3.5-turbo",
    "messages": [
      {
        "role": "system",
        "content": "Actúa como experto en redacciones para marketing digital."
      },
      {
        "role": "user",
        "content": "Ayudame a crear 3 propuestas de slogan para un equipo de baseball que tiene a un zorro como mascota en 5 palabras"
      }
    ]
  }'
```

La respuesta generada por el API es la siguiente:

```
{
    "id": "chatcmpl-7gJRhXHKIYu6ufkdShXW07x0uhGLP",
    "object": "chat.completion",
    "created": 1690318881,
    "model": "gpt-3.5-turbo-0613",
    "choices": [
        {
            "index": 0,
            "message": {
                "role": "assistant",
                "content": "1. \"Unleash the Fox's Winning Spirit\"\n2. \"Victory runs wild with Foxball\"\n3. \"Outsmart, Outplay, Dominate: Foxball\""
            },
            "finish_reason": "stop"
        }
    ],
    "usage": {
        "prompt_tokens": 52,
        "completion_tokens": 38,
        "total_tokens": 90
    }
}
```

Es decir, nos ha ayudado a construir los siguientes slogans en inglés 1) `Unleash the Fox's Winning Spirit`, 2) `Victory runs wild with Foxball` y 3) `Outsmart, Outplay, Dominate: Foxball`

**Completaciones**

Estás peticiones son del tipo POST y se realizan en la ruta `POST https://api.openai.com/v1/chat/completions`. En esta ocasión se tienen los parámetros obligatorios:

* *model:* nuevamente relativo al identificador del modelo a emplearse, ver https://platform.openai.com/docs/models,
* *prompt:* La solicitud para generar completaciones (se pueden usar texto, arreglos de multiples textos o tokens)

Para hacer una petición podemos escribir la siguiente instrucción, con el prompt `Roses are red, Violets are blue`:

```
curl https://api.openai.com/v1/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -d '{
    "model": "text-davinci-003",
    "prompt": "Roses are red, Violets are blue",
    "max_tokens": 7,
    "temperature": 0
  }'
```

La respuesta obtenida es la siguiente:

```
{
    "id": "cmpl-7gNklgigW2nu5xLfd1zrXO0mF29JL",
    "object": "text_completion",
    "created": 1690335439,
    "model": "text-davinci-003",
    "choices": [
        {
            "text": ",\n\nSugar is sweet",
            "index": 0,
            "logprobs": null,
            "finish_reason": "length"
        }
    ],
    "usage": {
        "prompt_tokens": 10,
        "completion_tokens": 7,
        "total_tokens": 17
    }
}
```
Es decir, ha completado el verson que le comunicamos con el mensaje `Sugar is sweet`.

**Nota:**

  * Ambos métodos tienes más parámetros para su configuración (e.g. `max_tokens`, `temperature`), por lo que es importante revisar la documentación del API para adaptar el llamado a nuestras necesidades.



### 3.1.4. Haciendo peticiones hacia el API con librerias

Una buena noticia es que muchos lenguajes de programación tienen librerias nativas para interactuar con el API de ChatGPT desde una forma sencilla. Para Python, OpenAI desarolló [ openai-python](https://github.com/openai/openai-python). Su instalación se realiza con el comando:

```
# Instala libreria de OpenAI para ChatGPT
pip install openai
```

OpenIA tambié provee documentación en el siguiente vínculo
https://platform.openai.com/docs/libraries/python-library

Los ejemplos anteriores se reproducen a través de ésta librería:

**Completaciones de Chat**

In [1]:
import openai

# Indica el API Key de nuestro usuario
OPENAI_API_KEY = '<introduce_tu_clave_personal>'
openai.api_key = OPENAI_API_KEY

# Ejecuta una tarea de completar un texto
chat_completion = openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[
        {
            "role": "system",
            "content": "Actúa como experto en redacciones para marketing digital."
        },
        {
            "role": "user",
            "content": "Ayudame a crear 3 propuestas de slogan para un equipo de baseball que tiene a un zorro como mascota en 5 palabras"
        }
        ]
    )

# Imprime el mensaje respuesta de ChatGPT
print(chat_completion.choices[0].message.content)

1. "Strike fear with cunning agility."
2. "Unleash the fox's winning spirit."
3. "Outfoxing rivals since game one."


**Nota:**

    * Recordemos que ChatGPT se basa en un modelo generativo de lenguaje que tiene una componente que controla la aleatoreidad del texto generado (`temperature`), por lo que no siempre obtendremos las mismas respuestas.

In [5]:
# Ejecuta una tarea de completar un texto
completion = openai.Completion.create(
    model="text-davinci-003",
    prompt="Roses are red, Violets are blue",
    max_tokens=7,
    temperature=0
    )

# Imprime el mensaje respuesta de ChatGPT
print(completion.choices[0].text)

,

Sugar is sweet


# 4. Extracción de texto en diferentes formatos

Python es un lenguaje con mucha flexibilidad para trabajar archivos de texto. A continuación se presenta una discusión de formatos comunmente encontrados en la práctica **.txt**, **.pdf** y **.html**.

## 4.1 Archivos .txt

Los archivos de texto (.txt) son los más fáciles de manejar pues no necesitan ninguna biblioteca especial. Se pueden acceder desde la función `open(...)`, además de que es posible realizar manipulaciones como reemplazar caracteres, añadir nuevos, realizar lecturas y escrituras del mismo.


Una buena referencia para trabajar con éste tipo de archivo se encuentra en https://realpython.com/read-write-files-python/

A continuación se presenta un ejemplo de cómo leer el archivo `tale_of_two_cities_chapter_1.txt` que posee el texto del primer capítulo de la novela *Tales of Two Cities* del autor Charles Dickens:

In [12]:
def reading_txt(file_path: str) -> str:
    """
    Extrae el texto de un archivo .txt

    Parametros:
        file_path (str): Ruta del archivo de texto a analizar.

    Salida:
        str: El texto extraído del archivo.
    """

    with open(file_path, 'r', encoding='utf-8') as file:
        return file.read()

# Ruta donde se encuentra el archivo
txt_file_path = './data/tale_of_two_cities_chapter_1.txt'

# Extraemos el texto
extracted_text = reading_txt(txt_file_path)

# Imprime el texto
print(extracted_text)


CHAPTER I.
The Period

It was the best of times, it was the worst of times, it was the age of wisdom, it was the age of foolishness, it was the epoch of belief, it was the epoch of incredulity, it was the season of Light, it was the season of Darkness, it was the spring of hope, it was the winter of despair, we had everything before us, we had nothing before us, we were all going direct to Heaven, we were all going direct the other way—in short, the period was so far like the present period, that some of its noisiest authorities insisted on its being received, for good or for evil, in the superlative degree of comparison only.
There were a king with a large jaw and a queen with a plain face, on the throne of England; there were a king with a large jaw and a queen with a fair face, on the throne of France. In both countries it was clearer than crystal to the lords of the State preserves of loaves and fishes, that things in general were settled for ever.
It was the year of Our Lord one t

## 4.2 Archivos .pdf

El formato de documento portable (*.pdf*, por sus siglas en inglés) es tipo de archivo con gran popularidad en el mundo. En Python, se
suele emplear la librería `PyPDF2` (ver https://pypdf2.readthedocs.io/en/3.0.0/).

```
pip install PyPDF2
```

Una referencia de como emplearlo para extraer texto se presenta en https://pypdf2.readthedocs.io/en/3.0.0/user/extract-text.html


## 4.3 Archivos .html

El formato *Hypertext Markup Language* (*.html*, por sus siglas en inglés) permite crear documento con formato estilizado en el ambiente de desarrollo web, por lo que multiples sitios electrónicos basan si diseño en el mismo.  En Python, se puede extraer texto de dicho formato empleando la libreria denominada `Beautiful Soup` (ver https://www.crummy.com/software/BeautifulSoup/bs4/doc/), la cual se puede instalar como sigue:

```
pip install beautifulsoup4
```

La tarea de extracción en este caso depende fuertemente de la estructura en que el texto se encuentra organizado en el archivo .html (por ejemplo en forma de párrafos, viñetas, tablas y otros), las técnicas para extraerlo de manera eficiente se denominan *web scrapping*. Una referencia de como emplearlo para extraer texto se presenta en https://realpython.com/beautiful-soup-web-scraper-python/

## 5. Entregables

En esta sección se describen los entregables de la presente etapa que consisten en un script en Python para ChatGPT a través del API de OpenAI. Para ello se deberá crear las cuentas de plataforma y generar el API Key correspondiente (**NO SE DEBE INCLUIR LA API KEY**, revise https://help.openai.com/en/articles/5112595-best-practices-for-api-key-safety para ver como invocarle como variable de ambiente desde Python).


A. Diseña scripts y prompts que permitan:

    1) Obtener un resumen en español, de dos párrafos de longitud, del contenido del texto `news_digital_bank.txt`. Adicionalmente, se deberá incluir un tercer párrafo que indique cuál es el diario del que proviene el texto y el título correspondiente de la noticia. Este programa se deberá guardar con nombre `conversacion_1.py`

    2) Crear 5 viñetas (bullets) que presenten los elementos más importantes de la historia el archivo `cuento.pdf` (usando el texto de todas las páginas del archivo). Adicionalmente, se deberá incluir un par de viñetas que indique a) el nombre del autor del texto, 2) los personajes principales de la trama, 3) el título del cuento. Dicho programa se deberá guardar con nombre `conversacion_2.py`

Cabe destacar que como resultado de los programas anteriores, se debe crear un script de conversación que guarde el script de conversación entre el usuario y ChatGPT en un archivo .txt (conversacion_i.txt donde i es el número de inciso asociado), con la estructura siguiente:

**Ejemplo**
```
Usuario: <Indicaciones del prompt empleado>

ChatGPT: Respuesta
```

Adicionalmente se deberá adjuntar capturar de pantalla en formato .png donde se aprecia el cuerpo de las conversaciones generadas por los ChatBots, se pueden usar numeraciones sucesivas sin son muchas fotos, ejemplo: evidencia_1_conversacion_i.png, evidencia_2_conversacion_i.png, ..., evidencia_5_conversacion_i.png