# Creación de conexiones con OPENAI
En el ejercicios crearemos una conversación mínima para entender los conceptos de la **conexión con OPENAI**
Haremos que **OPENAI haga una pregunta y que el propio OPENAI responda a su pregunta**.

## Importación de librerías
Lo primero que tenemos que hacer es importar las librerías, podemos usar `pip` o bien `uv` para hacer estas importaciones. 
Es aconsejable trabajar con un entorno virtual para estos casos, donde tendremos ahí, las librerías que necesitemos y los direferentes códigos que vayamos realizando.

In [1]:
# Importando diferentes librerías
from dotenv import load_dotenv
import os

# Importando la librería OpenAI
from openai import OpenAI

## Creación de variable sensibles
Para el uso de las variables más sensibles como son los tokens, constraseñas... debéis usar este tipo de variables, de esta manera no tenéis que mostrar los códigos en público.
En vuestro directorio donde tenéis el proyecto deberíais crear un archivo llamada `.env` que será el que tenga ahí las variables con vuestro código. Al hacer esto os parecerá un botón que pone `Toggle Auto-cloacking` y ahí ocultará o bien mostrará las variables que tengas puestas.

In [2]:
# A continuación, es el momento de cargar las claves API en las veriables de entorno.
# override se utiliza para cargar variables de entorno desde un archivo .env
load_dotenv(override=True)

True

In [5]:
# Cargar la clave API de OpenAI desde las variables de entorno
openai_api_key = os.getenv("OPENAI_API_KEY")

In [6]:
# Vamos a revisar que todo está ok
if openai_api_key:
    print(f"Clave API cargada correctamente. Longitud de la clave: {len(openai_api_key)} caracteres.")
else:
    print("Error: No se pudo cargar la clave API. Asegúrate de que el archivo .env esté configurado correctamente.")

Clave API cargada correctamente. Longitud de la clave: 164 caracteres.


In [7]:
# Vamos a crear una instancia de OpenAI utilizando la clave API cargada
openai = OpenAI(api_key=openai_api_key)

In [8]:
# Creando una lista de mensajes para la conversación, esta la hacemos en el formato de diccionario para que OpenAI la entienda
messages = [
        {
            "role": "user",
            "content": "Hola, ¿cómo estás?"
        }
    ]


In [9]:
# Ahora vamos a probar nuestra conexión con OpenAI
response = openai.chat.completions.create(
    model="gpt-4.1-nano",
    messages=messages,
)
print(response.choices[0].message.content)

¡Hola! Estoy muy bien, gracias. ¿Y tú? ¿En qué puedo ayudarte hoy?


In [10]:
# Ahora vamos a llamar a la API de OpenAI 
question = "Hay que poner una pregunta difícil sobre la analítica de datos web y el coeficinente de correlación de Pearson. Responde solo con la pregunta."
messages = [
    {
    "role": "user",
    "content": question
    }
]


In [11]:
response = openai.chat.completions.create(
    model="gpt-4.1-mini",
    messages=messages,
)

question = response.choices[0].message.content

print(response.choices[0].message.content)

¿Cómo puede el coeficiente de correlación de Pearson ayudar a identificar relaciones no lineales en el comportamiento de los usuarios en un sitio web y cuáles son las limitaciones de utilizar esta métrica en el análisis de datos web?


In [12]:
# Una nueva lista de mensajes para la conversación, esta la hacemos en el formato de diccionario para que OpenAI la entienda
messages = [
    {
        "role": "user",
        "content": question
    }
]

In [13]:
# Vamos a hacer una nueva pregunta a OpenAI
response = openai.chat.completions.create(
    model="gpt-4.1-mini",
    messages=messages,
)

answer = response.choices[0].message.content
print(f"Respuesta de OpenAI: {answer}")

Respuesta de OpenAI: El coeficiente de correlación de Pearson es una medida estadística que cuantifica la **fuerza y dirección de una relación lineal** entre dos variables numéricas. En el contexto del análisis del comportamiento de usuarios en un sitio web, puede ser útil para detectar relaciones lineales simples, pero tiene limitaciones importantes para identificar relaciones no lineales.

---

### ¿Cómo puede ayudar el coeficiente de correlación de Pearson a identificar relaciones no lineales?

- **Indirectamente puede alertar sobre no linealidad**: Si calculamos el coeficiente de Pearson entre dos variables (por ejemplo, tiempo en el sitio y número de clics) y obtenemos un valor cercano a 0, podría significar que no existe una relación lineal fuerte. Sin embargo, esto no implica automáticamente que no haya relación alguna; podría existir una relación **no lineal** que Pearson no detecta.

- **Comparación con visualización**: Si al graficar (scatter plot) observamos una forma curva 