In [1]:
# Importando diferentes librerías
from dotenv import load_dotenv
import os

# Importando la librería OpenAI
from openai import OpenAI

In [2]:
# A continuación, es el momento de cargar las claves API en las veriables de entorno.
# override se utiliza para cargar variables de entorno desde un archivo .env
load_dotenv(override=True)

True

In [3]:
# Cargar la clave API de OpenAI desde las variables de entorno
openai_api_key = os.getenv("API_GPT")

In [4]:
# Vamos a revisar que todo está ok
if openai_api_key:
    print(f"Clave API cargada correctamente. Longitud de la clave: {len(openai_api_key)} caracteres.")
else:
    print("Error: No se pudo cargar la clave API. Asegúrate de que el archivo .env esté configurado correctamente.")

Clave API cargada correctamente. Longitud de la clave: 95 caracteres.


In [5]:
# Vamos a crear una instancia de OpenAI utilizando la clave API cargada
openai = OpenAI(api_key=openai_api_key)

In [6]:
# Creando una lista de mensajes para la conversación, esta la hacemos en el formato de diccionario para que OpenAI la entienda
messages = [
        {
            "role": "user",
            "content": "Hola, ¿cómo estás?"
        }
    ]


In [7]:
# Ahora vamos a probar nuestra conexión con OpenAI
response = openai.chat.completions.create(
    model="gpt-4.1-nano",
    messages=messages,
)
print(response.choices[0].message.content)

¡Hola! Estoy bien, gracias. ¿Y tú? ¿En qué puedo ayudarte hoy?


In [8]:
# Ahora vamos a llamar a la API de OpenAI 
question = "Hay que poner una pregunta difícil sobre la analítica de datos web y el coeficinente de correlación de Pearson. Responde solo con la pregunta."
messages = [
    {
    "role": "user",
    "content": question
    }
]


In [9]:
response = openai.chat.completions.create(
    model="gpt-4.1-mini",
    messages=messages,
)

question = response.choices[0].message.content

print(response.choices[0].message.content)

¿Cómo puede afectar la presencia de variables confusoras y la no linealidad en los datos web al interpretar el coeficiente de correlación de Pearson en un análisis de comportamiento de usuarios?


In [10]:
# Una nueva lista de mensajes para la conversación, esta la hacemos en el formato de diccionario para que OpenAI la entienda
messages = [
    {
        "role": "user",
        "content": question
    }
]

In [11]:
# Vamos a hacer una nueva pregunta a OpenAI
response = openai.chat.completions.create(
    model="gpt-4.1-mini",
    messages=messages,
)

answer = response.choices[0].message.content
print(f"Respuesta de OpenAI: {answer}")

Respuesta de OpenAI: La presencia de **variables confusoras** y la **no linealidad** en los datos web pueden afectar significativamente la interpretación del coeficiente de correlación de Pearson cuando se analiza el comportamiento de usuarios. Te explico cómo ocurre cada caso:

---

### 1. Variables Confusoras

- **Qué son:** Son variables externas que influyen simultáneamente en las dos variables que se están correlacionando. Esto puede generar una asociación espuria, es decir, puede parecer que existe una relación directa cuando en realidad ambas variables están siendo afectadas por un tercer factor.

- **Impacto en Pearson:**
  - El coeficiente de Pearson mide la relación lineal directa entre dos variables, pero no controla por otros factores.
  - Si existe una o más variables confusoras, la correlación puede estar sobreestimada o subestimada.
  - Puede observarse una correlación significativa cuando en realidad la relación es indirecta o inexistente.
  - Esto puede llevar a conclu