Sea el siguiente dataset:

Age in years	Weight in pounds	Systolic blood pressure
52	173	132
59	184	143
67	194	153
73	211	162
64	196	154
74	220	168
54	188	137
61	188	149
65	207	159
46	167	128
72	217	166

Este dataset representa una serie de muestras de pacientes, donde cada fila corresponde a un paciente diferente y las columnas representan las características de cada paciente.

-Systolic blood pressure: Esta columna representa la presión arterial sistólica de los pacientes. La presión arterial sistólica es la presión ejercida sobre las paredes de las arterias cuando el corazón se contrae.

-Age in years: Esta columna representa la edad de los pacientes en años. La edad es un factor importante a considerar en el estudio de la presión arterial, ya que puede influir en la salud cardiovascular.

-Weight in pounds: Esta columna representa el peso de los pacientes en libras. El peso también es un factor relevante en el estudio de la presión arterial, ya que el exceso de peso puede estar asociado con un mayor riesgo de hipertensión.

Al analizar este dataset, es posible buscar patrones o relaciones entre la presión arterial sistólica y las variables de edad y peso.

Vamos a realizar un análisis de regresión para determinar cómo la edad y el peso pueden estar relacionados con la presión arterial.

In [None]:
""" Regresión con Sklearn
Podemos ajustar una regresión lineal fácilmente con Sklearn:

1.Importar las bibliotecas: """

import pandas as pd
import numpy as np
import plotly.graph_objects as go
from sklearn.linear_model import LinearRegression

#2.Preparar los datos:

# Cargar el dataset como un DataFrame
data = pd.DataFrame({
    'X1': [52, 59, 67, 73, 64, 74, 54, 61, 65, 46, 72],
    'X2': [173, 184, 194, 211, 196, 220, 188, 188, 207, 167, 217],
    'X3': [132, 143, 153, 162, 154, 168, 137, 149, 159, 128, 166],
})

# Separar las variables independientes (X) y la variable dependiente (y)
X = data[['X1', 'X2']]
y = data['X3']

In [None]:
#3.Crear y ajustar el modelo de regresión lineal:

# Crear una instancia del modelo de regresión lineal
regression = LinearRegression()

# Ajustar el modelo a los datos
regression.fit(X, y)

#4.Obtener los coeficientes y el término de intersección:

# Coeficientes de regresión
coeficientes = regression.coef_
print("Coeficientes:", coeficientes)

# Término de intersección
interseccion = regression.intercept_
print("Término de intersección:", interseccion)


#5.Hacer predicciones:

# Hacer una predicción para nuevos datos
nuevos_datos = np.array([[140, 55], [150, 62]])
predicciones = regression.predict(nuevos_datos)
print("Predicciones:", predicciones)

Después de ajustar el modelo, podemos obtener los coeficientes de regresión utilizando el atributo coef_, y el término de intersección utilizando el atributo intercept_. Estos coeficientes nos permiten construir la ecuación de la línea de regresión.

Finalmente, podemos hacer predicciones utilizando el método predict(), pasando nuevos datos en forma de matriz. En el ejemplo, hemos proporcionado dos nuevas muestras y hemos obtenido las predicciones correspondientes.

Podemos graficar el ajuste usando plotly:

In [None]:
# Realizar predicciones para graficar la línea de regresión
x_range = pd.DataFrame({
    'X1': [
        data['X1'].min(),
        data['X1'].min(),
        data['X1'].max(),
        data['X1'].max(),
    ],
    'X2': [
        data['X2'].min(),
        data['X2'].max(),
        data['X2'].min(),
        data['X2'].max(),
    ]
})
predictions = regression.predict(x_range)

# Graficar los datos y la línea de regresión
fig = go.Figure()

# Graficar los puntos de datos
fig.add_trace(go.Scatter3d(
    x=data['X1'],
    y=data['X2'],
    z=data['X3'],
    mode='markers',
    marker=dict(size=5, color='blue'),
    name='Datos'
))

# Graficar la línea de regresión
fig.add_trace(go.Surface(
    x=x_range['X1'].values.reshape((2,2)),
    y=x_range['X2'].values.reshape((2,2)),
    z=predictions.reshape((2, 2)),
    colorscale='RdYlBu',
    opacity=0.8,
    showscale=False,
    name='Línea de Regresión'
))

# Configurar el diseño del gráfico
fig.update_layout(
    title='Regresión Lineal',
    scene=dict(
        xaxis_title='X1',
        yaxis_title='X2',
        zaxis_title='X3'
    )
)

# Mostrar el gráfico
fig.show()
