In [37]:
import numpy as np
import pandas as pd
from sklearn.linear_model import LinearRegression #modelo de regresión lineal 
from sklearn.preprocessing import PolynomialFeatures #modelo de regresión polinómica
from sklearn.model_selection import train_test_split #dividir datos en sets de entrenamiento y test

In [38]:
# Leer datos del archivo CSV
data = pd.read_csv('Hombres.csv', sep=';', decimal=',')
df_triplicado = pd.concat([data] * 3, ignore_index=True)
x = df_triplicado['HB_PRE'].values.reshape((-1, 1))
y = df_triplicado['HB_POST'].values
covarianza = np.cov(x.flatten(), y)[0][1]

In [39]:
#Para transformar el array de x y que contenga más valores como x^2
transformer = PolynomialFeatures(degree=2, include_bias=False) #grado del polinomio, incluir la columna de sesgo o no
transformer.fit(x)
#Creo el nuevo array modificado
x_ = transformer.transform(x)

#Se podría poner todo junto así: x_ = PolynomialFeatures(degree=2, include_bias=False).fit_transform(x)

In [40]:
x_train, x_test, y_train, y_test=train_test_split(x_, y,test_size=0.1, random_state=0)
# Crear el modelo de regresión lineal
model = LinearRegression().fit(x_train, y_train)

In [41]:
x_media = np.mean(x_train)
y_media = np.mean(y_train)
x_varianza = np.var(x_train) #variación de los datos respecto a su media (desviacion^2)
y_varianza = np.var(y_train)
#covarianza = np.cov(x_train.flatten(), y_train)[0][1]  # Covarianza entre x e y, relación lineal entre x e y, si covarianza>0, y aumentará cuando aumente x. Si <0, cuando una aumenta, la otra disminuye, y viceversa.
x_desviacion = np.std(x_train) #promedio de las desviaciones individuales frente a la media
y_desviacion = np.std(y_train)
print(f"la media de x es {x_media} y la de y es {y_media}")
print(f"la varianza de x es {x_varianza} y la de y es {y_varianza}")
print(f"la desviación típica de x es {x_desviacion} y la de y es {y_desviacion}")
print(f"la covarianza entre x e y es de {covarianza}")

la media de x es 131.87114285714287 y la de y es 13.278571428571428
la varianza de x es 13795.617927265308 y la de y es 1.361969387755102
la desviación típica de x es 117.4547484236602 y la de y es 1.167034441546222
la covarianza entre x e y es de 0.6827022977022982


In [42]:
# Obtener los coeficientes del modelo
r_sq = model.score(x_train, y_train)
intercept = model.intercept_
slope = model.coef_

print(f"coeficiente de determinación: {r_sq}")
#print(f"intersección: {intercept}") #b0 No son útiles en este estudio
#print(f"pendiente: {slope}") #b1 

coeficiente de determinación: 0.5541362296065395


In [43]:
#Predecir la respuesta de y a lo largo de los valores de x
y_pred = model.predict(x_test)
print(f"los valores de edad de entrenamiento que se usan son:\n{x_test}")
print(f"predicción respuesta:\n{y_pred}")

los valores de edad de entrenamiento que se usan son:
[[ 16.1  259.21]
 [ 14.4  207.36]
 [ 15.3  234.09]
 [ 15.6  243.36]
 [ 17.2  295.84]
 [ 16.6  275.56]
 [ 15.6  243.36]
 [ 16.1  259.21]]
predicción respuesta:
[13.70468721 11.78133651 12.83162742 13.16570118 14.81212076 14.22141877
 13.16570118 13.70468721]


In [44]:
""" #Predecir la respuesta de y con x del 13.8 al 17.2 (valores típicos entre hombres)
start = 13.8
end = 17.2
step = 0.2
x_new = np.arange(start, end + step, step).reshape((-1, 1))
y_new = model.predict(x_new)

print(f"predicción de nueva respuesta (pasos de 0.2):\n{y_new}")

#Predecir la respuesta de y para un valor específico de x
x_specific = np.array([15.6]).reshape(-1, 1)
y_specific = model.predict(x_specific)
print(f"predicción respuesta para x={x_specific}:\n{y_specific}") """

' #Predecir la respuesta de y con x del 13.8 al 17.2 (valores típicos entre hombres)\nstart = 13.8\nend = 17.2\nstep = 0.2\nx_new = np.arange(start, end + step, step).reshape((-1, 1))\ny_new = model.predict(x_new)\n\nprint(f"predicción de nueva respuesta (pasos de 0.2):\n{y_new}")\n\n#Predecir la respuesta de y para un valor específico de x\nx_specific = np.array([15.6]).reshape(-1, 1)\ny_specific = model.predict(x_specific)\nprint(f"predicción respuesta para x={x_specific}:\n{y_specific}") '