## Notebook del capítulo 5

In [None]:
# 22/5/24
import numpy as np
import matplotlib.pyplot as plt

### Ejemplo 1

In [None]:
# Datos
xn= np.array([0.00, 0.10, 0.20, 0.30, 0.40, 0.50, 0.60, 0.70, 0.80, 1.00])
yn= np.array([1.00, 1.64, 1.51, 2.03, 2.75, 3.59, 4.87, 5.23, 5.44, 6.37])

In [None]:
plt.scatter(xn, yn, marker='*') 
plt.title(r'Velocidad vs tiempo', fontsize=20) 
plt.xlabel(r'$t$ [s]', fontsize=16)
plt.ylabel(r'$v$ [m/s]', fontsize=16)

In [None]:
# Se obtiene el valor de n (numero de datos)
n = len(xn)
# Las sumatorias necesarias 
Sum_x = np.sum(xn)
Sum_y = np.sum(yn)
Sum_xx = np.sum(xn**2)
Sum_xy = np.sum(xn*yn)
Sum_xSumy = np.sum(xn)*np.sum(yn)
Delta = n*np.sum(xn**2) - (np.sum(xn))**2
print(n,',', Sum_x, ',',Sum_y,',', Sum_xx,',', Sum_xy,',', Sum_xSumy, ',',Delta)

In [None]:
# Se escriben las ecuaciones para b y m 
m_mc = (n * Sum_xy - Sum_x * Sum_y) / Delta
b_mc = Sum_y /n - m_mc * Sum_x/n
print('m=',m_mc, ',', 'b=',b_mc)

In [None]:
# La gráfica con los datos y la recta que mejor se ajusta 
y_pred= m_mc*xn + b_mc
# 
plt.figure()
plt.scatter(xn, yn, color='b',marker='+', label='datos medidos')
plt.plot(xn, y_pred, 'r--',label='recta por mínimos cuadrados')
plt.grid(linestyle='dotted')
plt.legend(loc='best')
plt.title(r'Velocidad vs tiempo', fontsize=18)
plt.xlabel(r'$t$ [s]', fontsize=16)
plt.ylabel(r'$v$ [m/s]', fontsize=16)
plt.text(0.6, 1.0, '$y=(5.88) x + 0.736$', fontsize=12)
plt.show()

In [None]:
SSE= np.sum((yn -(b_mc + m_mc*xn))**2)
Sy= np.sqrt(SSE/(n-2))
print('n=',n,',','SSE=', SSE ,',', 'Sy=',Sy)

In [None]:
Delta_m = np.sqrt(n/(n*np.sum(xn ** 2) - np.sum(xn)**2))*Sy
Delta_b = np.sqrt(np.sum(xn**2)/(n*np.sum(xn**2)-np.sum(xn)**2))*Sy
print(f'm = {np.round(m_mc, 1)} \u00B1 {np.round(Delta_m, 1)}')
print(f'b = {np.round(b_mc, 1)} \u00B1 {np.round(Delta_b, 1)}')

In [None]:
# Ajustar la recta por mínimos cuadrados usando linalg.lstsq
A = np.vstack([xn, np.ones(len(xn))]).T
m_c, b_c = np.linalg.lstsq(A, yn, rcond=None)[0]
print(f'm = {np.round(m_c, 1)}' )
print(f'b = {np.round(b_c, 1)}' )

In [None]:
import statsmodels.api as sm

In [None]:
# Agregamos una constante (columna de unos) a xn
X = sm.add_constant(xn)
# Ajustamos el modelo
model = sm.OLS(yn, X).fit()
# Obtenemos los coeficientes y los errores estándar
b, m = model.params
Delta_b, Delta_m = model.bse
# Imprimimos los coeficientes y sus errores estándar
print(f'm = {m:.4f} \u00B1 {Delta_m:.4f}')
print(f'b = {b:.4f} \u00B1 {Delta_b:.4f}')
# Generamos valores de y usando los coeficientes obtenidos
y_pred = m * xn + b
# Graficamos los datos originales y la línea ajustada
plt.scatter(xn, yn, color='blue', label='Datos experimentales')
plt.plot(xn, y_pred, color='red', label='Línea ajustada')
plt.xlabel('$t$ [s]')
plt.ylabel('$v$ [m/s]')
plt.legend()
plt.show()

In [None]:
results = model
print(results.summary())

### Ejemplo 2

In [None]:
# Datos de cizallamiento y edad de la pega
yn = np.array([2158.70, 1678.15, 2316.00, 2061.30, 2207.50,
               1708.30, 1784.70, 2575.00, 2357.90, 2256.70,
               2165.20, 2399.55, 1779.80, 2336.75, 1765.30,
               2053.50, 2414.40, 2200.50, 2654.20, 1753.70,2665.86])
xn = np.array([150.50, 230.75, 80.00, 170.00, 50.50, 190.00, 240.00, 20.50,
               70.50, 110.00, 130.00, 30.75, 250.00, 90.75, 220.00, 180.00,
               60.00, 120.50, 20.00, 210.50,0.00])

In [None]:
X = sm.add_constant(xn)
# Ajustamos el modelo
model = sm.OLS(yn, X).fit()
# Obtenemos los coeficientes y los errores estándar
b, m = model.params
Delta_b, Delta_m = model.bse
# Imprimimos los coeficientes y sus errores estándar
print(f'm = {m:.4f} \u00B1 {Delta_m:.4f}')
print(f'b = {b:.4f} \u00B1 {Delta_b:.4f}')

In [None]:
# Generamos valores de y usando los coeficientes obtenidos
y_pred = m * xn + b
# Graficamos los datos originales y la línea ajustada
plt.scatter(xn, yn, color='blue', label='Datos experimentales')
plt.plot(xn, y_pred, color='red', label='Línea ajustada')
plt.grid(linestyle='dotted')
plt.legend(loc='best')
plt.xlabel('Temperatura (°C)')
plt.ylabel('Resistencia (Ω)')
plt.legend()
plt.show()

In [None]:
y_pred = m * xn + b
y_pred

In [None]:
Sum_y = np.sum(yn)
Sum_y 

In [None]:
Sum_yp = np.sum(y_pred)
Sum_yp

In [None]:
e_i=yn-y_pred
e_i

In [None]:
np.sum(e_i)

In [None]:
# Los promedios de x y y 
xp= np.sum(xn)/len(xn) 
yp= np.sum(yn)/len(xn)
print(xp,',', yp,',', m * xp + b)

In [None]:
Sx2 = np.sum((xn-xp)**2)/n
Sy2 = np.sum((yn-yp)**2)/n
Sxy=np.sum((xn-xp)*(yn-yp))/n
m=Sxy/Sx2 
b=yp-m*xp
Sx2 , Sy2, Sxy, m, b

In [None]:
r=Sxy/(np.sqrt(Sx2)*np.sqrt(Sy2))
r, r**2

In [None]:
myx=r*np.sqrt(Sy2)/np.sqrt(Sx2)
mxy=r*np.sqrt(Sx2)/np.sqrt(Sy2)
myx,mxy

In [None]:
SSR= np.sum(((m*xn + b)-yp)**2)
SSE= np.sum((yn-(m*xn + b))**2)
SST= np.sum((yn-yp)**2)
SSR,SSE,SST, SSR+SSE

In [None]:
SSR = np.sum((model.predict() - np.mean(yn))**2)
SSE = np.sum((yn - model.predict())**2)
SSR,SSE

In [None]:
sig2=SSE/(len(xn)-2)
Db=np.sqrt(sig2*(1/len(xn)+xp**2/(np.sum((xn-xp)**2))))
Dm=np.sqrt(sig2/(np.sum((xn-xp)**2)) )
sig2, Dm, Db

In [None]:
print(f'm = {m:.4f} \u00B1 {Delta_m:.4f}')
print(f'b = {b:.4f} \u00B1 {Delta_b:.4f}')

In [None]:
tm=m/Dm
tb=b/Db
tm, tb

In [None]:
m-2.093*Dm, m+2.093*Dm

In [None]:
b-2.093*Db, b+2.093*Db

In [None]:
# Calcular MSR y MSE
k=2
MSR = SSR / (k-1)
MSE = SSE / (len(xn)  - k)
# Calcular el estadístico F
F_manual = MSR / MSE
F_manual

In [None]:
MSR,MSE

In [None]:
np.sum(xn*e_i)

In [None]:
np.sum(y_pred*e_i)

In [None]:
results = model
print(results.summary())

In [None]:
SS_T=np.sum(yn**2)-len(xn)*yp**2
SS_T

In [None]:
SS_R= SS_T - m*np.sum(yn*(xn-xp))
SS_R

In [None]:
s=SS_R/(len(xn)-2)
s

In [None]:
np.sqrt(np.sum(e_i**2)/(len(xn)-2))

In [None]:
np.sqrt(s*(1/len(xn)+xp**2/(np.sum((xn-xp)**2))))

In [None]:
np.sqrt(s/(np.sum((xn-xp)**2)) )

In [None]:
xp**2

In [None]:
np.sum((xn-xp)**2)

In [None]:
from scipy import stats
# Sumas necesarias
n = len(xn)
sum_x = np.sum(xn)
sum_y = np.sum(yn)
sum_x2 = np.sum(xn**2)
sum_xy = np.sum(xn * yn)

# Calcular m y b
m = (n * sum_xy - sum_x * sum_y) / (n * sum_x2 - sum_x**2)
b = (sum_y * sum_x2 - sum_x * sum_xy) / (n * sum_x2 - sum_x**2)

# Predicciones
y_hat = m * xn + b

# Calcular SS_res y SS_tot
SS_res = np.sum((yn - y_hat)**2)
SS_tot = np.sum((yn - np.mean(yn))**2)

# Calcular R^2
R2 = 1 - (SS_res / SS_tot)

# Error estándar de los residuos
s = np.sqrt(SS_res / (n - 2))

# Varianza de los parámetros
sigma_m2 = np.sqrt(s**2 / np.sum((xn - np.mean(xn))**2))
sigma_b2 = np.sqrt(s**2 * (1/n + np.mean(xn)**2 / np.sum((xn - np.mean(xn))**2)))

# Estadísticos t
t_m = m / np.sqrt(sigma_m2)
t_b = b / np.sqrt(sigma_b2)

# Valores p
p_m = 2 * (1 - stats.t.cdf(np.abs(t_m), df=n-2))
p_b = 2 * (1 - stats.t.cdf(np.abs(t_b), df=n-2))

# Resultados
print(f"Pendiente (m): {m}")
print(f"Intercepto (b): {b}")
print(f"Coeficiente de determinación (R^2): {R2}")
print(f"Error estándar de los residuos: {s}")
print(f"Varianza de m: {sigma_m2}")
print(f"Varianza de b: {sigma_b2}")
print(f"t-m: {t_m}, p-m: {p_m}")
print(f"t-b: {t_b}, p-b: {p_b}")

###  Ley de Enfriamiento de Newton. 

In [None]:
from scipy.stats import linregress

# Datos inventados

# Realizar regresión lineal
slope, intercept, r_value, p_value, std_err = linregress(xn, yn)

# Mostrar resultados
print(f'Pendiente: {slope}')
print(f'Intersección: {intercept}')
print(f'Coeficiente de determinación R^2: {r_value**2}')
print(f'Valor p: {p_value}')
print(f'Error estándar: {std_err}')

# Graficar resultados
plt.scatter(xn, yn, label='Datos')
plt.plot(xn, intercept + slope * xn, 'r', label='Recta aproximada')
plt.xlabel('Tiempo (min)')
plt.ylabel('Temperatura (°C)')
#plt.title('Regresión Lineal Simple')
plt.legend()
plt.show()


In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import linregress

# Datos inventados

# Realizar regresión lineal
slope, intercept, r_value, p_value, std_err = linregress(xn, yn)

# Mostrar resultados
print(f'Pendiente: {slope}')
print(f'Intersección: {intercept}')
print(f'Coeficiente de determinación R^2: {r_value**2}')
print(f'Valor p: {p_value}')
print(f'Error estándar: {std_err}')

# Graficar resultados
plt.scatter(xn, yn, label='Datos')
plt.plot(xn, intercept + slope * xn, 'r', label='Ajuste lineal')
plt.xlabel('Tiempo (min)')
plt.ylabel('Temperatura (°C)')
plt.title('Regresión Lineal Simple')
plt.legend()
plt.show()


In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.optimize import curve_fit


# Modelo exponencial
def exponential_model(x, T_env, T_0, k):
    return T_env + (T_0 - T_env) * np.exp(-k * x)

# Ajuste exponencial con incremento de maxfev y ajuste de valores iniciales
try:
    params, covariance = curve_fit(
        exponential_model, xn, yn, p0=[1700, 2500, 0.01], maxfev=4000
    )
    T_env, T_0, k = params

    # Mostrar resultados
    print(f'Temperatura ambiente (T_env): {T_env}')
    print(f'Temperatura inicial (T_0): {T_0}')
    print(f'Constante (k): {k}')

    # Graficar resultados
    plt.scatter(xn, yn, label='Datos')
    plt.plot(xn, exponential_model(xn, T_env, T_0, k), 'g', label='Ajuste exponencial')
    plt.xlabel('Tiempo (min)')
    plt.ylabel('Temperatura (°C)')
    plt.title('Ajuste Exponencial')
    plt.legend()
    plt.show()
except RuntimeError as e:
    print(f"No se pudieron encontrar los parámetros óptimos: {e}")




In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.optimize import curve_fit

# Datos inventados

# Modelo exponencial
def exponential_model(x, T_env, T_0, k):
    return T_env + (T_0 - T_env) * np.exp(-k * x)

# Ajuste exponencial con incremento de maxfev y ajuste de valores iniciales
params, covariance = curve_fit(
    exponential_model, xn, yn, p0=[1700, 2500, 0.01], maxfev=4000
)
T_env, T_0, k = params

# Mostrar resultados
print(f'Temperatura ambiente (T_env): {T_env}')
print(f'Temperatura inicial (T_0): {T_0}')
print(f'Constante (k): {k}')

# Graficar resultados
plt.scatter(xn, yn, label='Datos')
plt.plot(xn, exponential_model(xn, T_env, T_0, k), 'g', label='Ajuste exponencial')
plt.xlabel('Tiempo (min)')
plt.ylabel('Temperatura (°C)')
plt.title('Ajuste Exponencial')
plt.legend()
plt.show()


In [None]:
import numpy as np
from scipy.stats import linregress

# Datos
yn = np.array([2158.70, 1678.15, 2316.00, 2061.30, 2207.50,
               1708.30, 1784.70, 2575.00, 2357.90, 2256.70,
               2165.20, 2399.55, 1779.80, 2336.75, 1765.30,
               2053.50, 2414.40, 2200.50, 2654.20, 1753.70, 2665.86])
xn = np.array([150.50, 230.75, 80.00, 170.00, 50.50, 190.00, 240.00, 20.50,
               70.50, 110.00, 130.00, 30.75, 250.00, 90.75, 220.00, 180.00,
               60.00, 120.50, 20.00, 210.50, 0.00])

# Ajuste del modelo de regresión lineal
slope, intercept, r_value, p_value, std_err = linregress(xn, yn)

# Predicciones del modelo
yn_pred = intercept + slope * xn

# Cálculo de las sumas de cuadrados
y_mean = np.mean(yn)
SSR = np.sum((yn_pred - y_mean)**2)
SSE = np.sum((yn - yn_pred)**2)

# Número de coeficientes (k = 2: intercepto y pendiente)
k = 2

# Número total de observaciones
n = len(yn)

# Cálculo del estadístico F
MSR = SSR / k
MSE = SSE / (n - k - 1)
F_statistic = MSR / MSE

# Mostrar los resultados
print(f"Estadístico F: {F_statistic:.4f}")
print(f"SSR: {SSR:.2f}")
print(f"SSE: {SSE:.2f}")
print(f"MSR: {MSR:.2f}")
print(f"MSE: {MSE:.2f}")
print(f"Número de observaciones (n): {n}")
print(f"Número de coeficientes (k): {k}")


In [None]:
import numpy as np
import statsmodels.api as sm

# Datos
yn = np.array([2158.70, 1678.15, 2316.00, 2061.30, 2207.50,
               1708.30, 1784.70, 2575.00, 2357.90, 2256.70,
               2165.20, 2399.55, 1779.80, 2336.75, 1765.30,
               2053.50, 2414.40, 2200.50, 2654.20, 1753.70, 2665.86])
xn = np.array([150.50, 230.75, 80.00, 170.00, 50.50, 190.00, 240.00, 20.50,
               70.50, 110.00, 130.00, 30.75, 250.00, 90.75, 220.00, 180.00,
               60.00, 120.50, 20.00, 210.50, 0.00])

# Añadir columna de unos para el término constante
X = sm.add_constant(xn)

# Ajuste del modelo de regresión lineal
model = sm.OLS(yn, X).fit()

# Obtener el valor del estadístico F del resumen
F_statistic = model.fvalue

# Número de coeficientes (k = 2: intercepto y pendiente)
k = 2

# Número total de observaciones
n = len(yn)

# Calcular las sumas de cuadrados
SSR = np.sum((model.predict() - np.mean(yn))**2)
SSE = np.sum((yn - model.predict())**2)

# Calcular MSR y MSE
MSR = SSR / k
MSE = SSE / (n - k - 1)

# Calcular el estadístico F
F_manual = MSR / MSE

# Mostrar resultados
print(f"Estadístico F (del resumen): {F_statistic:.4f}")
print(f"Estadístico F (manual): {F_manual:.4f}")
print(f"SSR: {SSR:.2f}")
print(f"SSE: {SSE:.2f}")
print(f"MSR: {MSR:.2f}")
print(f"MSE: {MSE:.2f}")
print(f"Número de observaciones (n): {n}")
print(f"Número de coeficientes (k): {k}")


In [None]:
import numpy as np
import statsmodels.api as sm

# Datos
yn = np.array([2158.70, 1678.15, 2316.00, 2061.30, 2207.50,
               1708.30, 1784.70, 2575.00, 2357.90, 2256.70,
               2165.20, 2399.55, 1779.80, 2336.75, 1765.30,
               2053.50, 2414.40, 2200.50, 2654.20, 1753.70, 2665.86])
xn = np.array([150.50, 230.75, 80.00, 170.00, 50.50, 190.00, 240.00, 20.50,
               70.50, 110.00, 130.00, 30.75, 250.00, 90.75, 220.00, 180.00,
               60.00, 120.50, 20.00, 210.50, 0.00])

# Añadir columna de unos para el término constante
X = sm.add_constant(xn)

# Ajuste del modelo de regresión lineal
model = sm.OLS(yn, X).fit()

# Obtener los parámetros del modelo
beta0, beta1 = model.params

# Número de observaciones (n) y número de coeficientes (k)
n = len(yn)
k = X.shape[1]

# Calcular las sumas de cuadrados (SSR y SSE)
SSR = np.sum((model.predict() - np.mean(yn))**2)
SSE = np.sum((yn - model.predict())**2)

# Calcular MSR y MSE
MSR = SSR / k
MSE = SSE / (n - k - 1)

# Calcular el estadístico F
F_manual = MSR / MSE

# Mostrar resultados
print(f"Estadístico F (manual): {F_manual:.4f}")
print(f"SSR: {SSR:.2f}")
print(f"SSE: {SSE:.2f}")
print(f"MSR: {MSR:.2f}")
print(f"MSE: {MSE:.2f}")
print(f"Número de observaciones (n): {n}")
print(f"Número de coeficientes (k): {k}")


In [None]:
import numpy as np
import statsmodels.api as sm

# Datos
yn = np.array([2158.70, 1678.15, 2316.00, 2061.30, 2207.50,
               1708.30, 1784.70, 2575.00, 2357.90, 2256.70,
               2165.20, 2399.55, 1779.80, 2336.75, 1765.30,
               2053.50, 2414.40, 2200.50, 2654.20, 1753.70, 2665.86])
xn = np.array([150.50, 230.75, 80.00, 170.00, 50.50, 190.00, 240.00, 20.50,
               70.50, 110.00, 130.00, 30.75, 250.00, 90.75, 220.00, 180.00,
               60.00, 120.50, 20.00, 210.50, 0.00])

# Añadir columna de unos para el término constante
X = sm.add_constant(xn)

# Ajuste del modelo de regresión lineal
model = sm.OLS(yn, X).fit()

# Predicciones del modelo
y_pred = model.predict(X)

# Calcular SSR y SSE
y_mean = np.mean(yn)
SSR = np.sum((y_pred - y_mean) ** 2)
SSE = np.sum((yn - y_pred) ** 2)

# Grados de libertad
n = len(yn)
k = X.shape[1]
df_reg = k - 1
df_res = n - k

# Calcular MSR y MSE
MSR = SSR / df_reg
MSE = SSE / df_res

# Calcular el estadístico F
F_manual = MSR / MSE

# Mostrar resultados
print(f"Estadístico F (manual): {F_manual:.4f}")
print(f"SSR: {SSR:.2f}")
print(f"SSE: {SSE:.2f}")
print(f"MSR: {MSR:.2f}")
print(f"MSE: {MSE:.2f}")
print(f"Número de observaciones (n): {n}")
print(f"Número de coeficientes (k): {k}")
print(f"Grados de libertad para la regresión (df_reg): {df_reg}")
print(f"Grados de libertad para el residuo (df_res): {df_res}")


In [None]:
import numpy as np
import statsmodels.api as sm
from scipy.stats import t

# Datos
yn = np.array([2158.70, 1678.15, 2316.00, 2061.30, 2207.50,
               1708.30, 1784.70, 2575.00, 2357.90, 2256.70,
               2165.20, 2399.55, 1779.80, 2336.75, 1765.30,
               2053.50, 2414.40, 2200.50, 2654.20, 1753.70, 2665.86])
xn = np.array([150.50, 230.75, 80.00, 170.00, 50.50, 190.00, 240.00, 20.50,
               70.50, 110.00, 130.00, 30.75, 250.00, 90.75, 220.00, 180.00,
               60.00, 120.50, 20.00, 210.50, 0.00])

# Ajustar el modelo de regresión
X = sm.add_constant(xn)
model = sm.OLS(yn, X).fit()

# Obtener los coeficientes
intercept, slope = model.params

# Obtener los errores estándar
stderr_intercept, stderr_slope = model.bse

# Nivel de confianza (95%)
confidence_level = 0.95
alpha = 1 - confidence_level
n = len(yn)  # número de observaciones
p = 2  # número de parámetros (intersección y pendiente)
dof = n - p  # grados de libertad

# Obtener el valor crítico de t
t_critical = t.ppf(1 - alpha/2, dof)

# Calcular el intervalo de confianza
ci_intercept = (intercept - t_critical * stderr_intercept, intercept + t_critical * stderr_intercept)
ci_slope = (slope - t_critical * stderr_slope, slope + t_critical * stderr_slope)

ci_intercept, ci_slope


In [None]:
import numpy as np
import statsmodels.api as sm

# Datos
yn = np.array([2158.70, 1678.15, 2316.00, 2061.30, 2207.50,
               1708.30, 1784.70, 2575.00, 2357.90, 2256.70,
               2165.20, 2399.55, 1779.80, 2336.75, 1765.30,
               2053.50, 2414.40, 2200.50, 2654.20, 1753.70, 2665.86])
xn = np.array([150.50, 230.75, 80.00, 170.00, 50.50, 190.00, 240.00, 20.50,
               70.50, 110.00, 130.00, 30.75, 250.00, 90.75, 220.00, 180.00,
               60.00, 120.50, 20.00, 210.50, 0.00])

# Ajustar el modelo de regresión
X = sm.add_constant(xn)
model = sm.OLS(yn, X).fit()

# Obtener los coeficientes
intercept, slope = model.params

# Obtener los errores estándar
stderr_intercept, stderr_slope = model.bse

# Mostrar resultados
intercept, slope, stderr_intercept, stderr_slope

# Valor crítico de t
t_critical = 2.093

# Calcular el intervalo de confianza para la intersección
ci_intercept_manual = (intercept - t_critical * stderr_intercept, intercept + t_critical * stderr_intercept)

# Calcular el intervalo de confianza para la pendiente
ci_slope_manual = (slope - t_critical * stderr_slope, slope + t_critical * stderr_slope)

ci_intercept_manual, ci_slope_manual

print(f"Intervalo de confianza para el intercepto: {ci_intercept_manual}")
print(f"Intervalo de confianza para la pendiente: {ci_slope_manual}")



In [None]:
import scipy.stats as stats

# Valores
F_statistic = 190.9
df_modelo = 1
df_error = 19

# Calcular el p-valor
p_value = 1 - stats.f.cdf(F_statistic, df_modelo, df_error)
p_value
