# Вариант 1

In [1]:
import numpy as np
import pandas as pd
from scipy.stats import t

data = pd.read_csv("mobile_phones.csv")

X = data[["sc_h", "sc_w", "battery_power"]]
y = data["mobile_wt"].values
# Добавим столбец с единицами для свободного коффициента
X = np.concatenate((np.ones((X.shape[0], 1), dtype=int), X), axis=1)

Посчитаем оценки коэффициентов при помощи формулы $coef = (X^TX)^{-1}X^Ty$
Посчитаем остатки модели для дальнейшего расчёт среднеквадратичной ошибки и стандартной ошибки

In [2]:
coefficients = np.linalg.inv(X.T @ X) @ X.T @ y
y_pred = X @ coefficients
residuals = y - y_pred

n = X.shape[0]
k = X.shape[1]
mse = np.sum(residuals ** 2) / (n - k)
standart_errors = np.sqrt(np.diagonal(mse * np.linalg.inv(X.T @ X)))

Посчитам коэффициент детерминации, чтобы посмотреть, насколько хорошо наша модель соответствует исходным данным. Для этого найдём Sum of Squares Residual (SS_res) и Sum of Squares Total (SS_tot)

In [3]:
SS_res = np.sum((y - y_pred) ** 2)
SS_tot = np.sum((y - np.mean(y)) ** 2)
r_squared = 1 - SS_res / SS_tot
r_squared

0.0011644496581528774

Можем заметить, что значение $R^2$ близко к нулю, что говорит о том, что наша модель почти не показывает реальной картины

# Проверка гипотезы 1:
# $H_0$: Чем больше высота экран тем больше масса телефона
# $H_1$: Масса телефона не зависит от высоты экрана

In [4]:
t_stat_sc_h = coefficients[2] / standart_errors[2]
p_val_sc_h = 1 - t.cdf(t_stat_sc_h, n - k)
alpha = 0.05
if p_val_sc_h < alpha:
    print("Принимаем нулевую гипотезу")
else:
    print("Отвергаем нулевую гипотезу. Масса не зависит от ширины экрана")

Отвергаем нулевую гипотезу. Масса не зависит от ширины экрана


# Проверка гипотезы 2:
# $H_0$: Чем шире экран тем больше масса телефона
# $H_1$: Масса телефона не зависит от ширины экрана

In [5]:
t_stat_sc_w = coefficients[1] / standart_errors[1]
p_val_sc_w = 1 - t.cdf(t_stat_sc_w, n - k)
alpha = 0.05
if p_val_sc_w < alpha:
    print("Принимаем нулевую гипотезу")
else:
    print("Отвергаем нулевую гипотезу. Масса не зависит от ширины экрана")

Отвергаем нулевую гипотезу. Масса не зависит от ширины экрана


# Проверка гипотезы 3:
# $H_0$: Масса телефона зависит от ширины экрана и ёмкости аккумулятора
# $H_1$: Масса не зависит от этих параметров

In [6]:
t_stat_sc_w_battery = coefficients[1:3] / standart_errors[1:3]
p_val_sc_w_battery = 2 * (1 - t.cdf(t_stat_sc_h, n - k))
alpha = 0.05
if p_val_sc_h < alpha:
    print("Принимаем нулевую гипотезу")
else:
    print("Отвергаем нулевую гипотезу. Ширина экрана и ёмкость аккумулятора не влияют на массу")

Отвергаем нулевую гипотезу. Ширина экрана и ёмкость аккумулятора не влияют на массу
