<a href="https://colab.research.google.com/github/chabann/econometric/blob/main/%D0%97%D0%B0%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
import numpy as np
from scipy import stats

x = np.array([78, 82, 87, 79, 89, 106, 67, 88, 73, 87, 76, 115])
y = np.array([133, 148, 134, 154, 162, 195, 139, 158, 152, 162, 159, 173])
n = len(x)

In [2]:
x1, y1 = zip(*sorted(zip(x, y)))

In [3]:
x1 = np.array(x1)
y1 = np.array(y1)

x2 = sum(x1) / n
y2 = sum(y1) / n
x2y2 = sum([x1[i] * y1[i]  / n for i in range(n)])
x22 = sum([x1[i] * x1[i]  / n for i in range(n)])

b = (x2y2 - x2 * y2) / (x22 - x2 * x2)
a = y2 - b * x2

print('Параметры a и b методом наименьших квадратов')
print(f'a: {a}')
print(f'b: {b}')
print('')
print('Выборочные средние:')
print(f'x2 (Выборочное среднее): {x2}')
print(f'y2 (Выборочное среднее): {y2}')

Параметры a и b методом наименьших квадратов
a: 76.97648519975228
b: 0.9204305526805966

Выборочные средние:
x2 (Выборочное среднее): 85.58333333333333
y2 (Выборочное среднее): 155.75


In [4]:
sigma_x2 = sum([(x1[i] - x2) ** 2 for i in range(n)]) / n
sigma_y2 = sum([(y1[i] - y2) ** 2 for i in range(n)]) / n
print('Выборочные дисперсии:')
print(f'sigma_x: {sigma_x2}')
print(f'sigma_y: {sigma_y2}')

Выборочные дисперсии:
sigma_x: 167.74305555555557
sigma_y: 273.3541666666667


In [5]:
r_xy = sum([(x1[i] - x2) * (y1[i] - y2) for i in range(n)]) / (n * sigma_x2 * sigma_y2)

print('Выборочный коэффициент корреляции:')
print(f'r_xy: {r_xy}')

Выборочный коэффициент корреляции:
r_xy: 0.003367172207047405


In [6]:
y3 = np.array([a + x1[i] * b for i in range(n)])

y_mean = y1.mean()
y3_mean = y3.mean()
y_y3_mean = (y3 * y1).mean()
y3_var = np.var(y3)
y1_var = np.var(y1)

corr = (y_y3_mean - y_mean * y3_mean) / (np.sqrt(y3_var * y1_var))
print(f'Корреляция {corr}')

determ = corr ** 2
print(f'Коэффициент детерминации R^2: {determ}')

diff_y1_y3 = y1 - y3
sum = 0
for i in range(n):
  sum += np.abs(diff_y1_y3[i] / y1[i])

A = sum * 100 / n
print(f'Ошибка приближения A: {A}')


Корреляция 0.7210252137643343
Коэффициент детерминации R^2: 0.519877358883904
Ошибка приближения A: 5.752052116927113


In [7]:
x_p = 92
y_p = a + x_p * b

print('Проверка статистической значимости')

S = 0
for i in range(n):
  S += (y1[i] - y3[i]) ** 2
S = np.sqrt(S / (n - 2))

print(f'Полученное значение Sост: {S}')

m_a = S * np.sqrt((x1 ** 2).sum()) / (np.sqrt(x1.var(ddof=0)) * n)
m_b = S / (np.sqrt(x1.var(ddof=0) * n))

print(f'm_a = {m_a}, m_b = {m_b}')
print('')

x_diff_mean = np.array([(x1[i] - x1.mean()) ** 2 for i in range(n)])
m_y = S * np.sqrt(1 + 1 / n + ((x_p - x1.mean()) ** 2) / x_diff_mean.sum())

print(f'm_y = {m_y}')
print('')

t_a = a / m_a
t_b = b / m_b

print(f'Статистика t_a для параметра a: {t_a}')
print(f'Статистика t_b для параметра b: {t_b}')

print('')

""" Квантиль Стьюдента для mu = 5% и n-2 степеней свободы """

print('')

SQ = stats.t.ppf(1 - 0.05, n - 2)
print(f'Квантиль Стьюдента: {SQ}')
print('')

t_r = corr * np.sqrt((n - 2) / (1 - corr ** 2))

print(f'Статистика t_r для коэффициента корреляции: {t_r}')
print('')

if abs(t_r) >= SQ:
  print('Коэффициент корреляции t_r статистически значим')
else:
  print('Коэффициент корреляции t_r статистически не значим')

F = determ ** 2 * (n - 2)/(1 - determ ** 2)

print('')
print(f'F: {F}')
print('')

if abs(F) >= SQ:
  print('Коэффициент детерминации F статистически значим')
else:
  print('Коэффициент детерминации F статистически не значим')


FQ = stats.f.ppf(1 - 0.05, 1, n - 2)

print(f'Квантиль Фишера: {FQ}')
print('')

if abs(t_a) >= SQ:
  print('Параметр a статистически значим')
else:
  print('Параметр a статистически не значим')
print('')

if abs(t_b) >= SQ:
  print('Параметр b статистически значим')
else:
  print('Параметр b статистически не значим')
print('')


print("Доверительный интервал для параметра a = (%f , %f)"% (a - m_a * SQ , a + m_a * SQ))
print('')
print("Доверительный интервал для параметра b = (%f , %f)"% (b - m_b * SQ , b + m_b * SQ))
print('')
print("Доверительный интервал для предсказания y = (%f , %f)"% (y_p - m_y * SQ , y_p + m_y * SQ))


Проверка статистической значимости
Полученное значение Sост: 12.549590804169705
m_a = 24.21156138272578, m_b = 0.2797155867097203

m_y = 13.184765392655066

Статистика t_a для параметра a: 3.1793275940754766
Статистика t_b для параметра b: 3.290594433823201


Квантиль Стьюдента: 1.8124611228107335

Статистика t_r для коэффициента корреляции: 3.2905944338230984

Коэффициент корреляции t_r статистически значим

F: 3.703744980583337

Коэффициент детерминации F статистически значим
Квантиль Фишера: 4.9646027437307145

Параметр a статистически значим

Параметр b статистически значим

Доверительный интервал для параметра a = (33.093971 , 120.858999)

Доверительный интервал для параметра b = (0.413457 , 1.427404)

Доверительный интервал для предсказания y = (137.759221 , 185.552971)
