Рассмотреть феномен (явление) Рунге — в численном анализе эффект нежелательных осцилляций, возникающий при интерполяции полиномами высоких степеней.

Функция $$ y(x)=  \frac{1}{(1+25∙x^2)} $$ на отрезке $$ x∈[-2,2]$$

Обучающая выборка: $$ S^l={x_i=4∙\frac{(i-1)}{(l-1)}-2 | i=1,…,l} $$

Контрольная выборка: $$ S^k={x_i=4∙\frac{(i-0.5)}{(l-1)}-2 | i=1,…,l-1} $$

Рассчитать функционал эмпирического риска (функционал качества) для обучающей и контрольной выборок (вывести графики). Оценить обобщающую способность (generalization ability). Найти оптимальную степень полинома для аппроксимации.

Повторить для зашумленных данных.

In [8]:
import numpy as np
import matplotlib.pyplot as plt

In [9]:
def true_func(x):
    return 1 / (1 + 25*x**2)

In [10]:
# генерация обучающей выборки
l = 20
train_set = np.array([4*(i-1)/(l-1) - 2 for i in range(1, l+1)])
train_labels = true_func(train_set)

# генерация контрольной выборки
k = 50
test_set = np.array([4*(i-0.5)/(k-1) - 2 for i in range(1, k)])
test_labels = true_func(test_set)

# функционал эмпирического риска (MSE)
def mse(y_true, y_pred):
    return np.mean((y_true - y_pred)**2)

# определение степени полинома и построение модели на обучающей выборке
degrees = range(1, 16)
train_loss = []
test_loss = []
for deg in degrees:
    # обучение модели
    p = np.polyfit(train_set, train_labels, deg)
    model = np.poly1d(p)
    
    # расчет ошибки на обучающей и контрольной выборках
    train_pred = np.polyval(model, train_set)
    test_pred = np.polyval(model, test_set)
    train_loss.append(mse(train_labels, train_pred))
    test_loss.append(mse(test_labels, test_pred))
    


plt.plot(x, true_func(x))
plt.xlabel('x')
plt.ylabel('y')
plt.title('Function y(x) = 1 / (1 + 25*x^2)')
plt.show()

# вывод графиков
plt.plot(degrees, train_loss, label='Training loss')
plt.plot(degrees, test_loss, label='Test loss')
plt.legend()
plt.xlabel('Степень полинома')
plt.ylabel('Среднеквадратическая ошибка')
plt.show()


NameError: name 'x' is not defined

In [46]:
# нахождение индекса элемента списка test_loss с минимальным значением
min_idx = np.argmin(test_loss)

# степень, при которой ошибка на контрольной выборке минимальна
print("Оптимальная степень полинома:", degrees[min_idx])

Оптимальная степень полинома: 13


In [48]:
# вывод результатов
for i, deg in enumerate(degrees):
    print(f"Степень {deg}:")
    print(f"Train MSE = {train_loss[i]:.3f}")
    print(f"Test MSE = {test_loss[i]:.3f}\n")

Степень 1:
Train MSE = 0.052
Test MSE = 0.057

Степень 2:
Train MSE = 0.036
Test MSE = 0.039

Степень 3:
Train MSE = 0.036
Test MSE = 0.039

Степень 4:
Train MSE = 0.024
Test MSE = 0.026

Степень 5:
Train MSE = 0.024
Test MSE = 0.026

Степень 6:
Train MSE = 0.015
Test MSE = 0.018

Степень 7:
Train MSE = 0.015
Test MSE = 0.018

Степень 8:
Train MSE = 0.010
Test MSE = 0.012

Степень 9:
Train MSE = 0.010
Test MSE = 0.012

Степень 10:
Train MSE = 0.006
Test MSE = 0.008

Степень 11:
Train MSE = 0.006
Test MSE = 0.008

Степень 12:
Train MSE = 0.003
Test MSE = 0.008

Степень 13:
Train MSE = 0.003
Test MSE = 0.008

Степень 14:
Train MSE = 0.002
Test MSE = 0.033

Степень 15:
Train MSE = 0.002
Test MSE = 0.033

