In [21]:
import pandas as pd
import numpy as np
from io import StringIO
from IPython.display import display
import matplotlib.pyplot as plt
import seaborn as sns

sns.set_style("darkgrid")

In [22]:
x_vec = np.array(
    [1900, 1910, 1920, 1930, 1940, 1950, 1960, 1970, 1980], dtype=np.double
)
y_vec = np.array(
    [
        76_212_168,
        92_228_496,
        106_021_537,
        123_202_624,
        132_164_569,
        151_325_798,
        179_323_175,
        203_302_031,
        226_542_199,
    ],
    dtype=np.double,
)

In [23]:
steps = range(7)
results = {}

In [24]:
def vandermonde_matrix(x, m):
    return np.vander(x, m + 1, increasing=True)


def solve_factorials(A, y):
    return np.linalg.solve(A.T @ A, A.T @ y)


In [25]:
for m in steps:
    A = vandermonde_matrix(x_vec, m)
    b = solve_factorials(A, y_vec)
    results[m] = b

In [26]:
def evaluate_polynomial(x, b):
    result = 0
    for i, coef in enumerate(b):
        result += coef * (x**i)
    return result

In [27]:
for m, b in results.items():
    x = 1990
    y = evaluate_polynomial(x, b)
    print(f"Prognoza populacji w {x} roku: {y:.0f}, dla m={m}")
    print(f"względny błąd prognozy: {abs(y - 248_709_873) / 248_709_873:.2%}")

Prognoza populacji w 1990 roku: 143369177, dla m=0
względny błąd prognozy: 42.35%
Prognoza populacji w 1990 roku: 235808109, dla m=1
względny błąd prognozy: 5.19%
Prognoza populacji w 1990 roku: 254712945, dla m=2
względny błąd prognozy: 2.41%
Prognoza populacji w 1990 roku: 261439719, dla m=3
względny błąd prognozy: 5.12%
Prognoza populacji w 1990 roku: 256411956, dla m=4
względny błąd prognozy: 3.10%
Prognoza populacji w 1990 roku: 226938061, dla m=5
względny błąd prognozy: 8.75%
Prognoza populacji w 1990 roku: 243501315, dla m=6
względny błąd prognozy: 2.09%


In [28]:
def calculate_mean_squared_error(y, y_pred):
    return np.mean((y - y_pred) ** 2)

In [29]:
def AIC(m, y_vec, y_pred):
    n = len(y_vec)
    return 2 * (m + 1) + n * np.log(np.sum((y_vec - y_pred) ** 2) / n)


def AICc(AIC, m, n):
    return AIC + 2 * (m + 1) * (m + 2) / (n - m - 2)

In [30]:
for m, b in results.items():
    y_pred = evaluate_polynomial(x_vec, b)
    mse = calculate_mean_squared_error(y_vec, y_pred)
    aic = AIC(m, y_vec, y_pred)
    aicc = AICc(aic, m, len(y_vec))
    print(f"AIC dla m={m}: {aic:.2f}, AICc: {aicc:.2f}")

AIC dla m=0: 320.44, AICc: 321.01
AIC dla m=1: 287.06, AICc: 289.06
AIC dla m=2: 274.65, AICc: 279.45
AIC dla m=3: 274.88, AICc: 284.88
AIC dla m=4: 274.54, AICc: 294.54
AIC dla m=5: 277.71, AICc: 319.71
AIC dla m=6: 274.87, AICc: 386.87
