In [9]:
# zad 17.03

import numpy as np
import matplotlib
import matplotlib.pyplot as plt
import ipywidgets as widgets
import pandas as pd

%matplotlib inline
%config InlineBackend.figure_format = "svg"

from IPython.display import display, Math, Latex


# funkcje
def h(theta, x):
    return theta[0] + theta[1] * x


def J(h, theta, x, y):
    """Funkcja kosztu"""
    m = len(y)
    return 1.0 / (2 * m) * sum((h(theta, x[i]) - y[i])**2 for i in range(m))


def LatexMatrix(matrix):
    ltx = r'\left[\begin{array}'
    m, n = matrix.shape
    ltx += '{' + ("r" * n) + '}'
    for i in range(m):
        ltx += r" & ".join([('%.4f' % j.item()) for j in matrix[i]]) + r" \\ "
    ltx += r'\end{array}\right]'
    return ltx


def gradient_descent(h, cost_fun, theta, x, y, alpha, eps):
    current_cost = cost_fun(h, theta, x, y)
    log = [[current_cost, theta]]  # log przechowuje wartości kosztu i parametrów
    m = len(y)
    while True:
        new_theta = [
            theta[0] - alpha/float(m) * sum(h(theta, x[i]) - y[i]
                                            for i in range(m)),   
            theta[1] - alpha/float(m) * sum((h(theta, x[i]) - y[i]) * x[i]
                                            for i in range(m))]
        theta = new_theta  # jednoczesna aktualizacja - używamy zmiennej tymczasowej
        prev_cost = current_cost
        current_cost = cost_fun(h, theta, x, y)
        if current_cost > prev_cost:
            print("Zbyt duża długość kroku!")
            break
        if abs(prev_cost - current_cost) <= eps:
            break     
        log.append([current_cost, theta])
    return theta, log


# wykonanie
## wczytanie danych
data = pd.read_csv("fires_thefts.csv", names=['fires', 'thefts'])
x_fires = data["fires"].tolist() # albo - .to_numpy().flatten()
y_thefts = data["thefts"].tolist()

## wytrenowanie modelu za pomoca iteracyjnego gradientu prostego
best_theta, log = gradient_descent(h, J, [0.0, 0.0], x_fires, y_thefts, alpha=0.001, eps=0.0000001)

display(Math(r'\large\textrm{Wynik:}\quad \theta = ' + 
             LatexMatrix(np.matrix(best_theta).reshape(2,1)) + 
            (r' \quad J(\theta) = %.4f' % log[-1][0])  
            + r' \quad \textrm{po %d iteracjach}' % len(log))) 


#predykcja
example_fires = [50, 100, 200]
for example in example_fires: print(f"Przewidywana ilosc kradziezy dla {example} pozarow: {h(best_theta, example)}")

<IPython.core.display.Math object>

Przewidywana ilosc kradziezy dla 50 pozarow: 82.70999487819813
Przewidywana ilosc kradziezy dla 100 pozarow: 148.45251499453076
Przewidywana ilosc kradziezy dla 200 pozarow: 279.93755522719596
