# Laboratorium 3 - Kacper Dudczak

## Zadanie:

Plik fires_thefts.csv zawiera rzeczywiste dane zebrane przez U.S. Commission on Civil Rights, przedstawiające liczbę pożarów w danej dzielnicy na tysiąc gospodarstw domowych (pierwsza kolumna) oraz liczbę włamań w tej samej dzielnicy na tysiąc mieszkańców (druga kolumna).

Stwórz model (regresja liniowa) przewidujący liczbę włamań na podstawie liczby pożarów:

- Oblicz parametry 𝜃 krzywej regresyjnej za pomocą metody gradientu prostego (gradient descent). Możesz wybrać wersję iteracyjną lub macierzową algorytmu.
- Wykorzystując uzyskaną krzywą regresyjną przepowiedz liczbę włamań na tysiąc mieszkańców dla dzielnicy, w której występuje średnio 50, 100, 200 pożarów na tysiąc gospodarstw domowych.



In [8]:
import numpy as np
import matplotlib
import matplotlib.pyplot as plt
import ipywidgets as widgets
import pandas as pd

%matplotlib inline
%config InlineBackend.figure_format = "svg"

from IPython.display import display, Math, Latex

### Wczytanie danych

In [9]:
data = pd.read_csv("fires_thefts.csv", names=["x", "y"])
print(data)

x = data[["x"]].to_numpy().flatten()
y = data[["y"]].to_numpy().flatten()

       x    y
0    6.2   29
1    9.5   44
2   10.5   36
3    7.7   37
4    8.6   53
5   34.1   68
6   11.0   75
7    6.9   18
8    7.3   31
9   15.1   25
10  29.1   34
11   2.2   14
12   5.7   11
13   2.0   11
14   2.5   22
15   4.0   16
16   5.4   27
17   2.2    9
18   7.2   29
19  15.1   30
20  16.5   40
21  18.4   32
22  36.2   41
23  39.7  147
24  18.5   22
25  23.3   29
26  12.2   46
27   5.6   23
28  21.8    4
29  21.6   31
30   9.0   39
31   3.6   15
32   5.0   32
33  28.6   27
34  17.4   32
35  11.3   34
36   3.4   17
37  11.9   46
38  10.5   42
39  10.7   43
40  10.8   34
41   4.8   19


In [10]:
# Hipoteza: funkcja liniowa jednej zmiennej

def h(theta, x):
    return theta[0] + theta[1] * x

In [11]:
def J(h, theta, x, y):
    """Funkcja kosztu"""
    m = len(y)
    return 1.0 / (2 * m) * sum((h(theta, x[i]) - y[i])**2 for i in range(m))

In [12]:
# Wyświetlanie macierzy w LaTeX-u

def LatexMatrix(matrix):
    ltx = r'\left[\begin{array}'
    m, n = matrix.shape
    ltx += '{' + ("r" * n) + '}'
    for i in range(m):
        ltx += r" & ".join([('%.4f' % j.item()) for j in matrix[i]]) + r" \\ "
    ltx += r'\end{array}\right]'
    return ltx

In [13]:
def gradient_descent(h, cost_fun, theta, x, y, alpha, eps):
    current_cost = cost_fun(h, theta, x, y)
    log = [[current_cost, theta]]  # log przechowuje wartości kosztu i parametrów
    m = len(y)
    while True:
        new_theta = [
            theta[0] - alpha/float(m) * sum(h(theta, x[i]) - y[i]
                                            for i in range(m)),   
            theta[1] - alpha/float(m) * sum((h(theta, x[i]) - y[i]) * x[i]
                                            for i in range(m))]
        theta = new_theta  # jednoczesna aktualizacja - używamy zmiennej tymczasowej
        prev_cost = current_cost
        current_cost = cost_fun(h, theta, x, y)
        if current_cost > prev_cost:
            print("Zbyt duża długość kroku!")
            break
        if abs(prev_cost - current_cost) <= eps:
            break     
        log.append([current_cost, theta])
    return theta, log

In [14]:
best_theta, log = gradient_descent(h, J, [0.0, 0.0], x, y, alpha=0.001, eps=0.0000001)

display(Math(r'\large\textrm{Wynik:}\quad \theta = ' + 
             LatexMatrix(np.matrix(best_theta).reshape(2,1)) + 
            (r' \quad J(\theta) = %.4f' % log[-1][0])  
            + r' \quad \textrm{po %d iteracjach}' % len(log))) 

<IPython.core.display.Math object>

### Przewidywanie ilości włamań na tysiąc mieszkańców dla dzielnicy, w której występuje średnio 50/100/150/200 pożarów

In [36]:
def slide1(example1):
    print(f"Przewidywana liczba włamań na tysiąc mieszkańców dla dzielnicy, w której występuje średnio {example1} pożarow: {h(best_theta, example1)}")

slider_e = widgets.IntSlider(min=50, max=200, step=50, value=1.0, description="Pożary", width=500)

In [37]:
widgets.interact_manual(slide1, example1=slider_e)

interactive(children=(IntSlider(value=50, description='Pożary', max=200, min=50, step=50), Button(description=…

<function __main__.slide1(example1)>