## Przygotowanie

Przed rozpoczęciem pracy z notatnikiem proszę zmienić jego nazwę dodając na początku numer albumu, imię i nazwisko.
{nr_albumu}\_{imię}\_{nazwisko}\_{nazwa}

Po wykonaniu wszystkich zadań proszę przesłać wypełniony notatnik przez platformę ELF za pomocą formularza "Prześlij projekt" w odpowiedniej sekcji. 

## Regresja liniowa wieloraka

Rzadko kiedy zdarza się taka sytuacja, że zależność opisuje się na podstawie tylko jednej zmiennej. Z reguły na wynik zmiennej objaśnianej ($y$) ma wpły więcej różnych cech. Przykładowo, na cenę samochodu ma wpływ rok produkcji, przebieg, ilość koni mechanicznych itp. Dlatego właśnie jest naturalna potrzeba rozwinięcia algorytmu regresji liniowej z jedną cechą na większą ilość cech.

Algorytm, który implementowaliśmy w poprzednim zadaniu jest szczególnym przypadkiem regresji liniowej, ale może zostać on w łatwy sposób uogólniony. Mechanizmy, które poznaliśmy wcześniej takie jak obliczanie funkcji błędu, pochodnych cząstkowych, w dalszym ciągu są aktualne. Trzeba jedynie uwzględnić dodatkowe cechy.

### Zadanie 1

W zbiorze danych z zarobkami, który wykorzystywany był w poprzednim zadaniu, znajduje się pominięta wcześniej cecha. Wczytaj dane z pliku Salary.csv, tym razem z dwiema zmiennymi objaśniającymi: YearsExperience i Age oraz zmienną objaśnianą Salary. Stwórz wykres 3D przedstawiający dane.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

df = pd.read_csv('Salary.csv', sep=',')

x = df["YearsExperience"]
y = df["Age"]
z = df["Salary"]

fig = plt.figure(figsize=(10,7))
ax = fig.add_subplot(111, projection='3d')

ax.scatter(x, y, z, c='blue', marker='o')
ax.set_xlabel('YearsExperience')
ax.set_ylabel('Age')
ax.set_zlabel('Salary')
ax.set_title('3D Scatter Plot')

plt.show()

## Zadanie 2

Przerób algorytm znajdujący się w funkcji _learn_and_fit(x,y)_ w taki sposób, aby uwzględniał dodatkową cechę.
Funkcja regresji liniowej przybierze w tym momencie postać:

\begin{equation}
f(x^{(i)}) = \beta_{0} + \beta_{1}x_1 + \beta_{2}x_2 = \beta_{0} + \beta_{1} YearsExperience + \beta_{2} Age
\end{equation}

Pojawienie się kolejnej cechy wymaga akutalizacji obliczania gradientu. Należy dodatkowo obliczyć pochodną cząstkową względem parametru $\beta_{2}$, a następnie zaktualizować wartość tego parametru. 

Obliczenie pochodnej cząstkowej wygląda analogicznie jak w przypadku parametru $\beta_{1}$.

\begin{equation}
    \frac{\partial SSR}{\partial \beta_{2}} = \frac{1}{n} \sum^{n}_{i=1} (f(x^{(i)}) - y^{(i)})x_{1}^{(i)}
\end{equation}

Aktualizacja wartości współczynnika również jest analogiczna.

\begin{equation}
    \beta_{2} = \beta_{2} - \alpha \frac{\partial SSR}{\partial \beta_{2}} 
\end{equation}

_Uwaga: Zastanów się, w jaki sposób zaimplementować obługę kolejnych cech, tak aby po pojawieniu się 3 cechy nie trzeba było modyfikować algorytmu._

In [None]:
import random
from typing import Tuple, List

def initialize_coefficients(n: int = 2, alpha = None) -> Tuple[float, np.ndarray]:
    if alpha is None:
        alpha = random.random()

    return alpha, np.array([random.random() for _ in range(n)])


def calculate_regression_function(X: np.ndarray, betas: np.ndarray) -> np.ndarray:
    return X @ betas


def calculate_error(predictions: np.ndarray, y: np.ndarray, betas: np.ndarray) -> float:
    m = y.shape[0]
    return (np.sum((predictions - y)**2))/(2*m)


def calculate_gradient(predictions: np.ndarray, X: np.ndarray, y: np.ndarray, betas: np.ndarray) -> np.ndarray:
    m = y.shape[0]
    diff = predictions - y
    return (X.T @ diff)/m

def update_regression_coefficients(X: np.ndarray, y: np.ndarray, betas: np.ndarray, alpha: float) -> np.ndarray:
    gradients = calculate_gradient(
        calculate_regression_function(X,betas),
        X,
        y,
        betas)
    return betas - alpha * gradients

In [None]:
'''
input:
X - wartości zmiennych objaśniających YearsExperience oraz Age dla wszystkich obserwacji
y - wartości zmiennej objaśnianej Salary dla wszystkich obserwacji

output:
b0: [] - lista z współczynnikami beta_0 w każdej z epok
betas: [] - lista z współczynnikami beta_1, beta_2 w każdej z epok
error: [] - lista z błędem w każdej epoce
'''
def learn_and_fit(X: np.ndarray, y: np.ndarray, alpha=0.1, epochs=100) -> Tuple[np.ndarray, np.ndarray, np.ndarray]:
    X = np.asarray(X)
    y = np.asarray(y)
    X = (X - np.mean(X)) / np.std(X)
    y = (y - np.mean(y)) / np.std(y)

    # Add a column of ones for the bias (beta_0)
    X = np.hstack((np.ones((X.shape[0], 1)), X))


    errors = []
    b0 = []
    betas = []

    alpha , betas_values = initialize_coefficients(n=X.shape[1] ,alpha=alpha)
    tolerance = 1e-4

    for i in range(epochs) :
        predictions = calculate_regression_function(X, betas_values)
        error = calculate_error(predictions, y, betas_values)
        errors.append(error)
        betas_values = update_regression_coefficients(X, y, betas_values, alpha)
        b0.append(betas_values[0].copy())
        betas.append(betas_values[1:].copy())

        if i > 0 and abs(errors[-1] - errors[-2]) < tolerance:
            print(f"Stop at epoch {i}, error change < {tolerance}")
            break

    return np.array(b0), np.array(betas), np.array(errors)

In [121]:
df = pd.read_csv('Salary.csv', sep=',')

xx = df[["YearsExperience", "Age"]]
y = df["Salary"]
print(np.array(xx))
b0s, all_betas, errors = learn_and_fit(xx, y, alpha=0.01, epochs=200)
print(f"b0s: {b0s}\n allbetas: {all_betas} \n errors: {errors}")

[[ 1.1 20. ]
 [ 1.3 21. ]
 [ 1.5 21. ]
 [ 2.  22. ]
 [ 2.2 22. ]
 [ 2.9 22. ]
 [ 3.  23. ]
 [ 3.2 24. ]
 [ 3.2 24. ]
 [ 3.7 24. ]
 [ 3.9 25. ]
 [ 4.  25. ]
 [ 4.  25. ]
 [ 4.1 25. ]
 [ 4.5 26. ]
 [ 4.9 26. ]
 [ 5.1 26. ]
 [ 5.3 27. ]
 [ 5.9 28. ]
 [ 6.  29. ]
 [ 6.8 29. ]
 [ 7.1 29. ]
 [ 7.9 31. ]
 [ 8.2 31. ]
 [ 8.7 32. ]
 [ 9.  32. ]
 [ 9.5 33. ]
 [ 9.6 34. ]
 [10.3 36. ]
 [10.5 34. ]
 [11.2 36. ]
 [11.5 36. ]
 [12.3 37. ]
 [12.9 40. ]
 [13.5 38. ]]
b0s: [0.87632344 0.87287734 0.8695145  0.86623269 0.86302974 0.85990355
 0.85685206 0.85387328 0.85096527 0.84812614 0.84535405 0.84264721
 0.84000389 0.83742239 0.83490106 0.8324383  0.83003256 0.82768231
 0.82538608 0.82314244 0.82094998 0.81880735 0.81671323 0.81466633
 0.81266539 0.81070921 0.80879659 0.80692638 0.80509745 0.80330873
 0.80155914 0.79984766 0.79817327 0.796535   0.79493189 0.79336303
 0.7918275  0.79032444 0.78885299 0.78741232 0.78600162 0.78462011
 0.78326701 0.7819416  0.78064314 0.77937093 0.77812428 0.77690254
 0.

### Zadanie 3

Do stworzonego z zadaniu 1 wykresu dodaj płaszczyznę regresji. Stwórz 3 wykresy przedstawiające jak zmieniała się funkcja regresji na przestrzeni epok (pierwsza, środkowa, ostatnia epoka).

In [None]:
import plotly.graph_objects as go
import numpy as np

# Normalize input data (if not already normalized)
xx = (xx - np.mean(xx, axis=0)) / np.std(xx, axis=0)
z = (y - np.mean(y, axis=0)) / np.std(y, axis=0)

# Generate surface grid
x_surf, y_surf = np.meshgrid(
    np.linspace(xx.iloc[:, 0].min(), xx.iloc[:, 0].max(), 100),
    np.linspace(xx.iloc[:, 1].min(), xx.iloc[:, 1].max(), 100)
)

# Calculate predicted z values (regression plane)
z_surf = b0s[-1] + all_betas[-1][0] * x_surf + all_betas[-1][1] * y_surf

# Create plot
fig = go.Figure()

# Add regression surface
fig.add_trace(go.Surface(
    x=x_surf,
    y=y_surf,
    z=z_surf,
    colorscale='Blues',
    opacity=0.6,
    name='Regression Plane',
    showscale=False
))

# Add scatter plot (data points)
fig.add_trace(go.Scatter3d(
    x=xx.iloc[:, 0],
    y=xx.iloc[:, 1],
    z=z,
    mode='markers',
    marker=dict(size=5, color='red'),
    name='Data Points'
))

# Layout settings
fig.update_layout(
    title='3D Regression Plane with Data Points (Plotly)',
    scene=dict(
        xaxis_title='YearsExperience',
        yaxis_title='Age',
        zaxis_title='Salary'
    ),
    width=800,
    height=700
)

fig.show()

### Zadanie 4

W sytuacji, w której zbiór danych zawiera więcej zmiennych objaśniających niż 2, niemożliwym staje się wizualizacja prostej regresji i ocena w taki sposób stworzonego modelu. Bardzo przydatnym rozwiązaniem jest wtedy stworzenie wykresu błędów regresji. Jeśli wartości błędu spadają wraz z kolejnymi epokami, oznacza to, że jesteśmy na dobrej drodze, a nasz algorytm działa poprawnie. Celem tego zadania będzie stworzenie finalnego modelu regresji liniowej, który będzie przyjmował dowolną liczbę zmiennych objaśniających.

Na podstawie wcześniejszych implementacji, stwórz implementację funkcji *learn_and_fit_multi(X, y)*, która będzie przyjmować zbiór wejściowy z dowolną ilością kolum (cech). Dla takiego zbioru zbioru danych ma zostać stworzony model regresji. Funkcja podobnie jak wcześniej, ma zwracać współczynniki oraz wartość błędu w każdej epoce. 

W notebooku z opisem regresji liniowej przedstawione zostały wzory na ogólą postać regresji. Przeanalizuj je jeszcze raz i postaraj się je zaimplementować.

Wczytaj zestaw danych *multi_variable_regression.csv* z katalogu datasets. Dane wygenerowane zostały w taki sposób, że są wysoce liniowo zależne. Wartość błędu dla nauczonego modelu powinna być w takim przypadku niewielka. Przetestuj na wczytanym zbiorze swój algorytm.

In [None]:
import pandas as pd

df = pd.read_csv("multi_variable_regression.csv")

# Algorithm for multi variable regression has been implemented in task 2.
xx = df.iloc[:, :-2]
y = df.iloc[:, -1]

b0s, all_betas, errors = learn_and_fit(xx, y, alpha=0.01, epochs=200)
print(f"errors: {errors}")
print(f"{errors.shape}")


### Zadanie 5

Stwórz wykres przedstawiający zmianę błędu regresji w kolejnych epokach. Napisz co można na jego podstawie wywnioskować.

In [None]:
import matplotlib.pyplot as plt

plt.figure(figsize=(8, 5))
plt.plot(range(len(errors)), errors, marker='o', linestyle='-', markersize=2)
plt.title("Regression Error chart")
plt.xlabel("Epoch")
plt.ylabel("Error (Loss)")
plt.grid(True)
plt.show()

plt.show()

### Zadanie 6

W jaki sposób współczynnik alpha wpływa na działania algorytmu? Przeprowadź eksperyment dla minimum trzech różnych wartości tego parametru. Sformułuj wnioski. Jak zmiana parametru wpłynęła na ilość epok w algorytmie? Jak zmieniła się funkcja regresji?

In [None]:
df = pd.read_csv("multi_variable_regression.csv")

# Algorithm for multi variable regression has been implemented in task 2.
xx = df.iloc[:, :-2]
y = df.iloc[:, -1]
alpha_list = [0.001, 0.01, 0.1, 0.5, 1]

for alpha in alpha_list:
    b0s, all_betas, errors = learn_and_fit(xx, y, alpha=alpha, epochs=300)
    print(f"alpha: {alpha}")
    print(f"error: {errors[-1]}")
    print(f"epochs: {errors.shape[0]}")
    plt.plot(errors, label=f'alpha={alpha}')
plt.legend()
plt.title("The influence of alpha coefficient on errors in epochs")
plt.xlabel("Epoch")
plt.ylabel("Error")
plt.show()

# As we can observe, alpha >= 0.01 gives similar effect regarding error value, but higher alpha => less number of epochs to train.

### Zadanie 7

Porównaj czas działania algorytmu we własnej implementacji oraz implementacji z biblioteki Sklearn.

In [None]:
import time
import numpy as np
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt

df = pd.read_csv("multi_variable_regression.csv")
xx = df.iloc[:, :-2]
y = df.iloc[:, -1]

start_time = time.time()
for i in range(1000):
    b0, betas, errors = learn_and_fit(xx, y, alpha=0.01, epochs=200)
my_algorithm_time = time.time() - start_time

# scikit-learn
xx = (xx - np.mean(xx, axis=0)) / np.std(xx, axis=0)
y = (y - np.mean(y, axis=0)) / np.std(y, axis=0)

model = LinearRegression()
start_time = time.time()
for i in range(1000):
    model.fit(xx, y)
sklearn_time = time.time() - start_time

plt.plot(errors)
plt.title("Error per epoch - my implementation")
plt.xlabel("Epoch")
plt.ylabel("Error")
plt.show()

print(f"My algorithm - time: {my_algorithm_time:.4f} sec")
print(f"Scikit-learn - time: {sklearn_time:.4f} sec")

# MSE error
y_pred = model.predict(xx)
error_sklearn = np.mean((y_pred - y) ** 2)
print(f"Error for scikit-learn: {error_sklearn:.4f}")
print(f"Error for my implementation: {errors[-1]:.4f}")