# Multivariate Linear Regression: Cost function
M2U2 - Exercise 1

## What are we going to do?
- Implement the cost function for multivariate linear regression

Remember to follow the instructions for the submission of assignments indicated in [Submission Instructions](https://github.com/Tokio-School/Machine-Learning-EN/blob/main/Submission_instructions.md).

In [1]:
import numpy as np

## Task 1: Implement the cost function for multivariate linear regression

In this task, you must implement the cost function for multivariate linear regression in Python using NumPy. The cost function must follow the function included in the slides and in the course manual.

To do this, first fill in the code in the following cell to implement the cost function.

The differences between a vectorised and a non-vectorised implementation are as follows:
- Vectorised uses linear algebra operations, from operations between vectors/matrices.
- Non-vectorised is implemented with Python for control loops, iterating between sequences/lists of elements one at a time.
- Vectorised uses Numpy, its ndarray arrays and operations such as np.matmul().
- Non-vectorised is less efficient, as it does not use Numpy's numerical methods over C++ operations.
- However, non-vectorised is much easier to understand at first, being pure Python, without relying on other functions and vector dimensions.

Recall the equation:

$$Y = h_\Theta(X) = X \times \Theta^T$$

$$J_\theta = \frac{1}{2m} \sum_{i = 0}^{m} (h_\theta(x^i) - y^i)^2$$

To implement it, follow these steps:
1. Take some time to review the equation and make sure you understand all the mathematical operations reflected in it
1. Go back to previous exercises or review the slides and write down on a sheet of paper (or auxiliary cell) the dimensions of each vector or matrix in the equation
1. Write down the linear algebra operations step by step on this paper or in an auxiliary cell
    1. Start by substituting $h_{\theta}$ in the 2nd equation for its value from the 1st equation
    1. The first operation is to find the $h_{\theta}$ or Y predicted for each row of X (multiplying it by $\Theta$)
    1. 2nd, subtract the value of Y for this example/row of X, finding its residual
    1. Then square the result
    1. Then, sum all the squares of the residuals for all examples/rows of X
    1. Finally, divide them by 2 * m
1. Write down next to each step the dimensions that your result should have. Remember that the final result of the cost function is a scalar or number
1. Finally, think about how to iterate with for loops for each value of X, Θ, and Y, to implement the cost function:
    1. Implement the formula using only for loops and the sum() function from the standard Python library, without using Numpy methods or operators.
    1. Iterate over all the rows or examples of X (m rows)
    1. Within that loop, iterate over the features or values of X and $\Theta$ to calculate the predicted Y for that example
    1. Once all the residuals have been found, find the total cost

*Notes:*
- The steps mentioned above are only a guide, an assist. In each exercise, implement your code in your own way, with the approach you prefer, using the cell code scheme or not
- Don't worry too much for now about whether it is working correctly or not, as we will check it in the next task. If there are any errors, you can return to this cell to correct your code.

In [None]:
# TODO: Implementa la función de coste no vectorizada siguiendo la siguiente plantilla

def cost_function_non_vectorized(x, y, theta):
    """ Computa la función de coste para el dataset y coeficientes considerados.
    
    Argumentos posicionales:
    x -- array 2D de Numpy con los valores de las variables independientes de los ejemplos, de tamaño m x n
    y -- array 1D de Numpy con la variable dependiente/objetivo, de tamaño m x 1
    theta -- array 1D de Numpy con los pesos de los coeficientes del modelo, de tamaño 1 x n (vector fila)
    
    Devuelve:
    j -- float con el coste para dicho array theta
    """
    m = [...]
    
    # Recuerda comprobar las dimensiones de la multiplicación matricial para hacerla correctamente
    j = [...]
    
    return j

## Tarea 2: Comprueba tu implementación

Para comprobar tu implementación, rescata tu código del notebook anterior acerca de datasets sintéticos para regresión lineal multivariable y utilízalos para generar un dataset en la siguiente celda:

In [None]:
# TODO: Genera un dataset sintético, con término de error, de la forma que escojas, con Numpy o Scikit-learn

m = 0
n = 0
e = 0.

X = [...]

Theta_verd = [...]

Y = [...]

# Comprueba los valores y dimensiones (forma o "shape") de los vectores
print('Theta real a estimar:')
print()

print('Primeras 10 filas y 5 columnas de X e Y:')
print()
print()

print('Dimensiones de X e Y:')
print('shape', 'shape')

Ahora vamos a comprobar tu implementación de la función de coste en las siguientes celdas.

Recuerda que la función de coste representa el "error" de tu modelo, el sumatorio de los cuadrados de los resíduos del mismo.

Por ello, la función de coste tiene las siguientes características:
- No tiene unidades, por lo que no podemos saber si su valor es "demasiado alto o bajo", simplemente comparar los costes de dos modelos (conjuntos de $\Theta$) diferentes
- Tiene un valor de 0 para la $\Theta$ teóricamente óptima
- Sus valores siempre son positivos
- Tiene un valor más alto cuanto más se aleja la $\Theta$ utilizada de la $\Theta$ óptima
- Su valor crece con el cuadrado de los residuos del modelo

Por lo tanto, utiliza la siguiente celda para comprobar la implementación de tu función con diferentes $\Theta$, corrigiendo tu función si es necesario. Comprueba que:
1. Si la $\Theta$ es igual que la $\Theta_{verd}$ (obtenida al definir el dataset), el coste es 0
1. Si la $\Theta$ es distinta que la $\Theta_{verd}$, el coste es distinto a 0 y positivo
1. Cuanto más alejada está la $\Theta$ de la $\Theta_{verd}$, mayor es el coste (compruébalo con 3 $\Theta$ diferentes a $\Theta_{verd}$, en orden de menor a mayor)

*Nota:* Para ello, utiliza la misma celda, modificando sus variables varias veces.

In [None]:
#TODO: Comprueba la implementación de tu función de coste

theta = Theta_verd    # Modifica y comprueba varios valores de theta

j = cost_function_non_vectorized(X, Y, theta)

print('Coste del modelo:')
print(j)
print('Theta comprobado y Theta real:')
print(theta)
print(Theta_verd)

## Tarea 3: Vectorizar la función de coste

Ahora vamos a implementar una nueva función de coste, pero en esta ocasión vectorizada.

Una función vectorizada es aquella que se realiza en base a operaciones de álgebra lineal, en lugar de p. ej. los bucles for utilizados en la primera función, y por tanto su computación es mucho más rápida y eficiente, más aún si se realiza en GPUs o procesadores especializados.

Implementa de nuevo la función de coste, pero esta vez utilizando exclusivamente las operaciones de álgebra lineal para operar con vectores/arrays de Numpy.

Consejos:
- Comprueba las dimensiones del resultado de cada operación o paso intermedio una a una si lo necesitas
- Intenta implementar la ecuación con el mínimo número de operaciones posibles, sin bucles ni iteraciones
- Utiliza funciones como [numpy.matmul()](https://numpy.org/doc/stable/reference/generated/numpy.matmul.html) o numpy.sum().
- Utiliza ndarray.reshape() para *theta* si te da algún problema en la multiplicación matricial, para conseguir un vector ndarray 2D (n+1, 1) en lugar de un 1D (n+1,)
- Asegúrate de devolver un valor *j* float, no un ndarray 2D con 1 solo elemento. Extráelo con sus índices si es necesario.

In [None]:
# TODO: Implementa la función de coste vectorizada siguiendo la siguiente plantilla

def cost_function(x, y, theta):
    """ Computa la función de coste para el dataset y coeficientes considerados.
    
    Argumentos posicionales:
    x -- array 2D de Numpy con los valores de las variables independientes de los ejemplos, de tamaño m x n
    y -- array 1D de Numpy con la variable dependiente/objetivo, de tamaño m x 1
    theta -- array 1D de Numpy con los pesos de los coeficientes del modelo, de tamaño 1 x n (vector fila)
    
    Devuelve:
    j -- float con el coste para dicho array theta
    """
    m = [...]
    
    # Recuerda comprobar las dimensiones de la multiplicación matricial para hacerla correctamente
    j = [...]
    
    return j

Por último, vuelve a la tarea 2 y repite los mismos pasos para comprobar ahora tu función vectorizada.