# Algebra lineal


## Álgebra Lineal en Machine Learning

El Álgebra Lineal es una área de las matemáticas que estudia cosas como vectores y matrices. Estos términos pueden sonar un poco abstractos, pero en realidad, son herramientas muy útiles en muchas áreas, incluyendo el Machine Learning.

### Importancia del Álgebra Lineal

En Machine Learning trabajamos con muchos datos. Estos datos suelen organizarse como matrices, que no son más que tablas de números. El Álgebra Lineal nos da las herramientas para trabajar de manera efectiva con estas tablas de datos.

Aquí te presento algunos conceptos clave del Álgebra Lineal en términos sencillos:

- **Vectores:** Piensa en un vector como una lista de números. Esta lista puede representar muchas cosas en Machine Learning. Por ejemplo, cada número en la lista podría representar una respuesta a una pregunta sobre un objeto o individuo, y así cada objeto o individuo estaría representado por un vector.

- **Matrices:** Las matrices son como tablas de números, o una lista de vectores. Podemos usarlas para organizar nuestros datos. Por ejemplo, podríamos tener una matriz en la que cada fila es un vector que representa a un objeto o individuo.

- **Transformaciones lineales:** Este término suena complicado, pero realmente puedes pensar en una transformación lineal como una forma de mover o cambiar vectores de una forma específica. En Machine Learning, a veces queremos cambiar nuestros vectores o matrices de una forma específica para hacer más fácil nuestro trabajo, y eso es cuando utilizamos transformaciones lineales.

### Scipy: Un Módulo para Matemáticas y Ciencias

Scipy es una biblioteca de Python que nos proporciona funciones y utilidades para matemáticas y ciencias. Contiene módulos para diferentes tipos de tareas matemáticas. En el contexto del Álgebra Lineal, Scipy nos proporciona funciones para trabajar con vectores y matrices de una manera fácil y efectiva.


Para ejemplificar que es un vector, primero simplifiquemos nuestros datos anterior sobre casas. Vamos a representar a una casa con 3 numeros: superficie, dormitorios, y banos. 

In [201]:

casas_df = hp[['SqFt','Bedrooms','Bathrooms']]
# Pasamos los nombres al castellano, de paso aprendemos una nueva funcion de pandas: rename

casas_df = casas_df.rename(columns={'SqFt':"Superficie",'Bedrooms':'Dormitorios','Bathrooms':'Banos'})
print(f"recordemos que la cantidad de casas que tenemos representadas es {len(casas_df)}")
# Miramos nuestra base de datos simplificada
casas_df.head()

recordemos que la cantidad de casas que tenemos representadas es 128


Unnamed: 0,Superficie,Dormitorios,Banos
0,1790,2,2
1,2030,4,2
2,1740,3,2
3,1980,3,2
4,2130,3,3


In [202]:
hp['Price']

0      114300
1      114200
2      114800
3       94700
4      119800
        ...  
123    119700
124    147900
125    113500
126    149900
127    124600
Name: Price, Length: 128, dtype: int64

Entonces aqui podemos ver un ***vector*** que representa, en este caso a una casa. Por ejemplo el vector `[1790, 2, 2]` representara a la casa 0, y el vector `[2030, 4, 2]` de tamano 3, representara a la casa 1. El conjunto de estos ***vectores*** es una ***matriz*** de dimensiones 128, 2. Esta matriz representa a su conjunto a todas las casas. 
#### Para que usar vectores y matrices? 
Nos adelantemos solo un poco en nuestra teoria. Si hay algo que no comprenden, no hay problema, tendremos tiempo de revisar, pero veamos el trailer. 
 Podemos imaginar que el precio de la casa puede estar relacionada a los elementos de estos vectores. Intuitivamente, diriamos que mientras mas superficie, mas subira el precio de nuestra casa. Pasa lo mismo con los banos y dormitorios. 
 Imaginan como intentariamos *predecir* el precio de nuestra casa a partir de estos vectores? 
 
 Podriamos imaginar una *funcion* para intentar predecir el precio de las casas. Por ahora, obviemos el paso de como llegamos a esta funcion, e imaginemos que pudimos llegar a ella. Por ejemplo: 
 
 Precio = w1 * Superficie + w2 * Dormitorios + w3 * Banos + Precio_base
 
 Donde w1, w2 y w3 son llamados *pesos*.
 
 Valores creibles para w1, w2 y w3 podrian ser (por ahora nos limitamos a calcular a "ojo") podrian ser :
 w1 = 36
 w2 = 10460
 w3 = 13548
 Precio_base = 80000
 
 Ahora viene el poder de numpy
 En una sola linea de codigo, y aprovechando la paralelizacion de numpy, podemos calcular simultaneamente todos los precios predichos para las casas

In [203]:
pesos_optimos = [36, 10460, 13548]
precio_base = 1000

In [204]:
### por ahora, podemos ignorar este codigo ... 
from scipy.optimize import minimize
import numpy as np

params = [6, 3500, 5500, 80000]
actual_prices = np.array(hp['Price'])
M = np.array(casas_df)
# Assuming M and actual_prices are defined
# M is your matrix of features
# actual_prices is a vector of actual house prices

# Define a function to calculate the difference between predicted and actual prices
def price_difference(params):
    w = params[:-1]  # weights
    b = params[-1]  # bias
    predicted_prices = np.dot(M, w) + b
    return np.sum((predicted_prices - actual_prices) ** 2)

# Initial guess for weights and bias
initial_guess = np.zeros(M.shape[1] + 1)

# Use scipy's minimize function to find the best weights and bias
result = minimize(price_difference, initial_guess)

# The optimal weights and bias are stored in result.x
optimal_weights = result.x[:-1].round()
optimal_bias = result.x[-1].round()

In [205]:
# Primero, transformamos los DataFrames (que incluyen cosas como nombres de columnas, etc), a datos 
# puramente numericos: una matriz de numpy
casas_M = np.array(casas_df)
# Definimos nuestro vector w de pesos
w = np.array(pesos_optimos)
# Y nuestro precio base
b = precio_base
# Ahora podemos calcular todos los precios de casas en dos lineas de codigo: 

precios_predichos = np.dot(casas_M, w)
precios_predichos += b
precios_predichos

array([113456, 143016, 122116, 130756, 149704, 123556, 138904, 147696,
       145896, 135304, 132556, 116336, 128236, 150424, 176724, 134016,
       151864, 144664, 110216, 142144, 123916, 131476, 120316, 124996,
       163044, 165924, 141936, 120676, 106616, 156924, 164484, 118496,
       154024, 176024, 121016, 147904, 116696, 170604, 121396, 122116,
       105176, 149724, 120656, 128596, 142864, 124636, 134204, 133276,
       120296, 120676, 135076, 115976, 139964, 135076, 118876, 110936,
       138316, 164124, 139264, 145176, 152224, 106976, 163404, 131324,
       126436, 101216, 152584, 156924, 136516, 158364, 143224, 147696,
       118876, 146464, 150064, 117416, 128956, 165564, 136156, 134016,
       151864, 160524, 122816, 159784, 103736, 164484, 138336, 140704,
       142504, 121376, 139056, 136876, 135436, 147904, 160884, 119936,
       160864, 121016, 133636, 147904, 131836, 154384, 159784, 171324,
       128236, 174564, 136156, 127516, 144664, 135436, 110576, 111656,
      

Hemos utilizado la operacion "producto punto". Para el que le interese mas, puede ahondar en el tema, pero a lo que respecta este curso, pueden simplemente entenderlo como una forma de realizar la lista de operaciones que dijimos previamente. 

Ahora que tenemos la lista de precios predicha, podriamos compararla con la lista de precios real. Una forma simple es ver "en promedio" por cuanto erramos

In [207]:
# transformamos los precios reales a numpy
precios_reales = np.array(hp['Price'])
# simplemente usamos la resta de matrices
errores = precios_predichos - precios_reales
errores

array([  -844,  28816,   7316,  36056,  29904,   8956, -12696,  -3004,
        26696,  31304,     56,  -6664,  25636,  24124,    -76, -11784,
         4764,  61064,  -1184, -25056,   7716,  17676,  28616,  18896,
         6644,  16624,   4936,  21376,  37516, -31076, -17516,   6196,
        19024,  36424,   3216,  30804,   -804,  23604,  -9904,  13916,
        -1424,  16124,  15056, -25404, -23636,  21436,   4404,  42976,
         4396,  13176, -16024,  24876,  22564,   4276,  37576, -14764,
        -2584,  11824,   1164, -10224, -28676,   6076,   2104,  10824,
        -3864,  -9884,  26384,   5024,  42916,  -7236, -23476,  -9904,
        11576,  20764,   5864,  10516,   -844, -10936,  14856,  -9584,
         8464, -23776, -41984,  12084,  13236, -23816,  35636, -31796,
        14804,  23576,  -4044,  20376,  -7164,  -9196,    284, -32564,
        27564,  -5784, -11864, -23096,  28636,  31284,  22984, -39876,
        45936,  27664,  27656,  -6484,  27664,  26736,  -1024,  -3244,
      

In [210]:
# Y calculamos el error promedio
error_promedio = errores.mean().round(2)
print(f'Nuestro error promedio es $ {error_promedio}. Hay bastante por mejorar!')

Nuestro error promedio es $ 7360.66. Hay bastante por mejorar!


#### Manipulacion de matrices con scipy
Para la manipulacion de matrices hay un modulo de python que es perfecto para todo lo que respecta a la manipulacion de matrices, resolucion de ecuaciones lineales, etc. 
Algunas de los funciones que pueden ser utiles en scipy son:
- `scipy.optimize.minimize:`Esta función se utiliza para encontrar los valores mínimos de una función. Se utiliza en una variedad de aplicaciones, incluyendo la optimización de modelos de machine learning y la resolución de problemas de minimización en general.
- `scipy.linalg.solve`:  Esta función se utiliza para resolver sistemas de ecuaciones lineales de la forma Ax = b, donde A es una matriz y b es un vector. Es útil para una variedad de problemas en álgebra lineal.
- `scipy.linalg.svd`: Esta función se utiliza para realizar la descomposición de valores singulares (SVD) de una matriz. La SVD es útil en una variedad de aplicaciones, incluyendo la reducción de dimensionalidad y la recomendación de sistemas.
- `scipy.linalg.norm` :Esta función se utiliza para calcular la norma (o longitud) de un vector o cualquier matriz. Es útil para una variedad de aplicaciones, incluyendo la normalización de datos y la medición de la distancia entre puntos.

Muchas de las funciones aqui, van a ser manejadas a un nivel mas abstracto por otros modulos. Sin embargo, el algebra lineal es la base del machine learning, y para aquel que quiera ahorandar, scipy es una excelente herramienta para entender mas a fondo que hay bajo el capot, o para poner cosas nuevas debajo del capot ...
 A continuacion, vamos a utilizar un ejemplo para analizar un poco mas la matriz con la que venimos trabajando. 


In [211]:
from scipy.linalg import norm

# Calcular la norma euclideana para cada vector en  in casas_M
# La norma euclideana puede ser util, por ejemplo, para ver cuan "extremos" son los vectores en 
# terminos de sus caracteristicas (features)

norms = norm(casas_M, axis=1)

norms

array([1790.00223464, 2030.0049261 , 1740.00373563, 1980.00328283,
       2130.00422535, 1780.00365168, 1830.00491803, 2160.00462962,
       2110.00473933, 1730.0052023 , 2030.00320197, 1870.00213904,
       1910.00340314, 2150.00418604, 2590.00482625, 1780.00561797,
       2190.00410959, 1990.00452261, 1700.00235294, 1920.00468749,
       1790.00363128, 2000.00325   , 1690.00384615, 1820.00357143,
       2210.0056561 , 2290.00545851, 2000.00499999, 1700.00382353,
       1600.0025    , 2040.00612744, 2250.00555555, 1930.00207254,
       2250.004     , 2280.00745613, 2000.002     , 2080.00432692,
       1880.00212766, 2420.00516528, 1720.00377907, 1740.00373563,
       1560.0025641 , 1840.00679347, 1990.00201005, 1920.00338541,
       1940.00463917, 1810.00359116, 1990.00326633, 2050.00317073,
       1980.0020202 , 1700.00382353, 2100.00309524, 1860.00215054,
       2150.00302325, 2100.00309524, 1650.00393939, 1720.00232558,
       2190.00296803, 2240.00558035, 1840.0048913 , 2090.00478

In [212]:
# Ahora podemos ver cual es la mas "diferente y volver a la matriz original, para ver su precio, etc"

# Sacamos el indice de el maximo con argmax()
indice_max = norms.argmax()
print(f"Indice de casa mas rara: {indice_max}")
# Tambien el indice del minimo para ver cual es la que mas se ajusta a la norma
indice_min= indice_min = norms.argmin()
print(f"Indice de casa mas comun: {indice_min}")

Indice de casa mas rara: 14
Indice de casa mas comun: 65


In [213]:
# Ahora volvemos a la matrix original y les echamos un vistazo
# Aprovechamos para introducir a "iloc", metodo para extraer valores segun su ubicacion
hp.iloc[indice_max]


Home                15
Price           176800
SqFt              2590
Bedrooms             4
Bathrooms            3
Offers               4
Brick               No
Neighborhood      West
Name: 14, dtype: object

In [215]:
hp.iloc[indice_min]

Home                66
Price           111100
SqFt              1450
Bedrooms             2
Bathrooms            2
Offers               1
Brick              Yes
Neighborhood     North
Name: 65, dtype: object

¯\\_(ツ)_/¯

# Algebra lineal
