# CURSO INTENSIVO DE INTRODUCCIÓN AL ÁLGEBRA LINEAL

In [2]:
import numpy as np

## INTRODUCCIÓN AL ÁLGEBRA LINEAL

Como decíamos al principio muchos de los algoritmos de machine learning se construyen con operaciones avanzadas sobre estructuras de datos como vectores o matrices.

Realmente no es necesario un conocimiento profundo de álgebra para hacer machine learning. Pero si es interesante por lo menos tener una nociones de lo que está pasando por debajo.

Y de nuevo el paquete base para hacer todo esto es Numpy, que seguiremos utilizando durante esta explicación.

**Un poco de teoría: profundizando en la comprensión de las estructuras de datos**

Hasta ahora hemos trabajado con tres tipos fundamentales de estructuras:

**Escalares** : en la lección de Python los llamábamos "datos individuales". Son valores simples, como un número, y se pueden asociar geométricamente a un punto. Por eso, decimos que tienen dimensión 0.

**Vectores** : son secuencias de escalares ordenadas. Geométricamente, un vector se representa como una flecha en el espacio y vive en un espacio de dimensión n, según el número de componentes. Por ejemplo, un vector de tres elementos vive en R3. Estructuralmente, también se pueden ver como matrices unidimensionales, ya sea de forma vertical (m×1) o horizontal (1×m).

**Matrices**: son colecciones de vectores organizados en filas y columnas. Desde un punto de vista geométrico, dos vectores independientes en Rn pueden definir un plano. Por eso, una matriz puede representar objetos bidimensionales (2D), y su forma se denota como m×n, con mm filas y nn columnas.

Podemos extender esta idea a estructuras más complejas, como los arrays multidimensionales (o tensores), que representan hiperplanos en espacios de dimensión superior. Estos aparecen, por ejemplo, en ciencia de datos, imágenes, o redes neuronales, y permiten trabajar con información en más de dos dimensiones.

In [3]:
#Ejemplo de escalar con Numpy
np.array(1)

array(1)

In [4]:
#Ejemplo de vector con Numpy
np.array([1,2,3])

array([1, 2, 3])

In [5]:
#Ejemplo de matriz con Numpy
np.array([[1,2,3],[4,5,6]])

array([[1, 2, 3],
       [4, 5, 6]])

In [6]:
#Ejemplo de array multidimensional con Numpy
np.array([[[1,2,3],[4,5,6]],[[7,8,9],[10,11,12]]])

array([[[ 1,  2,  3],
        [ 4,  5,  6]],

       [[ 7,  8,  9],
        [10, 11, 12]]])

### OPERACIONES CON VECTORES

#### SUMAR VECTORES

La condición es que tienen que tener la misma longitud

In [7]:
v1 = np.array([1,2,3])
v2 = np.array([4,5,6])

v1 + v2

array([5, 7, 9])

#### RESTAR VECTORES

La condición es que tienen que tener la misma longitud

In [8]:
v1 - v2

array([-3, -3, -3])

#### MULTIPLICAR UN VECTOR POR UN ESCALAR

In [9]:
v1 * 10

array([10, 20, 30])

#### MULTIPLICAR DOS VECTORES

La condición es que tienen que tener la misma longitud

El tipo de multiplicación más usado es el producto escalar o producto punto: multiplicar uno a uno los correspondientes y luego sumar los resultados.

In [10]:
v1

array([1, 2, 3])

In [11]:
v2

array([4, 5, 6])

In [13]:
print(np.dot(v1,v2))

32


In [15]:
print(v1@v2)

32


Caso donde puedes ver la aplicación de este concepto para la creación de un sistema de recomendación:
https://youtu.be/paw7_cZoN1Q

### OPERACIONES CON MATRICES

#### SUMAR MATRICES

La condición es que tienen que tener la misma forma

In [16]:
m1 = np.array([[ 3, -4,  6],[ 0, -8,  3]])
m2 = np.array([[ -1, -9,  7],[ 4, 8,  -7]])

m1 + m2

array([[  2, -13,  13],
       [  4,   0,  -4]])

In [17]:
m1

array([[ 3, -4,  6],
       [ 0, -8,  3]])

In [18]:
m2


array([[-1, -9,  7],
       [ 4,  8, -7]])

In [19]:
m1 + m2

array([[  2, -13,  13],
       [  4,   0,  -4]])

#### RESTAR MATRICES

La condición es que tienen que tener la misma forma

In [20]:
m1 - m2

array([[  4,   5,  -1],
       [ -4, -16,  10]])

#### MULTIPLICAR UNA MATRIZ POR UN ESCALAR

In [21]:
m1 * 10

array([[ 30, -40,  60],
       [  0, -80,  30]])

#### MULTIPLICAR DOS MATRICES

Usaremos la forma del producto punto.

La condición es que el número de columnas de la primera tiene que ser el mismo que el número de filas de la segunda.

Más formalmente es multiplicar una m x n por una n x k.

Por ejemplo multiplicar una 3x2 por una 2x4.

Es así porque lo que hace el producto punto es ir multiplicando cada fila de la primera por cada columna de la segunda.

El resultado será una nueva matriz de m x k, ej 3x4.

Donde el producto punto de fila1 de la primera por columna 1 de la segunda será el resultado de la fila1,columna1 de la tercera.

In [26]:
m1

array([[ 3, -4,  6],
       [ 0, -8,  3]])

In [27]:
# Veamos la dimensión de m1
m1.shape

(2, 3)

In [23]:
m1

array([[ 3, -4,  6],
       [ 0, -8,  3]])

In [29]:
# Y creemos por ejemplo otra matriz 3x3
m3 = np.array([
    [8,6,2],
    [6,3,4],
    [2,-4,6]
])
m3.shape

(3, 3)

In [30]:
m1@m3

array([[ 12, -18,  26],
       [-42, -36, -14]])

#### APLANAR UNA MATRIZ

Habrá ocasiones en machine learning que aunque tengamos que usar una matriz el formato en el que tenemos que pasarle esa matriz a la clase que la procesará es un array unidimensional.

Aplanar una matriz (flatten en inglés) significa eso, pasarla de arrays multidimensionales a un vector, simplemente concatenando todas sus filas en una sola.

Lo hacemos con el método flatten de Numpy.

In [31]:
#Recordemos como es la matriz m3
m3

array([[ 8,  6,  2],
       [ 6,  3,  4],
       [ 2, -4,  6]])

In [32]:
#Así queda al aplanarla
m3.flatten()

array([ 8,  6,  2,  6,  3,  4,  2, -4,  6])

### PARA QUÉ SIRVE TODO ESTO

Muchas de las operaciones en ML se pueden hacer mediante álgebra matricial.

Y de hecho hacerlas asi es más eficiente computacionalmente.

Por lo que los algoritmos ya las hacen asi aunque nosotros no seamos conscientes ni tengamos que hacer nada al respecto.

**Deep learning:**

Deep learing es un subcampo de machine learning basado en la evolució de un algoritmo concreto llamado resdes neuronales.

Es un campo a parte, que puede ser visto como una especialización de machiene learning, y que necesita su propio curso completo.

Pero que sepas que si decides especializarte en DL entonces sí tendrás que profundizar un poco más sobre álgebra lineal. De momento no es necesario.

## EJERCICIOS DE REPASO

### Suma v1 más v2 y resta v3

In [2]:
import numpy as np

v1 = np.array([1, 2, 3, 4, 5])
v2 = np.array([5, 4, 3, 2, 1])
v3 = np.array([1, 1, 1, 1, 1])

v1 + v2 - v3

array([5, 5, 5, 5, 5])

### Multiplica m1 por un escalar (3) y luego suma m2

In [3]:
m1 = np.array([[1, 2, 3], [4, 5, 6]])
m2 = np.array([[6, 5, 4], [3, 2, 1]])

m1 * 3 + m2

array([[ 9, 11, 13],
       [15, 17, 19]])

### Calcula el producto escalar entre estos dos vectores y luego multiplicalo por un escalar (2)

In [6]:
v1 = np.array([1, 2, 3])
v2 = np.array([4, 5, 6])

producto = np.dot(v1,v2)
print(producto)
print(producto * 2)

32
64


### ¿Se pueden multiplicar estas matrices? Anticipa la forma que tendrá el resultado

In [7]:
m1 = np.array([[1, 2, 3], [4, 5, 6]])
m2 = np.array([[7, 8], [9, 10], [11, 12]])

m1@m2

array([[ 58,  64],
       [139, 154]])

### Multiplica estas matrices y aplana el resultado

In [9]:
m1 = np.array([[1, 2, 3], [0, 1, 4], [5, 6, 0]])
m2 = np.array([[1, 0, 0], [0, 1, 0], [0, 0, 1]])

producto = m1@m2
producto.flatten()

array([1, 2, 3, 0, 1, 4, 5, 6, 0])