# Taller de Machine Learning en la Nube con Python - Introducción a Numpy
**Juan S. Lara**

*Universidad Nacional de Colombia*

[julara@unal.edu.co]()

<a href="https://github.com/juselara1"><img src="https://mpng.subpng.com/20180326/gxq/kisspng-github-computer-icons-icon-design-github-5ab8a31e334e73.4114704215220498222102.jpg" width="20" align="left"></a>
<a href="https://www.linkedin.com/in/juan-sebastian-lara-ramirez-43570a214/"><img src="https://image.flaticon.com/icons/png/512/174/174857.png" width="20" align="left"></a>
<a href="https://www.researchgate.net/profile/Juan-Lara-Ramirez"><img src="https://user-images.githubusercontent.com/511683/28757557-f82cff1a-7585-11e7-9317-072a838dcca3.png" width="20" align="left"></a>

## ¿Que es Numpy?

Numpy es una librería de álgebra lineal para Python que permite la manipulación de vectores, matrices y arreglos multidimensionales. Está escrito principalmente en C y en Python, lo que permite una gran velocidad de cómputo con la elegante sintaxis de Python.

<img src="https://miro.medium.com/max/765/1*cyXCE-JcBelTyrK-58w6_Q.png" width="400">

Numpy se puede instalar con `pip`:

```
pip install numpy
```

Comencemos importando la librería, por convención le pondremos el alias `np`.

In [None]:
import numpy as np

## Arreglos Multidimensionales

Los arreglos multidimensionales son la estructura de datos base en Numpy, se trata de un tipo de datos que permite representar tensores. Los tensores son una forma general de estructuras matemáticas como:

<img src="http://www.sr-sv.com/wp-content/uploads/2019/08/Tensor_01.jpg" width="400">

* Tensor rango 0: Escalares $\mathbb{R}^1$.
* Tensor rango 1: Vectores $\mathbb{R}^n$.
* Tensor rango 2: Matriz $\mathbb{R}^{n \times m}$.
* Tensor rango d: Arreglo multidimensional $\mathbb{R}^{n_1 \times n_2 \times \dots n_d}$.

Un arreglo multidimensional se define de la siguiente forma:

In [None]:
X = np.array([
    [10, 10],
    [15, 5]
    ]) # vector de dimensión 2
X

Los arreglos de numpy tienen distintos atributos, como:

In [None]:
print(f"tamaño {X.size}")
print(f"forma {X.shape}")
print(f"tipo {X.dtype}")

## Métodos de los Arreglos
Existen algunos métodos importantes que nos permiten manipular internamente cada arreglo, veamos algunos ejemplos:
* Cambio de forma:

In [None]:
X_2 = X.reshape((1, 4)) # pasamos de (2, 2) a (1, 4)
print("Antes:")
print(X)
print(X.shape)
print("Después de reshape:")
print(X_2)
print(X_2.shape)

* Cambio de tipo:

In [None]:
X_f = X.astype(np.float32)
print("Antes:")
print(X)
print(X.dtype)
print("Después:")
print(X_f)
print(X_f.dtype)

* Transpuesto de una matriz:

In [None]:
X_t = X.T
print("Antes:")
print(X)
print("Después:")
print(X_t)

* Aplanamiento:

In [None]:
X_flat = X.flatten()
print("Antes:")
print(X)
print(X.shape)
print("Después:")
print(X_flat)
print(X_flat.shape)

## Creación de Arreglos
Existen diversas formas de crear arreglos de numpy. Veamos algunos ejemplos.
* A partir de listas en Python:

In [None]:
X = np.array([1.0, 3.4])
print(X)

* Constantes:

In [None]:
# arreglo de unos
X = np.ones(
        shape=(3, 3),
        dtype=np.float64
        )
print(X)

In [None]:
# arreglo de ceros
X = np.zeros(
        shape=(2, 4),
        dtype=np.bool8
        )
print(X)

In [None]:
# arreglo de números aleatorios
X = np.random.uniform(
        low=0, high=1,
        size=(5, 3)
        )
print(X)

## Indexado de Arreglos
Uno de los elementos clave en numpy es la indexación. Se trata de un método para seleccionar elementos dentro de los arreglos a través de slices o cortes.

Veamos algunos ejemplos.

* Selección de un elemento $X_{ij}$:

In [None]:
X = np.array([
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
    ])
print(X[0, 1]) # Elemento de la fila 0, columna 1

* Selección de la fila 2:

In [None]:
print(X[2, :])

* Selección de la columna 1:

In [None]:
print(X[:, 1])

* Selección de los elementos entre las filas 0 y 1, y las columnas 1 y 2:

In [None]:
print(X[:2, 1:])

## Operaciones con Arreglos
Numpy nos permite realizar distintos tipos de operaciones con arreglos, incluyendo sumas, promedios, productorias, entre otros. Veamos las operaciones de agregación generales:

* Sumas

In [None]:
print(X.sum()) # suma de todos los elementos en el arreglo

In [None]:
print(X.sum(axis=0)) # suma por columnas

In [None]:
print(X.sum(axis=1)) # suma por filas

* Promedios

In [None]:
print(X.mean()) # promedio de todos los elementos

In [None]:
print(X.mean(axis=0)) # promedio por columna

In [None]:
print(X.mean(axis=1)) # promedio por filas

* Desviación estándar

In [None]:
print(X.std()) # desviación estándar de todos los elementos

In [None]:
print(X.std(axis=0)) # desviación estándar por columna

In [None]:
print(X.std(axis=1)) # desviación estándar por fila

* Operaciones algebraicas

In [None]:
X = np.array([
    [2, -1],
    [1, 3]
    ])
print(np.linalg.inv(X)) # inverso de una matriz.

In [None]:
print(np.linalg.eig(X)) # valores y vectores propios.

In [None]:
print(np.linalg.det(X)) # determinante de la matriz.

In [None]:
print(np.linalg.matrix_rank(X)) # rango de una matriz

## Operaciones entre Arreglos
También podemos realizar operaciones entre distintos arreglos.

In [None]:
X = np.random.randint(10, size=(5, 5))
Y = np.random.randint(10, size=(5, 5))

In [None]:
print(X + Y) # suma de matrices

In [None]:
print(X - Y) # resta de matrices

In [None]:
print(X * Y) # producto elemento a elemento

In [None]:
print(X @ Y) # producto matricial

In [None]:
print(X / Y) # división elemento a elemento