<img src="https://udearroba.udea.edu.co/imagescourses/2022C343_alprog_V1/banner-colab.png">

# <font color='3E779E'> **NumPy**

En anteriores unidades hemos visto cómo crear y trabajar con estructuras de datos. En ocasiones existe la necesidad de trabajar con una cantidad de datos grande, esto sucede en especial con datos númericos. A su vez, es también de suma utilidad operar y procesar estos datos con el fin de obtener la información deseada. Un buen ejemplo de estas situaciones son las redes neuronales, las cuales son el nucleo de la inteligencia artificial. El funcionamiento de estas se encuentra dado en esencia por numerosas operaciones matemáticas.

NumPy (Numerical Python) es una libreria para Python de código abierto cuyo proposito es trabajar con datos numéricos.

NumPy contiene tipos de datos que son arreglos multidimensionales, a su vez, poseen métodos para operar de manera eficiente. En el contexto matemático a estos arreglos multidimensionales se les conoce como <strong> matrices </strong>. En ese sentido, NumPy se puede utilizar para realizar una amplia variedad de operaciones matemáticas en matrices.

La ventaja de Numpy frente a las estructuras predefinidas en Python es la eficiencia y velocidad, lo cual la hace ideal para el procesamiento de vectores y matrices de grandes dimensiones.

# <font color='157699'> **Uso** </font>

Para utilizar NumPy basta con importarlo al inicio del código de la siguiente manera:

In [None]:
import numpy as np

# <font color='157699'> **Arreglos (*array*) en NumPy** </font>

Un *array* es una estructura de datos de **un mismo tipo** organizada en forma lista. No tiene mucho sentido utilizar datos que no sean númericos, sin embargo es posible. En la práctica los arreglos NumPy son similares a las listas en Python, pero son específicamene diseñados para operar de manera más eficiente, sin mencionar que sus métodos automatizan muchas operaciones complejas.

Los arreglos de NumPy se crean mediante el método array() que usualmente recibe una lista como argumento.

In [None]:
print([1, 2, 3])
arreglo = np.array([1, 2, 3])
arreglo
print(arreglo)

Los arreglos pueden ser unidimensionales o multidimensionales. Dada su utilidad en el contexto matemático, vale la pena mencionar que los arreglos de una sola dimensión serían equivalentes a los vectores y los arreglos multidimensionales serían equivalentes a las matrices.

En el ejemplo anterior el arreglo [1,2,3] representa un vector de 3 componentes, a continuación se crea un arreglo de dos dimensiones, es decir, una matriz de dos dimensiones.

In [None]:
matriz = np.array([[1, 2, 3], [4, 5, 6]])
print(matriz)

Existe una amplia gama metodos que son utilizados para automatizar la creación de arreglos. Estas se encuentran descritas en detalle en la <a href="https://numpy.org/doc/stable/reference/routines.array-creation.html" target="_blank">documentación</a> de la librería. Algunos de los más usados son:

| Función| resultado 	|
|:---|:---|
| empty(d) | arreglo vacio de dimensión 'd'	|
| zeros(d) | arreglo de zeros de dimensión d '	|
| ones(d) | arreglo de unos de dimensión d' |
| random.rand(d) | arreglo de elementos aleatorios de dimensión  'd	|



En el siguiente ejemplo se creará una matriz de tamaño `3x3` con valores aleatorios:

In [None]:
matriz = np.random.rand(3,3)
print(matriz)

Si por ejemplo deseo que los valores de la matriz anterior estuvieran entre 1 y 9, puedo recurrir a una variación de random

In [None]:
matriz = np.random.randint(9, size=(3, 3))
print(matriz)

Todas las variaciones y opciones disponibles se encuentran en la documentación de la librería <a href="https://numpy.org/doc/stable/reference/routines.html" target="_blank">documentación</a>

# <font color='157699'> **Atributos de los *array*** </font>

El siguiente conjunto de funciones permite conocer algunos de los atributos (características) de un *array* en Numpy.

| Función| resultado 	|
|:---|:---|
| a.ndim  |  Devuelve el número de dimensiones del array 'a'	|
| a.shape |  Devuelve el valor de las dimensiones del array ¿a'	|
| a.size |  Devuelve el número de elementos del array 'a'	|
| a.dtype | Devuelve el tipo de datos de los elementos del array 'a'	|

In [None]:
arreglo = np.random.random((3,3))
print(arreglo)
print('El arreglo tiene ',arreglo.ndim,' dimensiones.')
print('El arreglo tiene las dimensiones',arreglo.shape)
print('El arreglo tiene ',arreglo.size,' elementos.')
print('El arreglo es de tipo ',arreglo.dtype)

# <font color='157699'> **Acceso a los elementos de un *array***</font>

Los elementos de un *array* se acceden por medio de sus indices, como en la estructura de listas.

Generamos un vector aleatorio de tamaño 10 y accedemos a su quinto elemento (posición 4):




## <font color='5adcff'> **Indexación** </font>

In [None]:
aleatorio = np.random.random(10)
print(aleatorio)
print("El elemento con indice 4 es: " + str(aleatorio[4]))

NumPy permite restructurar los arreglos. Para esto se usa el método <strong>reshape</strong>. Por ejemplo, podemos restructurar la matriz anterior a un formate de 5x2.

In [None]:
aleatorio = aleatorio.reshape(5,2)
print(aleatorio)
print(aleatorio.shape)

Un ejemplo de seleccionar un elemento específico por medio de los indices es el siguiente:

In [None]:
aleatorio[2,1]

Si quisieras seleccionar la fila tres completa, puedes especificarlo así:

In [None]:
print(aleatorio[3])

Nota que al referirse con un solo índice a un arreglo multidimensional, retorna el *subarray* asociado a las dimensiones restantes.

## <font color='5adcff'> ***Slicing*** </font>

Se usa para extraer elementos de una secuencia. Para esto se usa el operador ':'. Además, se debe especificar el índice inicial y final para cada dimensión, separados por comas.
Por ejemplo, si quisieras obtener las filas del dos al cuatro de la matriz anterior.

In [None]:
print(aleatorio)
aleatorio[2:4,:]


Esto puede ser de utilidad para signar valores o hacer operaciones con los elementos seleccionados. Por ejemplo, es posible sumar uno a los elementos seleccionados

In [None]:
aleatorio[2:4,:] +=1
aleatorio

También se puede hacer la selección mediante expresiones condicionales. Por ejemplo, seleccionar los elementos que son mayores que uno.

In [None]:
aleatorio[aleatorio > 1]

#<font color='157699'> **Operaciones con *arrays***</font>

Una limitación de Python a la hora de manejar grandes volúmenes de datos es su carácter ineficiente. Para recorrer un array con Python de forma nativa es necesario hacer uso de ciclos y esto es bastante lento. NumPy permite realizar operaciones entre números y arreglos o entre arreglos de manera eficiente. Para lograrlo, NumPy permite invocar los métodos de forma **vectorizada**, es decir, pasando como argumento la variable que representa a la matriz.

Con la **vectorización** NumPy permitee implementar funciones donde los argumentos son matrices u operadores cuyos operandos son matrices. Numpy, por detras, hace uso de una implementación eficiente en un lenguaje compilado.

## <font color='5adcff'> **Operaciones básicas** </font>
Las operaciones aritméticas sobre los arreglos aplican a nivel de elementos. Un nuevo arreglo se genera con el resultado de la operación.

Nota, por ejemplo, el resultado de la suma de dos arreglos de la misma dimensión.

In [None]:
arreglo1 = np.array([3, 5, 6])
arreglo2 = np.array([2, 4, 1])
resultado = arreglo1 +arreglo2
resultado

En caso de que los arreglos sean de dimensiones diferentes y la operación nos sea conformable se generará un error. Sin embargo, NumPy usa el concepto de *broadcasting* para efectuar operaciones entre elementos de distinta dimensión. El caso más sencillo de ellos sería la suma de un escalar 'e' a un vector, en el que el valor de 'e' se adiciona a todos los elementos del arreglo.

In [None]:
matriz = np.array([[3, 5, 6], [2, 4, 1], [1, 7, 9]])
resultado = 10 + matriz
resultado

Por ejemplo, si sumamos un vector `1x3` a la matriz` 3x3`, se sumará el vector a cada fila elemento por elemento.

In [None]:
matriz = np.array([[3, 5, 6], [2, 4, 1], [1, 7, 9]])
vector = np.array([6, 7, 8])
resultado = vector + matriz
resultado

Existe un portafolio amplio de funciones que pueden usarse de manera directa sobre un arreglo.

| Función | Descripción |
| ------- | ----------- |
| `np.sum()` | Calcula la suma de todos los elementos del arreglo |
| `np.mean()` | Calcula el promedio de todos los elementos del arreglo |
| `np.std()` | Calcula la desviación estándar de los elementos del arreglo |
| `np.min()` | Encuentra el valor mínimo en el arreglo |
| `np.max()` | Encuentra el valor máximo en el arreglo |
| `np.sort()` | Ordena los elementos del arreglo |
| `np.reshape()` | Cambia la forma del arreglo |
| `np.concatenate()` | Une dos o más arreglos |
| `np.split()` | Divide un arreglo en subarreglos |


Ejemplos de ellas son: calcular la suma de los elementos `sum()` o hallar el máximo de ellos `max()`.

In [None]:
matriz = np.array([[3, 5, 6], [2, 4, 1], [1, 7, 9]])
matriz.max()

Adicional, existe una amplia gama de operaciones matriciales predefinidas:

| Función| resultado 	|
|:---|:---|
| `dot()` | Calcula el producto punto de dos arreglos	|
| `matmul()` | Calcula la multiplicación de dos matrices	|
| `det()` | Calcula el determinante de una matriz	|
| `inv()` | Calcula la matriz inversa	|
| `trace()` | Calcula la traza de una matriz.	|
| `rank()` | Calcula el rango de una matriz.	|
| `transpose()` | Transpone el arreglo |



## <font color='5adcff'> **Operaciones con fórmulas matemáticas** </font>


Las propiedades descritas de NumPy permite trabajar de modo facil con operaciones matemáticas, lo cual lo hace bastante usado en la comunidad científica.

Por ejemplo, el error cuadrático medio se calcula a través de la siguiente ecuación:

$SSE = \dfrac{\sum_{i=1}^n (\hat{y}_i - y_i)^2}{n}$

Su implementación en NumPy, basado en la vectorización es tan simple como se presenta a continuación:

In [None]:
y_hat = np.array([1, 2, 1, 4, 6, 8, 8])
y_real= np.array([2, 1, 3, 2, 3, 5, 6])
n = y_hat.size

SSE = 1/n*(np.sum(np.square(y_hat - y_real)))
SSE

· Universidad de Antioquia · Ude@ Educación Virtual ·