# **NUMPY**


numpylogo.svg

**NumPy** es una librería de Python especializada en el **cálculo numérico y el análisis de datos, especialmente para un gran volumen de datos**.

Su **eficiencia** se basa en usar a nivel interno el **calculo matricial** (**arrays para 1-D o 2-D**, vectores o matrices)

Para usar la libreria debemos importarla:

In [None]:
# "np" es un alias corto
import numpy as np

\

## **Creación de arrays**

Los arrays de NumPy son secuencias/tablas de datos del mismo tipo (en realidad no estan limitados a 1D/2D). Se pueden crear de varias maneras:

* **A partir de una lista o tupla:** especificando los elementos del array.

In [None]:
array_lista = np.array([1, 2, 3, 4, 5])
array_tupla = np.array((6, 7, 8, 9, 10))

print(array_lista)

print(array_tupla)


In [None]:
type(array_tupla)

* **A partir de una secuencia de números:**
Numpy dispone de métodos que nos permiten crear secuencias en un rango (similar a lo visto en las listas de Python), secuencias equiespaciadas, en escala logarítmica...

In [None]:
# array a partir de un rango <np.arange()>
array_rango = np.arange(1, 11)
print(f'Array con rango 1-11: {array_rango}', end='\n'*2)

# array entre 0 y 10 con 5 elementos equiespaciados
array_linspace = np.linspace(0, 10, num=5)
print(f'Array secuencia equiespaciada: {array_linspace}', end='\n'*2)

# array escala logaritmica de 1 (10 elevado a cero) a 10000 (10 elevado a 4), con 5 elementos
array_logspace = np.logspace(0, 4, num=5)
print(f'Array escala logarítmica: {array_logspace}', end='\n'*2)



* **A partir de determinados métodos:**
Tambien existen métodos para crear arrays con determinados valores útiles a la hora de calcular:

In [None]:
# np.zeros()
print(f'Array de 5 ceros: {np.zeros(5)}', end='\n'*2)

# np.ones()
print(f'Array de 15 unos: {np.ones(15)}', end='\n'*2)



De forma similar podemos **crear arrays de 2 dimensiones (matrices)**. Para crear un array 2D especificando su contenido utilizamos listas anidadas, veamoslo:

In [None]:
mi_tabla = np.array([[1,2,3], [4,5,6], [7,8,9]])

print(mi_tabla)

print(type(mi_tabla))

 **Aquellos métodos que lo permitan se puedan utilizar también para crear matrices**. El argumento entre parentesis serán las dimensiones, filas columnas, entre parentesis y separados por coma:

In [None]:
# matriz de ceros de 2x3
print('Matriz de ceros (2x3):')
print(np.zeros((2,3)), end='\n'*2)

# matriz de unos de 3x3
print('Matriz de unos (3x3):')
print(np.ones((3,3)), end='\n'*2)

Los **arrays** tienen el **atributo "shape"** que **nos devuelve sus dimensiones**:

In [None]:
# ejplo 1D
print(array_linspace.shape)

# ejplo 2D
print(mi_tabla.shape)

In [None]:
array_linspace.size

\

## **Indexing y slicing**

En los arrays de NumPy se pueden acceder a sus elementos de forma similar a las listas de Python.

* **Indexing:** a partir de su posición

In [None]:
array = np.array([1, 2, 3, 4, 5])

print(array[0])

print(array[-1])


* **Slicing:** extraer un rango de elementos

In [None]:
array = np.array([1, 2, 3, 4, 5])

print(array[1:3])

print(array[2:])


## **Método reshape**

La función `reshape()` permite cambiar la "forma" (distribución filas/columnas) de un array.

In [None]:
array = np.array([1, 2, 3, 4, 5,6])

new_array = array.reshape(2, 3)

print(new_array)


\

## **Operaciones con arrays**

Los arrays de NumPy se pueden operar de forma similar a los vectores (1D) y matrices (2D).

Además estan definidas para obtener los resultados que nosotros esperariamos a la hora de calcular (ejplo columna "nº unidades vendidas" por columna "precio unitario")

Así para las operaciones aritmeticas:

In [None]:
array1 = np.array([1, 2, 3])
array2 = np.array([4, 5, 6])

# Las operaciones se realizan elemento a elemento

print(array1 + array2)

# el producto matricial en si se obtiene con el método de numpy <np.dot()>
print(array1 * array2)

print(array1 / array2)


De la misma forma si queremos duplicar las cantidades de un pedido, multiplicaremos por 2 la columna de unidades vendidas:

In [None]:
pedidos = np.array([5,14,8,20])

nuevo_pedido = 2*pedidos

print(nuevo_pedido)

De forma similar podemos sumar un numero y un array, relizandose la suma (operación en general), con todos los elementos del array (esta técnica se denomina **broadcasting**)

In [None]:
pedidos

In [None]:
100 + pedidos

In [None]:
100 + np.ones((3,3))

In [None]:
2* np.ones((3,3,))

## Ejercicio 1

Tenemos los datos de precios de 3 productos en 4 localidades, guardado en una matriz (array-2D) de 4x3. Pero se nos ha olvidado aplicar el IGIC (7%).
Calcular la matriz con los nuevos precios.

In [None]:
# datos de partida
precios_sin = np.array([[45.20, 87.50, 46.27], [85.26, 37.20, 41.21], [95.20, 34.12, 78.32], [49.20, 34.36, 62.05]])


# ESCRIBIR EL CÓDIGO




## Ejercicio 2

Tenemos en otra matriz el nº de unidades vendidas en cada localidad de esos productos (misma orientación columnas son productos y filas localidades (4x3). Junto con el resultado del ejercicio anterior calcular las ventas obtenidas (euros) de esos productos en dichas localidades.

In [None]:
# datos de partida
unidades_vendidas = np.array([[125, 232, 87], [103, 215, 151], [98, 194, 176], [152, 184, 206]])


# ESCRIBIR EL CÓDIGO




## **Añadir y eliminar elementos de array**

Los elementos de un array se pueden añadir o eliminar de forma similar a las listas de Python.

* **Añadir elementos:** método de numpy <append()>

In [None]:
array = np.array([1, 2, 3])

array = np.append(array, 4)

print(array)


* **Eliminar elementos:** método <delete()> especificando la posición del elemento a eliminar

In [None]:
array = np.array([1, 2, 3, 4, 5])

array = np.delete(array, 2)

print(array)
# [1 2 4 5]

\


## **Uso de funciones en arrays**

NumPy proporciona una gran variedad de funciones (de cálculo, trigonométricas, estadísticas, etc.) para realizar operaciones sobre arrays. Algunas de las funciones más comunes son:

* **sum():** Devuelve la suma de todos los elementos de un array.
* **mean():** Devuelve la media de todos los elementos de un array.
* **std():** Devuelve la desviación estándar de todos los elementos de un array.
* **min():** Devuelve el valor mínimo de un array.
* **max():** Devuelve el valor máximo de un array.

Como vemos estas funciones estadísticas resumen en un valor el array (su suma, media...)

Por ejemplo, para calcular la suma de los elementos de un array, podemos utilizar la siguiente función:

In [None]:
array = np.array([1, 2, 3, 4, 5])

suma = np.sum(array)

print(suma)

Otras funciones se aplican a cada uno de los elementos del array, como las operaciones raiz cuadrada o logaritmo:

* **power():** Eleva los elementos de un array a la potencia o potencias indicadas
* **sqrt():** Devuelve la raiz cuadrada de todos los elementos de un array. Da error si algunos de los elementos es negativo
* **log():** Devuelve el logaritmo neperiano (base "e") de todos los elementos de un array.




In [None]:
serie = np.arange(1,11)

cuadrados = np.power(serie, 2)
print(cuadrados, end='\n'*2)

print(np.sqrt([9,36,64]))

In [None]:
np.log(np.exp(1))

In [None]:
np.exp(1)

In [None]:
np.e

In [None]:
np.pi

## Ejercicio 3

Con los datos de ventas obtenidas del ejercicio 2 (donde las filas eran las 4 localidades y las columnas los 3 productos), calcular:

- la media de ventas por localidad
- la media de ventas por producto

**PISTA**: buscar en internet en la ayuda de **"numpy.mean()"** que párametro de los que tiene debemos utilizar, y los valores que le debemos dar

In [None]:
# datos de partida: llamar a la variable (nombre que le pusiste) resultado del ejercicio 2

ventas


In [None]:
# ESCRIBIR EL CÓDIGO




In [None]:
# ESCRIBIR EL CÓDIGO

# axis=1 recorre las filas, sería media por localidad
media_localidad = np.mean(ventas, axis=1)

media_localidad



\

## **Ordenar arrays**

Los arrays de NumPy pueden ser ordenados de manera ascendente o descendente utilizando las **funciones `sort()` y `argsort()`**.

La **función `sort()`** **ordena los elementos de un array de manera inplace, es decir, el array original se modifica**. La función **`argsort()` devuelve un array con los índices de los elementos ordenados**, sin modificar el array original.

Por ejemplo, para ordenar un array de manera ascendente, podemos utilizar la siguiente función:

In [None]:
array = np.array([5, 2, 4, 3, 1])

array.sort()       # OJO: realiza el cambio (ordenación) en la propia estructura

print(array)

In [None]:
print(np.argsort([5,2]))

El método 'sort' ordena solo de forma ascendente. **Para hacerlo descendente** tenmos que recurrir a técnicas de slicing mas avanzadas:

In [None]:
descendente = array[::-1]

print(descendente)

In [None]:
copia = array[:]

copia

Los arrays disponen de los métodos `argmin()` y `argmax()`, que devuelven la posición del valor mínimo y máximo respectivamente del array:

In [None]:
array

In [None]:
# recordar que esta ordenado
print(array.argmin())

print(array.argmax())

\

## Unir, concatenar arrays

En ocasiones nos puede ser util unir arrays según una disposición o eje (hztal, vtcal).

Para ello podemos hacer uso de los métodos de numpy **`vstack()` y `hstack()`**

**Por ejemplo** si tenemos datos en 4 columnas de las ventas por trimestre (columna por trimestre) de un año en unas localidades, y queremos añadir los datos en el mismo tiempo de otras localidades, guardadas en otro array, **apilaremos los datos en vertical <vstack()>**:

In [None]:
arr_2021T_Caceres = [[29577.19, 37072.47, 19332.3 , 35156.42],
                     [30047.41, 17334.37, 25796.77, 30006.62],
                     [25213.62, 28823.39, 28119.83, 31945.72]]



In [None]:
arr_2021T_Badajoz = [[24855.06, 35049.73, 31627.14, 31089.02],
                     [24870.18, 23416.85, 18894.29, 19853.76],
                      [26835.76, 22758.85, 28985.49, 31674.78]]


In [None]:
datos_2021T_Caceres = np.array(arr_2021T_Caceres)

datos_2021T_Badajoz = np.array(arr_2021T_Badajoz)

In [None]:
# como primer argumento se indican los arrays a unir en forma de tupla
datos_2021T_Extremadura = np.vstack((datos_2021T_Caceres, datos_2021T_Badajoz))

print(datos_2021T_Extremadura)

Si ahora queremos unir a estos datos de 2021 los guardados del año anterior 2020 para toda la comunidad, como son instantes de tiempo diferentes para las mismas localidades los apilaremos horizontalmente (primero las 4 columnas/trimestres de 2020 y despues las de 2021):

In [None]:
# como primer argumento se indican los arrays a unir en forma de tupla
arr_2020T_Extremadura = [[30992.04, 23402.96, 27032.3 , 22740.62],
                         [22559.16, 16128.93, 25139.12, 23625.63],
                         [25436.57,  9371.32, 16678.93, 20999.55],
                         [18057.67, 23915.39, 10501.66,  7199.66],
                         [29584.95, 22172.51, 10175.5 , 17452.76],
                         [18610.39, 17953.95, 24468.45, 29356.84]]


datos_2020T_Extremadura = np.array(arr_2020T_Extremadura)

In [None]:
datos_20_21T_Extremadura = np.hstack((datos_2020T_Extremadura, datos_2021T_Extremadura))

print(datos_20_21T_Extremadura)

Como se puede intuir, **a la hora de utilizar estos métodos las dimensiones (filas/columnas) han de permitir hacer la unión**. Por ejemplo para unir verticalmente los 2 arrays han de tener el mismo nº de columnas.

El método **"concatenate"** puede realizar concatenaciones en ambos ejes (concatenar horizontal o verticalmente):

In [None]:
np.concatenate((datos_2020T_Extremadura, datos_2021T_Extremadura), axis=1)

## Ejercicio 4

A los datos de ventas medias por localidad del ejercicio 3 queremos unir los datos de medias ya calculadas de otras 2 localidades:

Unir los dos arrays en la orientación correcta para tener los datos de las 6 localidades

In [None]:
# datos de partida: llamar a la variable (nombre que le pusiste) de ventas medias por localidad
# resultado del ejercicio 3

media_localidad

In [None]:
media_localidad_otras = np.array([456.25, 785.75])

In [None]:
# ESCRIBIR EL CÓDIGO





## Uso de datos aleatorios: random

La librería **NumPy** incluye un **módulo llamado `random`** que proporciona funciones para generar números aleatorios.

Algunas de las funciones más comunes del módulo `random` son:

* `rand()`: Devuelve un número aleatorio entre 0 y 1.
* `randint()`: Devuelve un número aleatorio entero entre dos valores especificados.
* `uniform()`: Devuelve un número aleatorio entre dos valores especificados.
* `normal()`: Devuelve un número aleatorio con distribución normal.

Por ejemplo, para generar 6 números aleatorios entre 0 y 1, podemos utilizar la siguiente función:


In [None]:
nros_aleatorios = np.random.rand(6)

print(nros_aleatorios)

In [None]:
np.random.uniform(1,40, size=6)

\

## **Copia de un array**

Para **copiar un array de NumPy**, podemos utilizar la **función `copy()`**. Esta función crea una copia independiente del array original.

Por ejemplo, para copiar un array, podemos utilizar la siguiente función:

In [None]:
array = np.array([1, 2, 3])

copied_array = np.copy(array)

print(copied_array)

**Si para hacer copias no procedemos de esta forma nos podemos llevar una sorpresa:**

In [None]:
mi_matriz = np.arange(1,10).reshape(3,3)

mi_matriz

In [None]:
copia_matriz = mi_matriz

copia_matriz[1,1] = 999

copia_matriz

In [None]:
mi_matriz

**Si utilizas 'copy()' te aseguras de conservar los datos originales:**

In [None]:
mi_matriz = np.arange(1,10).reshape(3,3)

copia2 = mi_matriz.copy()

copia2[1,1] = 999

copia2

In [None]:
mi_matriz