# 2.3. Introducción a NumPy III.

In [None]:
import numpy as np 
import matplotlib.pyplot as plt

### Operaciones Mátematicas y estadísticas

- NumPy ofrece un amplio conjunto de funciones matemáticas y estadísticas que se pueden aplicar sobre ndarrays. 


|Función|Descripcción|
|----|---|
|`sum`| Suma de elementos.|
|`mean`| Media aritmética de los elementos.|
|`median`| Mediana de los elementos.|
|`std`| Desviación estándar de los elementos.|
|`var`| Varianza de los elementos.|
|`min`| Valor mínimo de los elementos.|
|`max`| Valor máximo de los elementos.|
|`argmin`| Índice del valor mínimo.|
|`argmax`| Índice del valor máximo.|
|`cumsum`| Suma acumulada de los elementos.|
|`cumprod`| Producto acumulado de los elementos.|


In [None]:
arr = np.random.randn(5, 4)
arr

Puedo calcular la suma

In [None]:
arr.sum()

Las operaciones podemos hacerlas de dos maneras distintas

- En operaciones simples da igual
- Se suele utilizar np."operación"

In [None]:
print(arr.mean())
print(np.mean(arr)) 

- Todas estas funciones pueden recibir, además del ndarray sobre el que se aplicarán, un segundo parámetro llamado <b>axis</b>. 
- Si no se recibe este parámetro las funciones se aplicarán sobre el conjunto global de los elementos del ndarray, pero si se incluye, podrá tomar dos valores:
<ul>
<li>Valor 0: Aplicará la función por columnas</li>
<li>Valor 1: Aplicará la función por filas</li>
    

In [None]:
arr = np.array([[0, 1, 2, 3, 4, 5, 6, 7], [0, 1, 2, 3, 4, 5, 6, 7]])
arr

In [None]:
arr.mean()

In [None]:
arr.mean(axis=0)

In [None]:
arr.mean(axis=1)

In [None]:
arr.sum()

In [None]:
arr.sum(axis=0)

In [None]:
arr.sum(axis=1)

In [None]:
arr = np.array([0, 1, 2, 3, 4, 5, 6, 7])
arr.cumsum()

In [None]:
arr = np.array([[0, 1, 2], [3, 4, 5], [6, 7, 8]])
arr

In [None]:
arr.cumsum(axis=0)

In [None]:
arr.cumprod(axis=1)

¿Qué dará cumprod si lo aplico sin indicar eje?

In [None]:
arr.cumprod()

### Operaciones sobre arrays de tipo Bool

- Python trata los valores booleanos True como 1 y los False como 0.
- Se pueden realizar operaciones matemáticas sobre estos valores booleanos.

In [None]:
arr = np.random.randn(100)

Podemos sacar máscaras booleanas

In [None]:
arr > 0

Sumar los elementos positivos (True)

In [None]:
(arr > 0).sum()

O consultar si alguno o todos son True

In [None]:
bools = np.array([False, False, True, False])

In [None]:
bools.any()

In [None]:
bools.all()

### Sorting

Ordena de mayor a menor. No devuelve nada, simplemente coloca los elementos

In [None]:
arr = np.random.randn(6)
arr

In [None]:
arr.sort()
arr

Podemos ordenar por filas o por columnas

In [None]:
arr = np.random.randn(5, 3)
arr

In [None]:
arr.sort(axis=0)
arr

In [None]:
arr.sort(axis=1)
arr

Por defecto ordena por la última dimensión

In [None]:
arr = np.random.randn(5, 3)
arr

In [None]:
arr.sort()
arr

### Unique y Operaciones Set

- Permite realizar tratamientos sobre un ndarray
- Todos los elementos del mismo forman un conjunto.

|Función|Descripcción|
|----|---|
|`unique`| Calcula el conjunto único de elementos sin duplicados.|
|`intersect1d`| Calcula la intersección de los elementos de dos arrays.|
|`union1d`| Calcula la unión de los elementos de dos arrays.|
|`in1d`| Calcula un array booleano que indica si cada elemento del primer array está contenido en el segundo.|
|`setdiff1d`| Calcula la diferencia entre ambos conjuntos.|
|`setxor1d`| Calcula la diferencia simétrica entre ambos conjuntos.|


Sacamos los elementos sin repetición del array

In [None]:
names = np.array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'])
np.unique(names)

Se puede emplear tanto para strings, como para números

In [None]:
ints = np.array([3, 3, 3, 2, 2, 1, 1, 4, 4])
np.unique(ints)

Distintas funciones pueden ser encadenadas unas dentro de otras
- Set y unique son equivalentes

In [None]:
sorted(set(names))

## Guardado de Arrays Numpy

- Podemos guardar un array en un pickle
- Pero NumPy nos permite leer y escribir diréctamente ficheros a disco.
- En formato binario o formato texto.

Si queremos guardar un único array usamos save

In [None]:
arr = np.arange(10)
np.save('some_array', arr) # Save a single array to a binary file in NumPy format

Típicamente se guarda con la extensión npy

In [None]:
np.load('some_array.npy')

Si tenemos varios arrays para guardar, se utiliza savez

In [None]:
np.savez('array_archive.npz', a=arr, b=arr) # Save several arrays into a .npz archive

In [None]:
arch = np.load('array_archive.npz')
arch['b']

Cuando el fichero es muy grande podemos guardarlo comprimido

In [None]:
np.savez_compressed('arrays_compressed.npz', a=arr, b=arr)

También podemos guardarlo en formato txt

In [None]:
array = np.arange(10)
print(array)

np.savetxt('array1.txt', array, delimiter=',')
array_load = np.loadtxt('array1.txt', delimiter=',')

print(array_load)

## Operaciones Algebraicas

- Hasta el momento hemos visto cómo aplicar funciones "elemento a elemento" a matrices multidimensionales pero, en ningún caso, hemos aplicado funciones de cálculo matricial sobre las mismas. 
- NumPy ofrece un amplio conjunto de funciones que permiten realizar multitud de tratamientos/operaciones matriciales. 
- Todas estas funciones están disponibles a través del submódulo <b>linalg</b>.

Algunas de las más comunes son:<br/>

|Función|Descripcción|
|----|---|
|`diag`| Recupera la diagonal principal del ndarray pasado como parámetro.|
|`dot`| Realiza el producto matricial de dos ndarray.|
|`trace`| Calcula la suma de los elementos de la diagonal principal.|
|`det`| Calcula el determinante de un ndarray.|
|`eig`| Calcula los autovalores y autovectores de un ndarray.|
|`inv`| Calcula la inversa de una matriz.|
|`qr`| Calcula la descomposición QR de una matriz.|
|`svd`| Calcula la descomposición de valores singulares (Singular Value Decomposition) de una matriz.|
|`solve`| Calcula el resultado del sistema lineal Ax = B donde A y B son las matrices de entrada y x la salida.|
|`lstsq`| Calcula la solución de mínimos cuadrados a y = Xb, donde y y b son los parámetros de entrada y X la salida.|


In [None]:
x = np.array([[1., 2., 3.], [4., 5., 6.]])
y = np.array([[6., 23.], [-1, 7], [8, 9]])

In [None]:
x

In [None]:
y

In [None]:
x.shape

In [None]:
y.shape

IMPORTANTE: 

- Es vital diferenciar entre la multiplicación entre dos matrices elementos a elemento.
- Y la multiplicación matricial (fila X columna)
- Cuidado con el tamaño de la matriz resultante (2,3) * (3,2) = (2,2)

In [None]:
x.dot(y)

Suele escribirse haciendo referencia a la librería np

In [None]:
np.dot(x, y)

El simbolo @ tambien sirve para la multiplicación

In [None]:
x @ y

Ojo (2,3) * (3, ) = (2, ) Da como resultado un vector de una dimensión

In [None]:
resultado = np.dot(x, np.ones(3))
print(resultado)
print(resultado.ndim)
print(resultado.shape)

Fuera de la multiplicación matricial, hay que importar las operaciones algebraicas para poder utilizarlas

In [None]:
from numpy.linalg import inv

X = np.random.randn(5, 5)
print(X)
inv(X)

Podemos concatenar operaciones, poniéndolas unas detrás de otras. Lo cual resulta muy cómodo

In [None]:
mat = X.T.dot(X)
mat

Podemos, por ejemplo, calcular la matriz identidad

- Matriz cuadrada donde todos sus elementos son ceros, menos los elementos de la diagonal principal que son unos

In [None]:
identidad = mat.dot(inv(mat))
identidad

## Funciones Financieras

|Función|Descripcción|
|----|---|
|`fv(rate, nper, pmt, pv[, when])`|Calcula el valor futuro.|
|`pv(rate, nper, pmt[, fv, when])`|Calcula el valor presente.|
|`npv(rate, values)`|VAN NPV (Net Present Value) de una serie de flujo de cajas.|
|`pmt(rate, nper, pv[, fv, when])`|Calcula el pago total, principal y intéres.|
|`ppmt(rate, per, nper, pv[, fv, when])`|Calcula el pago contra el principal.|
|`ipmt(rate, per, nper, pv[, fv, when])`|Calcula la proporción del interés del pago.|
|`irr(values)`|TIR: Internal Rate of Return (IRR).|
|`mirr(values, finance_rate, reinvest_rate)`| Internal Rate of Return (IRR) Modificada.|
|`nper(rate, pmt, pv[, fv, when])`|Calcula el número de pagos periodicos|
|`rate(nper, pmt, pv, fv[, when, guess, tol, …])`|Calcula la tasa de interes por periodo.|

- Recuerda a la ayuda se puede acceder con `?funcion`


In [None]:
?np.fv

- Teniendo que pagar cuotas de 10.000 € anuales
- A 10 años
- Y un tipo de interés del 7% anual
- ¿Cual será su valor futuro?

In [None]:
np.fv(rate = 0.07, nper = 10, pmt = 10000, pv = 0) 

Fijaros que la función de arriba está deprecada. Hay que leer el warning y actuar en consecuencia

In [None]:
!pip install numpy_financial

In [None]:
import numpy_financial as npf

In [None]:
npf.fv(rate = 0.07, nper = 10, pmt = 10000, pv = 0)

___
# Ejercicios

**2.3.1.** Crea un vector de 30 elementos aleatorios y calcula su media.

**2.3.2.**Crea una matriz de 8x10 aleatoria y substrae la media por columnas.

**2.3.3.** Crea una función que reciba dos enteros n y m, 

- Genere dos matrices aleatorias (normales 0,1) de dimensiones nxm y mxn
- Haga el producto matricial de ambas para obtener una matriz nxn. 

**2.3.4.** Crea una función que reciba dos matrices y devuelva la secuencia ordenada, de la unión, de los elementos únicos de ambas.

**2.3.5.** Crea una matriz aleatoria normal de 5x10 y normalízala en media y varianza por columnas (resta la media y divide entre la desviación típica).

- Procedimiento muy típico en ML para normalizar lo que vamos a introducir en la red neuronal

**2.3.6.** Calcule el capital final de invertir 500€ mensuales durante 10 años, a un interés anual del 10%

**2.3.7.** ¿Cuál es el valor futuro después de 10 años si empiezas con 100 euros, y tienes un ahorro mensual adicional de 100 €? La tasa de interés es del 5% anual.