# Librería Numpy

En esta libreta se presenta una introducción a la librería Numpy. La librería Numpy provee de una serie de herramientas que hacen de Python un lenguaje eficiente a la hora de realizar cálculo numérico. Consta de los siguientes elementos:
- El objeto <code>ndarray</code>, que implementa vectores y matrices n-dimensionales.
- Los operadores y funciones necesarios para realizar cálculos matemáticos de forma eficiente.
- Funciones para leer y escribir datos de disco y memoria.
- Algoritmos diversos (ej: generación de series, números aleatorios, transformadas, etc.)

Además, la librería Numpy está es la base de otras librerías que veremos en este curso.

---

# Índice
[El objeto ndarray](#El-objeto-ndarray) <br/>
[Operaciones con ndarray](#Operaciones-con-ndarray) <br/>
&nbsp;&nbsp;&nbsp;&nbsp; [Operaciones entre un escalar y un ndarray](#Operaciones-entre-un-escalar-y-un-ndarray) <br/>
&nbsp;&nbsp;&nbsp;&nbsp; [Operaciones con un ndarray simple](#Operaciones-con-un-ndarray-simple) <br/>
&nbsp;&nbsp;&nbsp;&nbsp; [Operaciones entre dos ndarray](#Operaciones-entre-dos-ndarray) <br/>
[Generación de matrices comunes](#Generación-de-matrices-comunes) <br/>
[Funciones de cálculo de Numpy](#Funciones-de-cálculo-de-Numpy) <br/>
[Conclusiones](#Conclusiones) <br/>

---

In [55]:
import numpy as np  # Nuevo: librería Numpy

## El objeto <code>ndarray</code>

El objeto <code>ndarray</code> representa matrices n-dimensionales de forma más eficiente que los tipos de dato básicos de Python (es decir, las colecciones). Se puede definir un vector de la siguiente manera:

NameError: name 'plt' is not defined

In [None]:
v = np.array([2.3, 4.5, 5.5, 8.2])
print(v)

Para acceder a un elemento, lo podemos indexar por su posición (empezando por 0):

In [57]:
print( "Primer elemento: ")
print( v[0] )
print( "Tercer elemento: ")
print( v[2] )

Primer elemento: 
2.3
Tercer elemento: 
5.5


Al igual que en las listas, se puede usar un indexado avanzado para seleccionar los elementos: 

In [58]:
print( "Último elemento: ")
print( v[-1] )

Último elemento: 
8.2


In [59]:
print( "Elementos impares" )
print ( v[1::2])

Elementos impares
[4.5 8.2]


También podemos representar matrices de 2 o más dimensiones. Representemos, por ejemplo, la siguiente matriz bidimensional:

\begin{bmatrix}
2 & 3\\
8 & 5
\end{bmatrix}

In [60]:
m2 = np.array([[2, 3], 
               [8, 5]])

print(m2)

[[2 3]
 [8 5]]


En estos casos, el indexado también será bidimensional. Si queremos escoger, por ejemplo, el elemento en la primera fila, segunda columna, el índice será $(0,1)$:

In [61]:
print( m2[0,1] )

3


Podemos seleccionar también una fila o una columna, usando el símbolo <code>:</code> en la dimensión seleccionada. Por ejemplo, si queremos seleccionar la primera columna usaremos el índice $(:,0)$, o, dicho de otro modo, todas las filas (<code>:</code>) de la primera columna (<code>0</code>):

In [62]:
m2[:,0]

array([2, 8])

También se pueden definir matrices de más de 2 dimensiones. Aquí vemos un ejemplo de una matriz con 3 dimensiones.

In [63]:
m3= np.array( [ [ [1, 9],
                  [3, 3] ],
                [ [2, 7],
                  [4, 6] ] ] )
print(m3)

[[[1 9]
  [3 3]]

 [[2 7]
  [4 6]]]


<p style="background-color:lightpink; padding:1em"><b>Ejercicio 1</b><br/>
    Defina las siguientes matrices: <br/>
    $A=\begin{bmatrix}
    3 & 2 & 1\\
    2 & 1 & 3
    \end{bmatrix}
    B=\begin{bmatrix}
    3 & 0 & 0\\
    0 & 3 & 0\\
    0 & 0 & 3
    \end{bmatrix}
    C=\begin{bmatrix}
    1 & 0 & 4 & 6 & 3 & 4
    \end{bmatrix}$ 
</p>

<p style="background-color:lightpink; padding:1em"><b>Ejercicio 2</b><br/>
    Asigne las variables a los valores contenidos en las matrices de la siguiente manera: <br/>
    <code>a02</code>=$A(0,2)$<br/>
    <code>b11</code>=$B(1,1)$<br/>
    <code>c3</code>=$C(3)$<br/>
    <code>b0</code>=primera columna de $B$<br/>
    <code>cpar</code>=todos los elementos en posiciones pares de $C$
</p>

### Propiedades de los objetos <code>ndarray</code>

Los objetos <code>ndarray</code> poseen una serie de variables miembro que nos pueden ayudar para obtener información relevante acerca del objeto. De este modo, podemos ver el tipo de datos que guardan:

In [64]:
print(v.dtype)

float64


In [65]:
print(m2.dtype)

int32


O también las dimensiones de la matriz:

In [66]:
print(v.ndim)

1


In [67]:
print(m2.ndim)

2


In [68]:
print(m3.ndim)

3


Podemos ver también la longitud en cada dimensión mediante la propiedad <code>shape</code>, la cual es muy importante a la hora, por ejemplo, de ver si dos matrices se pueden multiplicar:

In [69]:
print(v.shape)

(4,)


In [70]:
print(m2.shape)

(2, 2)


In [71]:
print(m3.shape)

(2, 2, 2)


## Operaciones con <code>ndarray</code>

Numpy implementa los operadores típicos de las matrices. Lo hace, además, de forma eficiente, explotando optimizaciones para cálculos vectoriales de forma transparente. Por tanto, siempre hay que usar estos operadores cuando sea posible.

### Operaciones entre un escalar y un <code>ndarray</code>

Podemos empezar por la multiplicación de un escalar con un array:

In [72]:
2 * v

array([ 4.6,  9. , 11. , 16.4])

O la división:

In [73]:
1 / v

array([0.43478261, 0.22222222, 0.18181818, 0.12195122])

In [74]:
v / 10

array([0.23, 0.45, 0.55, 0.82])

Como vemos, cuando se trata de un escalar, se realiza la misma operación para cada uno de los elementos del array. Esto pasa también con la suma y resta:

In [75]:
v

array([2.3, 4.5, 5.5, 8.2])

In [76]:
v + 1

array([3.3, 5.5, 6.5, 9.2])

In [77]:
v - 5

array([-2.7, -0.5,  0.5,  3.2])

<p style="background-color:lightpink; padding:1em"><b>Ejercicio 3</b><br/>
    Defina el siguiente vector y multiplique sus valores por 10: <br/>
    $
    L=\begin{bmatrix}
    0.3 & -0.1 & 0.2 & 0.7 & -0.3 & 0.1
    \end{bmatrix}$ <br/>
    $L_{10} = 10\cdot L$
</p>

### Operaciones con un <code>ndarray</code> simple

Algunas operaciones implican a un sólo array. Por ejemplo, podemos cambiar su signo (equivalente a multiplicar por -1):

In [78]:
-v

array([-2.3, -4.5, -5.5, -8.2])

Otra operación muy importante, es la transposición, en la que se cambian filas por columnas, y que se hace con la propiedad <code>T</code> del objeto <code>ndarray</code>:

In [79]:
m2

array([[2, 3],
       [8, 5]])

In [80]:
m2.T

array([[2, 8],
       [3, 5]])

### Operaciones entre dos <code>ndarray</code>

Las operaciones entre matrices son como se esperaría de la aritmética matricial. Lo único con lo que hay que tener cuidado es con que <b>Numpy no permite operaciones entre matrices de distintas dimensiones</b>. Por tanto, en lugar de un vector unidimensional, tenemos que definir una matriz bidimensional incluso en caso de que tenga sólo una fila/columna.

In [81]:
vb = np.array([[1, 2, 3],])
mb = np.array([[1, 10], [2, 20], [3, 30]])

Veamos un ejemplo de multiplicación entre una matriz de 1x3 y una 3x2. Para ello se utiliza el operador <code>@</code>, o la función <code>np.dot()</code>:

In [82]:
vb @ mb

array([[ 14, 140]])

In [83]:
np.dot(vb, mb)

array([[ 14, 140]])

Es importante tener en cuenta que el operador <code>*</code> no actúa como operador de multiplicación entre matrices, sino como multiplicación elemento a elemento. Por ejemplo:

In [84]:
mb * mb

array([[  1, 100],
       [  4, 400],
       [  9, 900]])

Obviamente, hay que tener cuidado con que las formas de las matrices sean compatibles a la hora de realizar operaciones de multiplicación, suma, etc. En caso contrario, se producirá un error. Más adelante veremos cómo gestionar los errores que no se pueden predecir, por ejemplo, en casos en los que las formas de las matrices no sean conocidas de antemano.

Para la suma, se utiliza el operador <code>+</code>:

In [85]:
mb + mb

array([[ 2, 20],
       [ 4, 40],
       [ 6, 60]])

<p style="background-color:lightpink; padding:1em"><b>Ejercicio 4</b><br/>
    Defina la siguiente matriz y realice la operación indicada: <br/>
    $
    M=\begin{bmatrix}
    2 & 1 \\
    3 & 2 
    \end{bmatrix}$ <br/>
    $M_p = M \cdot M^T$
</p>

In [86]:
M=np.array([[2,1],[3,2]])
Mp=np.dot(M,M.T)
print(Mp)

[[ 5  8]
 [ 8 13]]


## Generación de matrices comunes

Numpy permite generar matrices comunmente utilizadas. En este apartado veremos algunas que serán útiles para el análisis de datos, pero hay muchas más que se pueden consultar en la <a href="https://numpy.org/doc/stable/reference/routines.array-creation.html">sección dedicada</a> de la documentación de Numpy.

Podemos generar, por ejemplo, una matriz de ceros de cualquier tamaño definido por una tupla (o un número si queremos que sea unidimensional). Por ejemplo, para generar la matriz 2x3:

\begin{bmatrix}
0 & 0 & 0\\
0 & 0 & 0
\end{bmatrix}

usamos:

In [87]:
z = np.zeros((2,3))
print(z)

[[0. 0. 0.]
 [0. 0. 0.]]


De igual modo, podemos generar una matriz con unos:

In [88]:
u = np.ones(3)
print(u)

[1. 1. 1.]


Otra matriz importante, es la identidad:

In [89]:
i3 = np.identity(3)
print(i3)

[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]


In [90]:
u @ i3

array([1., 1., 1.])

A menudo, querremos generar una matriz con valores aleatorios basados en la distribución normal. Esto se puede realizar con la función <code>randn</code> del módulo <code>random</code>:

In [91]:
np.random.randn(3,3)

array([[ 1.45892744, -1.47621657, -1.00088441],
       [ 0.54013166, -0.60825947,  1.27105032],
       [ 0.76640063,  1.40981844,  0.50971294]])

Nótese que en este caso, los parámetros no siguen el estándar de usar tuplas para las dimensiones, como en el caso de <code>np.zeros()</code> o <code>np.ones()</code>. A menudo, esta función se usa para generar un valor aleatorio simple:

In [92]:
np.random.randn()

-0.3669909721565559

El módulo <code>np.random</code> puede realizar muchas otras funciones, documentadas <a href="https://numpy.org/doc/stable/reference/random/index.html#module-numpy.random">aquí</a>.

Una de las funciones que más se utilizarán en análisis de datos es la generación de rangos. Esta operación será especialmente útil para tareas como la representación gráfica, el muestreo, la ejecución sistemática de un algoritmo o función en una dimensión, etc. Para ello, la función <code>arange</code> es especialmente eficiente. Dicha función permite generar rangos de diverso tipo.

Si queremos generar un rango de enteros de 0 a un valor $N-1$, siendo $N$ la longitud del array:

In [93]:
np.arange(10)

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

Podemos especificar el valor mínimo y máximo (siempre teniendo en cuenta que la cuenta se para a un valor antes del máximo, como consecuencia del indexado desde 0):

In [94]:
np.arange(4,10)

array([4, 5, 6, 7, 8, 9])

Incluso podemos ajustar el paso, llegando a generar valores fraccionales:

In [95]:
np.arange(4,10,2)

array([4, 6, 8])

In [96]:
np.arange(4,10,0.5)

array([4. , 4.5, 5. , 5.5, 6. , 6.5, 7. , 7.5, 8. , 8.5, 9. , 9.5])

<p style="background-color:lightpink; padding:1em"><b>Ejercicio 5</b><br/>
    Genere una matriz de 4x2 con valores aleatorios
</p>

<p style="background-color:lightpink; padding:1em"><b>Ejercicio 6</b><br/>
    Defina una secuencia de números entre -10 y 10 con separación de 2
</p>

## Funciones de cálculo de Numpy

Además del objeto <code>ndarray</code> y de todos los operadores que permiten su manipulación, Numpy ofrece una serie de funciones comunes matemáticas. En este apartado, veremos algunas de ellas. 

Numpy provee de funciones matemáticas básicas, implementadas de forma eficiente tanto para su uso con valores simples, como con matrices. Por ejemplo, disponemos de una función potencia, que nos permite calcular $2^3$:

In [97]:
np.power(2,3)

8

Esta misma función, aplicada a una matriz, calcula el valor elemento a elemento:

In [98]:
t=np.power(m2,3)
m33=m2**3
print(m33)
print(t)

[[  8  27]
 [512 125]]
[[  8  27]
 [512 125]]


Una función similar es la función $e^x$:

In [99]:
np.exp(3)

20.085536923187668

También tenemos, por ejemplo, la función raíz cuadrada:

In [100]:
np.sqrt(81)

9.0

Numpy también provee de las constantes $\pi$, $e$ e $\infty$, entre otras:

In [101]:
np.e

2.718281828459045

In [102]:
np.Inf

inf

In [103]:
1 / np.Inf

0.0

De hecho, podemos usar la constante $\pi$ en combinación con las funciones trigonométricas:

In [104]:
x = np.arange(0, 2*np.pi, np.pi/4)
y = np.cos(x)
print(y)

[ 1.00000000e+00  7.07106781e-01  6.12323400e-17 -7.07106781e-01
 -1.00000000e+00 -7.07106781e-01 -1.83697020e-16  7.07106781e-01]


Numpy también dispone de un gran número de funciones de álgebra lineal con matrices en el módulo <code>linalg</code>. Por ejemplo, podemos calcular la matriz inversa con la función <code>inv</code>:

In [105]:
m2inv= np.linalg.inv(m2)
print(m2inv)

[[-0.35714286  0.21428571]
 [ 0.57142857 -0.14285714]]


In [106]:
m2 @ m2inv

array([[1., 0.],
       [0., 1.]])

<p style="background-color:lightpink; padding:1em"><b>Ejercicio 7</b><br/>
    Defina una función de Python que tome a su entrada un array y devuelva un array sólo con los elementos en posiciones impares, elevados al cuadrado.<br/>
    La cabecera de la función es la siguiente:<br/>
    <code>def funcion_ejercicio(array_entrada):</code><br/>
</p>

In [107]:
def funcion_ejercicio(array_entrada):
    elementos_pares = array_entrada[::2]
    return np.power(elementos_pares, 2)

funcion_ejercicio(np.array([0, 1, 2, 3, 4, 5, 6]))

array([ 0,  4, 16, 36], dtype=int32)

Hay numerosas otras funciones que se escapan del alcance de este curso, como las transformadas de Fourier, manipulación de polinomios, etc. En la <a href="https://numpy.org/doc/">documentación de Numpy</a> se puede encontrar una referencia completa de las funciones.

## Conclusiones

Hemos hecho un repaso a las funciones básicas de Numpy, que es una librería que compone el núcleo de otras que usaremos para el análisis de datos. En ocasiones, tendremos que manipular estructuras de datos de Numpy cuando operemos con dichas librerías. Concretamente, hemos visto que la principal aportación de Numpy es el objeto <code>ndarray</code> y todo lo que la rodea (operadores, funciones de cálculo, etc.). La gran funcionalidad de Numpy, se extiende aún más con la librería <a href="https://docs.scipy.org/doc/">Scipy</a>, que provee de muchas otras funcionalidades matemáticas (como son la resolución de sistemas de ecuaciones diferenciales, optimización, etc.).