<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1a/NumPy_logo.svg/1200px-NumPy_logo.svg.png" width = 450>

Numpy es la biblioteca fundamental para computación científica. Se basa en un objeto array n-dimensional muy potente y posee también funciones útiles para álgebra lineal, transformación de fourier y números aleatórios.

La principal ventaja de emplear Numpy en vez de las estructuras de datos nativas de Python es su eficiencia (rapidez), dado que ofrece nuevos tipos de variables que permiten generar expresiones vectorizadas, para las cuales hay funciones *precompiladas*, y escritas en *C*, lo que las hace muy rápidas.

El elemento principal de Numpy es la clase **ndarray**. De esta forma se definen vectores y matrices n-dimensionales, y se pueden inicializar a partir de, por ejemplo, una lista. También se pueden generar matrices a partir de listas-de-listas, o utilizando diferentes funciones.

En el indexado, se mantiene la lógica de las listas: indices comienzan en 0, y se pueden utilizar *Slices*. El objeto ndarray tiene un tipo de dato **dtype** homogeneo, aunque realiza conversiones automáticas (por ejemplo al sumar enteros y flotantes)

# <mark>Creación de arrays</mark>

Ahora importamos `numpy`. Por convención se importa como `np`

In [1]:
import numpy as np

## `np.zeros`

In [2]:
np.zeros(5)

array([0., 0., 0., 0., 0.])

Para crear un array 2D, le pasamos a la función una tupla con el número deseado de filas y columnas:

In [3]:
np.zeros((3,4))

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

## Terminología

* En NumPy, cada dimensión se conoce como **axis**.
* El número de ejes o **axis** nos da la dimensión (**Rank**) (el array anterior es bi-dimensional).
    * El tamaño del primer eje es 3, y del segundo 4.
* Una tupla con los tamaños de los ejes del array se denomina **shape**.
    * Por ejemplo **shape** de la matriz anterior es `(3, 4)`.
* El número total de elementos en el array se denomina **size** y es igual al producto del tamaño de los ejes(por ejemplo 3*4=12)

In [None]:
a = np.zeros((3,4))
a

In [None]:
a.shape

In [None]:
a.ndim  # len(a.shape)

In [None]:
a.size

## Arrays N-dimensional


In [None]:
np.zeros((2,3,4))

## Tipo de dato
los arrays de numpy son de tipo `ndarray`:

In [None]:
type(np.zeros( (3,4)) )

## `np.ones`


In [None]:
np.ones((3,4))

## `np.full`
Crea un array del shape dado inicializado con el valor especificado.

In [None]:
np.full((3,4), np.pi)

## `np.empty`
Crea un array sin inicializar(su contenido no es predecible como el contenido en memoria hasta ese instante):

In [None]:
np.empty((2,3))

## np.array
Se puede inicializar un `ndarray` usando listas con la función `array`:

In [None]:
np.array([[1,2,3,4], [10, 20, 30, 40]])

## `np.arange`


In [None]:
np.arange(1, 5)

Funciona también con flotantes:

In [None]:
np.arange(1.0, 5.0)

También se le puede pasar un paso como parámetro

In [None]:
np.arange(1, 5, 0.5)

Sin embargo, cuando se trabaja con flotantes, el número exacto de elementos del array no siempre es predecible. Por ejemplo:

In [None]:
print(np.arange(0, 5/3, 1/3)) # dependiendo de errores de punto flotante el último valor será 4/3 or 5/3.
print(np.arange(0, 5/3, 0.333333333))
print(np.arange(0, 5/3, 0.333333334))


## `np.linspace`
Por esta razón, generalmente es preferible utilizar la función `linspace` en lugar de `arange` cuando se trabaja con flotantes. La función `linspace` devuelve un array que contiene un número determinado de puntos distribuidos uniformemente entre dos valores (nótese que el valor máximo está *incluido*, al contrario que `arange`)

In [None]:
print(np.linspace(0, 5/3, 6))

## `np.rand` and `np.randn`
Hay varias funciones disponibles en el módulo `random` de NumPy para crear `ndarrays` inicializados con valores aleatorios. Por ejemplo, a continuación tenemos una matriz de 3x4 inicializada con valores aleatorios entre 0 y 1 (distribución uniforme).

In [None]:
np.random.rand(3,4)

Matriz de 3x4 que contiene números aleatorios flotantes muestreados a partir de una distribución normal univarida (distribución gaussiana) de media 0 y varianza 1:

In [None]:
np.random.randn(3,4)

# Array data
## `dtype`
Los `ndarrays` de NumPy son muy eficientes en parte porque todos sus elementos deben tener el mismo tipo de dato (normalmente númerico).
Se puede comprobar el tipo de dato mediante el atributo `dtype`:

In [None]:
c = np.arange(1, 5)
print(c.dtype, c)

In [None]:
c = np.arange(1.0, 5.0)
print(c.dtype, c)

En lugar de dejar que NumPy interprete el tipo de dato a utilizar, se puede establecer explícitamente al crear una matriz usando el parámetro `dtype`:

In [None]:
d = np.arange(1, 5, dtype=np.complex64)
print(d.dtype, d)

Algunos tipos de datos incluidos con signo `int8`, `int16`, `int32`, `int64`, sin signo `uint8`|`16`|`32`|`64`, flotantes `float16`|`32`|`64` y complejos `complex64`|`128`.



# <mark>Reshaping (Redimensionar un array)</mark>
## In place
Cambiar la forma de un `ndarray` es tan simple como modificar su atributo `shape`. Sin embargo, el número total de elementos de la matriz (`size`) debe seguir siendo el mismo.

In [None]:
g = np.arange(24)
print(g)
print("Dimensión:", g.ndim)

In [None]:
g.shape = (6, 4)
print(g)
print("Dimensión:", g.ndim)

In [None]:
g.shape = (2, 3, 4)
print(g)
print("Dimensión:", g.ndim)

## `reshape`
La función `reshape` devuelve un nuevo objeto `ndarray` que apunta a los *mismos* datos. Esto significa que la modificación de un array también modificará el otro.

In [None]:
g2 = g.reshape(4,6)
print(g2)
print("Dimensión:", g2.ndim)

Se establece el elemento de la fila 1, columna 2 en 999.

In [None]:
g2[1, 2] = 999
g2

El elemento correspondiente en el array original también se modifica

In [None]:
g

## `ravel`
Por último, la función `ravel` devuelve un nuevo `ndarray` unidimensional que también apunta a los mismos datos:

In [None]:
g.ravel()

# Operaciones aritméticas
Todos los operadores aritméticos usuales (`+`, `-`, `*`, `/`, `//`, `**`, etc.) pueden ser utilizados con los `ndarray`s. Estos se aplican elemento a elemento (*elementwise*):

In [None]:
a = np.array([14, 23, 32, 41])
b = np.array([5,  4,  3,  2])
print("a + b  =", a + b)
print("a - b  =", a - b)
print("a * b  =", a * b)
print("a / b  =", a / b)
print("a // b  =", a // b)
print("a % b  =", a % b)
print("a ** b =", a ** b)

# Conditional operators

Los operadores condicionales también se aplican elemento a elemento.

In [None]:
m = np.array([20, -5, 30, 40])
m < [15, 16, 35, 36]

# <mark>Funciones matemáticas y estadísticas</mark>

## Métodos de los `ndarray`

In [None]:
a = np.array([[-2.5, 3.1, 7], [10, 11, 12]])
print(a)
print("mean =", a.mean())

Este método calcula la media de todos los elementos en el `ndarray` sin importar la forma del array.

Aquí hay otros métodos útiles del `ndarray`:

In [None]:
for func in (a.min, a.max, a.sum, a.prod, a.std, a.var):
    print(func.__name__, "=", func())

<mark>Estas funciones aceptan un argumento opcional `axis` que permite solicitar que la operación se realice sobre elementos a lo largo de un eje dado. Por ejemplo:</mark>


In [None]:
c=np.arange(24).reshape(2,3,4)
c

In [None]:
c.sum(axis=0) #Suma las matrices

In [None]:
c.sum(axis=1)  # suma las filas

In [None]:
c.sum(axis=2) #suma las columnas

También se puede aplicar sobre múltiples axis:

In [None]:
c.sum(axis=(0,2))  # Sobre matrices y columnas

## Funciones universales

NumPy también proporciona funciones elementales rápidas llamadas *funciones universales*, o **ufunc**. Por ejemplo, `square`  devuelve un nuevo `ndarray` que es una copia del `ndarray` original, excepto que cada elemento está elevado al cuadrado:

In [None]:
a = np.array([[-2.5, 3.1, 7], [10, 11, 12]])
np.square(a)

Otras funciones:

In [None]:
print("ndarray original")
print(a)
for func in (np.abs, np.sqrt, np.exp, np.log, np.sign, np.ceil, np.modf, np.isnan, np.cos):
    print("\n", func.__name__)
    print(func(a))

## ufuncs Binarias


In [None]:
a = np.array([1, -2, 3, 4])
b = np.array([2, 8, -1, 7])
np.add(a, b)  # a + b

In [None]:
np.greater(a, b)  # a > b

In [None]:
np.maximum(a, b)

In [None]:
np.copysign(a, b) #toma el primer array y le asigna el signo del segundo

# <mark>Indexación de arrays</mark>



## Arrays unidimensionales

In [None]:
a = np.array([1, 5, 3, 19, 13, 7, 3])
a[3]

In [None]:
a[2:5]

In [None]:
a[2:-1]

In [None]:
a[:2]

In [None]:
a[2::2]

In [None]:
a[::-1]

Podemos modificar lo elementos:

In [None]:
a[3]=999
a

También se puede modificar un slice:

In [None]:
a[2:5] = [997, 998, 999]
a

⚠️ Los **slices** son vistas de los `ndarray` sobre el mismo buffer de datos. Esto significa que si creas una "slice" y lo modificas,

¡también vas a modificar el `ndarray` original!

In [None]:
a_slice = a[2:6]
a_slice[1] = 1000
a  # modifica el array original

✅ Si se quiere una copia de los datos, se debe utilizar el método `copy`:

In [None]:
another_slice = a[2:6].copy()
another_slice

In [None]:
another_slice[3] = 4000
print(another_slice)
print(a)

## <mark>Selección de elementos</mark>
Los ndarrays se pueden indexar tanto con valores binarios como con valores enteros para rescatar datos de interés.

In [None]:
v=np.arange(10).reshape((2,5)) * 10
print(v)

ind = (v > 50) & (v < 90) # &, and; |, or

print(ind)
# Y si queremos tener los índices numéricos (posiciones)?

indx, indy = np.where(ind)

print(indx, indy)

print(v[indx[0],indy[0]])

## Arrays multidimensionales
Se pueden acceder de forma similar, proporcionando un índice o slice para cada axis, separados por comas:

In [None]:
b = np.arange(48).reshape(4, 12)
b

In [None]:
b[1, 2]

In [None]:
b[1, :]

In [None]:
b[:, 1]

⚠️ **Cuidado**: Ver la diferencia sutil de las siguientes expresiones

In [None]:
b[1, :]

In [None]:
b[1:2, :]


<mark>La primera expresión retorna la fila 1 como un array unidimensional de shape `(12,)`, La segunda expresión retorna la misma fila como un array 2D de shape `(1, 12)`.</mark>

In [None]:
c = b[1, :].copy()
c

In [None]:
c = c[np.newaxis, :]
c

In [None]:
print(b[1, :].shape)
print(c.shape)

También se puede especificar una lista de índices

In [None]:
b[(0,2), 2:5]

In [None]:
b[:, (-1, 2, -1)]

Si se proporcionan múltiples índices, se obtiene una `ndarray` 1D que contiene los valores de los elementos en las coordenadas especificadas.

In [None]:
b[(-1, 2, -1, 2), (5, 9, 1, 9)]  # b[-1, 5], b[2, 9], b[-1, 1] y b[2, 9]

## Dimensiones superiores


In [None]:
c = b.reshape(4,2,6)
c

In [None]:
c[2, 1, 4]

In [None]:
c[2, :, 3]

Si se omite las coordenadas de uno de los ejes, se devolverán todos los elementos de los mismos:

In [None]:
c[2, 1]  # c[2, 1, :]

## Ellipsis (`...`)
También se pueden escribir elipsis (`...`) para indicar que se incluyan todos los ejes no especificados.

In [None]:
c[2, ...]  # c[2, :, :]

In [None]:
c[2, 1, ...]  #c[2, 1, :]

In [None]:
c[2, ..., 3]  # c[2, :, 3]

In [None]:
c[..., 3]  # c[:, :, 3]

## Indexación con booleanos


In [None]:
b = np.arange(48).reshape(4, 12)
b

In [None]:
rows_on = np.array([True, False, True, False])
b[rows_on, :]  # b[(0, 2), :]

In [None]:
cols_on = np.array([False, True, False] * 4)
b[:, cols_on]  # columnas 1, 4, 7 and 10

In [None]:
b[b % 3 == 1]

# Iterar

La iteración sobre un `ndarray`s es muy similar a la iteración sobre listas de python. Tenga en cuenta que la iteración sobre matrices multidimensionales se realiza con respecto al primer eje.

In [None]:
c = np.arange(24).reshape(2, 3, 4)
c

In [None]:
for m in c:
    print("Item:")
    print(m)

In [None]:
for i in range(len(c)):  # len(c) == c.shape[0]
    print("Item:")
    print(c[i])

Si se quiere iterar sobre *todos* los elementos del `ndarray`, simplemente itere sobre el atributo `flat`:

In [None]:
for i in c.flat:
    print("Item:", i)

# <mark>Stacking arrays<mark>

Primero creamos algunas matrices iniciales:

In [None]:
q1 = np.full((3,4), 1.0)
q1

In [None]:
q2 = np.full((4,4), 2.0)
q2

In [None]:
q3 = np.full((3,4), 3.0)
q3

## `vstack`
Ahora los apilamos de forma vertical con `vstack`:

In [None]:
q4 = np.vstack((q1, q2, q3))
q4

In [None]:
q4.shape

Esto fue posible porque q1, q2 y q3 tienen todos el mismo número de columnas (las filas no son iguales, pero no pasa nada porque estamos apilando sobre ese eje).

## `hstack`
Ahora apilamos q1 y q3 horizontalmente usando `hstack`:

In [None]:
q5 = np.hstack((q1, q3))
q5

In [None]:
q5.shape

Esto es posible porque q1 y q3 tienen 3 filas. Como q2 tiene 4 filas, no puede apilarse horizontalmente con q1 y q3:

In [None]:
try:
    q5 = np.hstack((q1, q2, q3))
except ValueError as e:
    print(e)

## `concatenate`
La función `concatenate` apila matrices a lo largo de cualquier eje existente.

In [None]:
q7 = np.concatenate((q1, q2, q3), axis=0)  # equivalente a vstack
q7

In [None]:
q7.shape

Como podrás adivinar, `hstack` es equivalente a llamar a `concatenate` con `axis=1`.

## `stack`
La función `stack` apila arrays a lo largo de un nuevo eje. Todas las matrices deben tener la misma forma.

In [None]:
q8 = np.stack((q1, q3))
q8

In [None]:
q8.shape

# Splitting arrays
Split es lo contrario de stack. Por ejemplo, utilicemos la función `vsplit` para dividir una matriz verticalmente.

Primero vamos a crear una matriz de 6x4:

In [None]:
r = np.arange(24).reshape(6,4)
r

Ahora dividámoslo en tres partes iguales, verticalmente:

In [None]:
r1, r2, r3 = np.vsplit(r, 3)
r1

In [None]:
r2

In [None]:
r3

También existe una función `split` que divide un array a lo largo de cualquier eje. Llamar a `vsplit` es equivalente a llamar a `split` con `axis=0`. También existe la función `hsplit`, equivalente a llamar a `split` con `axis=1`:

In [None]:
r4, r5 = np.hsplit(r, 2)
r4

In [None]:
r5

## Multiplicación de matrices
Vamos a crear dos matrices y ejecutar una [multiplicación de matrices](https://es.wikipedia.org/wiki/Multiplicaci%C3%B3n_de_matrices) utilizando el método `dot()`.

In [None]:
n1 = np.arange(10).reshape(2, 5)
n1

In [None]:
n2 = np.arange(15).reshape(5,3)
n2

In [None]:
n1.dot(n2)

**Precaución**: como vimos antes, `n1*n2` no es una multiplicación de matrices, sino un producto elemento a elemento (también llamado [producto Hadamard](https://en.wikipedia.org/wiki/Hadamard_product_(matrices)).