# Fundamentos de NumPy Arrays

La manipulación de datos en Python es casi sinónimo de manipulación de arrays en NumPy: incluso las herramientas como Pandas están construidas en torno a los arrays de NumPy.
Este notebook presenta varios ejemplos de manipulación de arrays NumPy para acceder a datos y subarrays, y para dividir, reformar y unir arrays.
Aunque los tipos de operaciones mostradas aquí pueden parecer un poco secas y pedantes, comprenden los bloques de construcción de muchos otros ejemplos utilizados.

Cubriremos aquí algunas categorías de manipulaciones básicas de arrays:

- *Atributos de los arrays*: Determinar el tamaño, la forma, el consumo de memoria y los tipos de datos de los arrays.
- *Indexación de arrays*: Obtener y establecer el valor de elementos individuales del array
- *Recorte de matrices*: Obtención y configuración de submatrices más pequeñas dentro de una matriz mayor.
- *Remodelación de matrices*: Cambiar la forma de una matriz
- *Unión y división de matrices*: Combinar varias matrices en una, y dividir una matriz en muchas

##  Atributos de NumPy Array

Primero vamos a discutir algunos atributos útiles de los arrays.
Empezaremos definiendo tres arrays aleatorios, uno unidimensional, otro bidimensional y otro tridimensional.
Utilizaremos el generador de números aleatorios de NumPy, al que *bloquearemos* con un valor establecido utilizando una semilla para asegurarnos de que se generan las mismas matrices aleatorias cada vez que se ejecuta este código:

In [None]:
import numpy as np
np.random.seed(0)  # semillas para la reproducibilidad

x1 = np.random.randint(10, size=6)  # Matriz unidimensional
x2 = np.random.randint(10, size=(3, 4))  # Matriz bidimensional
x3 = np.random.randint(10, size=(3, 4, 5))  # Matriz tridimensional

Cada matriz tiene atributos ``ndim`` (el número de dimensiones), ``shape`` (el tamaño de cada dimensión) y ``size`` (el tamaño total de la matriz):

In [None]:
print("x3 ndim: ", x3.ndim)
print("x3 shape:", x3.shape)
print("x3 size: ", x3.size)

Otro atributo útil es el ``dtype``:

In [None]:
print("dtype:", x3.dtype)

Otros atributos son ``itemsize``, que indica el tamaño (en bytes) de cada elemento de la matriz, y ``nbytes``, que indica el tamaño total (en bytes) de la matriz:

In [None]:
print("itemsize:", x3.itemsize, "bytes")
print("nbytes:", x3.nbytes, "bytes")

En general, esperamos que ``nbytes`` sea igual a ``itemsize`` multiplicado por ``size``.

## Indexación de Matrices: Acceso a elementos individuales

En una matriz unidimensional, el valor $i^{th}$ (contando desde cero) se puede acceder especificando el índice deseado entre corchetes, al igual que con las listas de Python:

In [None]:
x1

In [None]:
x1[0]

In [None]:
x1[4]

Para indexar desde el final del array, puedes utilizar índices negativos:

In [None]:
x1[-1]

In [None]:
x1[-2]

En una matriz multidimensional, se puede acceder a los elementos mediante una tupla de índices separados por comas:

In [None]:
x2

In [None]:
x2[0, 0]

In [None]:
x2[2, 0]

In [None]:
x2[2, -1]

Los valores también pueden modificarse utilizando cualquiera de las notaciones de índice anteriores:

In [None]:
x2[0, 0] = 12
x2

Tenga en cuenta que, a diferencia de las listas de Python, las matrices de NumPy tienen un tipo fijo.
Esto significa, por ejemplo, que si intentas insertar un valor de punto flotante en un array de enteros, el valor será truncado silenciosamente. No se deje sorprender por este comportamiento.

In [None]:
x1[0] = 3.14159  # ¡esto será truncado!
x1

## Array Slicing: Acceso a submatrices

Del mismo modo que podemos usar corchetes para acceder a elementos individuales de una matriz, también podemos usarlos para acceder a submatrices con la notación *slice*, marcada por el carácter dos puntos (``:``).
La sintaxis de troceado de NumPy sigue la de la lista estándar de Python; para acceder a un trozo de una matriz ``x``, usa esto:
``` python
x[start:stop:step]
```
Si alguno de ellos no se especifica, se adoptan por defecto los valores ``start=0``, ``stop=``*``size of dimension``*, ``step=1``.
Veremos cómo acceder a las submatrices en una dimensión y en varias dimensiones.

### Submatrices unidimensionales

In [None]:
x = np.arange(10)
x

In [None]:
x[:5]  # primeros cinco elementos

In [None]:
x[5:]  # elementos después del índice 5

In [None]:
x[4:7]  # submatriz central

In [None]:
x[::2]  # cada dos elementos

In [None]:
x[1::2]  # cada dos elementos, empezando por el índice 1

Un caso potencialmente confuso es cuando el valor de ``step`` es negativo.
En este caso, los valores por defecto de ``start`` y ``stop`` se intercambian.
Esto se convierte en una forma conveniente de invertir una matriz:

In [None]:
x[::-1]  # todos los elementos, al revés

In [None]:
x[5::-2]  # invertido cada dos a partir del índice 5

### Submatrices multidimensionales

Los subarreglos multidimensionales funcionan de la misma manera, con varios subarreglos separados por comas.
Por ejemplo:

In [None]:
x2

In [None]:
x2[:2, :3]  # dos filas, tres columnas

In [None]:
x2[:3, ::2]  # todas las filas, cada dos columnas

Por último, las dimensiones de las submatrices pueden incluso invertirse juntas:

In [None]:
x2[::-1, ::-1]

#### Acceso a filas y columnas de una matriz

Una de las rutinas más habituales es el acceso a filas o columnas de una matriz.
Esto puede hacerse combinando la indexación y el corte, utilizando un corte vacío marcado por dos puntos (``:``):

In [None]:
print(x2[:, 0])  # primera columna de x2

In [None]:
print(x2[0, :])  # primera fila de x2

En el caso del acceso por filas, puede omitirse el segmento vacío para obtener una sintaxis más compacta:

In [None]:
print(x2[0])  # equivalente a x2[0, :]

### Subarrays como vistas no-copy

Una cosa importante -y extremadamente útil- que hay que saber sobre los cortes de matrices es que devuelven *vistas* en lugar de *copias* de los datos de la matriz.
Esta es un área en la que el corte de arrays en NumPy difiere del corte de listas en Python: en las listas, los cortes son copias.
Consideremos nuestro array bidimensional de antes:

In [None]:
print(x2)

Extraigamos un $2 \times 2$ de esta submatriz:

In [None]:
x2_sub = x2[:2, :2]
print(x2_sub)

Ahora bien, si modificamos esta submatriz, ¡veremos que la matriz original ha cambiado! Observa:

In [None]:
x2_sub[0, 0] = 99
print(x2_sub)

In [None]:
print(x2)

Este comportamiento por defecto es en realidad bastante útil: significa que cuando trabajamos con grandes conjuntos de datos, podemos acceder y procesar trozos de estos conjuntos de datos sin necesidad de copiar el búfer de datos subyacente.

### Creación de copias de matrices

A pesar de las buenas características de las vistas de array, a veces es útil copiar explícitamente los datos dentro de un array o un subarray. Esto se puede hacer fácilmente con el método ``copy()``:

In [None]:
x2_sub_copy = x2[:2, :2].copy()
print(x2_sub_copy)

Si ahora modificamos esta submatriz, la matriz original no se ve afectada:

In [None]:
x2_sub_copy[0, 0] = 42
print(x2_sub_copy)

In [None]:
print(x2)

## Remodelación de matrices

Otro tipo de operación útil es la remodelación de matrices.
La forma más flexible de hacerlo es con el método ``reshape``.
Por ejemplo, si quieres poner los números del 1 al 9 en una rejilla de 3 veces 3$, puedes hacer lo siguiente:

In [None]:
grid = np.arange(1, 10).reshape((3, 3))
print(grid)

Ten en cuenta que para que esto funcione, el tamaño del array inicial debe coincidir con el tamaño del array remodelado.
Siempre que sea posible, el método ``reshape`` utilizará una vista sin copia del array inicial, pero con buffers de memoria no contiguos no siempre es así.

Otro patrón común de remodelación es la conversión de un array unidimensional en una matriz bidimensional de filas o columnas.
Esto se puede hacer con el método ``reshape``, o más fácilmente haciendo uso de la palabra clave ``newaxis`` dentro de una operación slice:

In [None]:
x = np.array([1, 2, 3])

# vector fila mediante reshape
x.reshape((1, 3))

In [None]:
# vector fila a través de newaxis
x[np.newaxis, :]

In [None]:
# vector columna mediante reshape
x.reshape((3, 1))

In [None]:
# vector columna a través de newaxis
x[:, np.newaxis]

## Concatenación y división de matrices

Todas las rutinas anteriores trabajan con matrices simples. También es posible combinar múltiples arrays en uno, y a la inversa dividir un único array en múltiples arrays. Echaremos un vistazo a estas operaciones aquí.

### Concatenación de matrices

La concatenación, o unión de dos arrays en NumPy, se realiza principalmente utilizando las rutinas ``np.concatenate``, ``np.vstack``, y ``np.hstack``.
``np.concatenate`` toma una tupla o lista de arrays como primer argumento, como podemos ver aquí:

In [None]:
x = np.array([1, 2, 3])
y = np.array([3, 2, 1])
np.concatenate([x, y])

También puedes concatenar más de dos matrices a la vez:

In [None]:
z = [99, 99, 99]
print(np.concatenate([x, y, z]))

También puede utilizarse para matrices bidimensionales:

In [None]:
grid = np.array([[1, 2, 3],
                 [4, 5, 6]])

In [None]:
# concatenar a lo largo del primer eje
np.concatenate([grid, grid])

In [None]:
# concatenar a lo largo del segundo eje (índice cero)
np.concatenate([grid, grid], axis=1)

Para trabajar con matrices de dimensiones mixtas, puede resultar más claro utilizar las funciones ``np.vstack`` (pila vertical) y ``np.hstack`` (pila horizontal):

In [None]:
x = np.array([1, 2, 3])
grid = np.array([[9, 8, 7],
                 [6, 5, 4]])

# apilar verticalmente las matrices
np.vstack([x, grid])

In [None]:
# apilar horizontalmente las matrices
y = np.array([[99],
              [99]])
np.hstack([grid, y])

Del mismo modo, ``np.dstack`` apilará matrices a lo largo del tercer eje.

### División de matrices

Lo contrario de la concatenación es la división, que se realiza mediante las funciones ``np.split``, ``np.hsplit`` y ``np.vsplit``.  Para cada una de ellas, podemos pasar una lista de índices con los puntos de división:

In [None]:
x = [1, 2, 3, 99, 99, 3, 2, 1]
x1, x2, x3 = np.split(x, [3, 5])
print(x1, x2, x3)

Tenga en cuenta que *N* puntos de división, conduce a *N + 1* subarrays.
Las funciones relacionadas ``np.hsplit`` y ``np.vsplit`` son similares:

In [None]:
grid = np.arange(16).reshape((4, 4))
grid

In [None]:
upper, lower = np.vsplit(grid, [2])
print(upper)
print(lower)

In [None]:
left, right = np.hsplit(grid, [2])
print(left)
print(right)

Del mismo modo, ``np.dsplit`` dividirá las matrices a lo largo del tercer eje.

## Matematicas

<!--NAVIGATION-->
< [Data Types en Python](1-Data_types_en_python.ipynb) | [Computación en Matrices NumPy:](3-Computation_en_arrays.ipynb) >