# Arrays 

La manipulación de datos en Python es casi sinónimo de la manipulación de matrices NumPy: incluso las herramientas más nuevas como Pandas se construyen alrededor de la matriz NumPy. 


Numpy es un paquete que provee a Python con arreglos multidimensionales de alta eficiencia y diseñados para cálculo científico.


Un array es parecido a una lista en Python y de hecho se pueden crear a partir de ellas

Cubriremos algunas categorías de manipulaciones básicas de matrices aquí:

    -Atributos de las matrices: determinación del tamaño, la forma, el consumo de memoria y los tipos de datos de las matrices
    -Indexación de matrices: obtención y configuración del valor de elementos de matriz individuales
    -División de matrices: obtención y configuración de submatrices más pequeñas dentro de una matriz más grande
    -Remodelación de matrices: Cambiar la forma de una matriz dada
    -Unir y dividir matrices: combinar varias matrices en una y dividir una matriz en muchas

*Atributos:* Primero, analicemos algunos atributos útiles de la matriz. Comenzaremos definiendo tres matrices aleatorias, una matriz unidimensional, bidimensional y tridimensional. Usaremos el generador de números aleatorios de NumPy, que sembraremos con un valor establecido para asegurarnos de que se generen las mismas matrices aleatorias cada vez que se ejecute este código:

In [None]:
import numpy as np
np.random.seed(0)  

x1 = np.random.randint(10, size=6)  #  array de una dimensión
x2 = np.random.randint(10, size=(3, 4))  #  array de dos dimensiones
x3 = np.random.randint(10, size=(3, 4, 5))  #  array de tres dimensiones

Todos los arrays tienen atributos ndim (numero de dimensiones), shape (el tamaño de cada dimensión), y size (el tamaño total de todo el array):

In [None]:
print("x3 ndim: ", x3.ndim)
print("x3 shape:", x3.shape)
print("x3 size: ", x3.size)

Otros attributos aplicables en arrays son itemsize, que muestra el tamaño (en bytes) de cada elemento en el array, y nbytes, que muestra el tamaño total (en bytes) del array:

In [None]:
print("itemsize:", x3.itemsize, "bytes")
print("nbytes:", x3.nbytes, "bytes")

*Indexación de matrices:* acceso a elementos individuales
Si está familiarizado con la indexación de listas estándar de Python, la indexación en NumPy le resultará bastante familiar. En una matriz unidimensional, se puede acceder al i-ésimo valor (contando desde cero) especificando el índice deseado entre corchetes, al igual que con las listas de Python:

In [None]:
x1

In [None]:
x1[0]

In [None]:
x1[4]

In [None]:
x1[-6]

Se usa la misma logica de indexación con arreglos multidimencionales

In [None]:
x2

In [None]:
x2[0,3]

In [None]:
x2[2,-1]

Se pueden cambiar valores usando indexacion 

In [None]:
x2[2,-1] = 2

*División de Array:* Accediendo a Subarrays
Así como podemos usar corchetes para acceder a elementos individuales de la matriz, también podemos usarlos para acceder a submatrices con la notación de sector, marcada por el carácter de dos puntos (:). La sintaxis de segmentación de NumPy sigue la de la lista estándar de Python; para acceder a una porción de una matriz x, use esto:

                                                x[start:stop:step]
Valores default en caso de no ser especificados: start=0, stop=tamaño de la dimensión, step=1. 

In [None]:
x = np.arange(10)
x

In [None]:
x[:5]  # primeros 5 elementos

In [None]:
x[5:]  # elementos a partir del quinto

In [None]:
x[4:7]  # elementos entre index 4 y 7

In [None]:
x[::2]  # elementos intercalados

In [None]:
x[1::2]  # elementos intercalados empezando del 1

Un caso potencialmente confuso es cuando el valor del paso es negativo. En este caso, se intercambian los valores predeterminados de inicio y parada. Esta se convierte en una forma conveniente de invertir una matriz:

In [None]:
x[::-1]  # todos los elementos al inverso 

In [None]:
x[5::-2]  # elementos invertidos e intercalados empezando desde el 5to elemento

Subarreglos multidimensionales
Los sectores multidimensionales funcionan de la misma manera, con varios sectores separados por comas. Por ejemplo:

In [None]:
x2[:2, :3]  # 2 filas, tres columnas

In [None]:
x2[:3, ::2]  # todas las filas , columnas intercaladas

*Remodelación de matrices:* Otro tipo útil de operación es la remodelación de matrices. La forma más flexible de hacer esto es con el método de reshape(). Por ejemplo, si desea colocar los números del 1 al 9 en una cuadrícula de 3 × 3, puede hacer lo siguiente:

In [None]:
grid = np.arange(1, 10).reshape((3, 3))
print(grid)

Tenga en cuenta que para que esto funcione, el tamaño de la matriz inicial debe coincidir con el tamaño de la matriz reformada. Siempre que sea posible, el método de remodelación utilizará una vista sin copia de la matriz inicial, pero con búferes de memoria no contiguos este no es siempre el caso.

Otro patrón de remodelación común es la conversión de una matriz unidimensional en una matriz bidimensional de filas o columnas. Esto se puede hacer con el método reshape o más fácilmente haciendo uso de la palabra clave newaxis dentro de una operación de corte:

In [None]:
x = np.array([1, 2, 3])

# row vector via reshape
x.reshape((1, 3))

In [None]:
# row vector via newaxis
x[np.newaxis, :]

In [None]:
# column vector via reshape
x.reshape((3, 1))

In [None]:
# column vector via newaxis
x[:, np.newaxis]

*Concatenación y división de matrices:*
Todas las rutinas anteriores funcionaron en matrices únicas. También es posible combinar varias matrices en una y, a la inversa, dividir una sola matriz en varias matrices. Echaremos un vistazo a esas operaciones aquí.

    Concatenación de matrices
La concatenación, o unión de dos matrices en NumPy, se logra principalmente mediante las rutinas np.concatenate, np.vstack y np.hstack. np.concatenate toma una tupla o lista de matrices como su primer argumento, como podemos ver aquí:

In [None]:
x = np.array([1, 2, 3])
y = np.array([3, 2, 1])
np.concatenate([x, y])

In [None]:
#Se puede concatenar más de 1 al mismo tiempo
z = [99, 99, 99]
print(np.concatenate([x, y, z]))

In [None]:
#Utiliza la misma logica en arrays multidimensionales
grid = np.array([[1, 2, 3],
                 [4, 5, 6]])
# concatenate en el primer eje
np.concatenate([grid, grid])

In [None]:
# concatenate en el segundo eje (zero-indexed)
np.concatenate([grid, grid], axis=1)

Para trabajar con matrices de dimensiones mixtas, puede resultar más claro utilizar las funciones np.vstack (pila vertical) y np.hstack (pila horizontal):

In [None]:
x = np.array([1, 2, 3])
grid = np.array([[9, 8, 7],
                 [6, 5, 4]])

# apilar verticalmente
np.vstack([x, grid])

In [None]:
# apilar horizontalmente
y = np.array([[99],
              [99]])
np.hstack([grid, y])

De manera similar, np.dstack apilará matrices a lo largo del tercer eje

        División de matrices:
Lo opuesto a la concatenación es la división, que se implementa mediante las funciones np.split, np.hsplit y np.vsplit. Para cada uno de estos, podemos pasar una lista de índices que dan los puntos de división:

In [None]:
x = [1, 2, 3, 99, 99, 3, 2, 1]
x1, x2, x3 = np.split(x, [3, 5])
print(x1, x2, x3)

Observe que N puntos de división conduce a N + 1 subarreglos. Las funciones relacionadas np.hsplit y np.vsplit son similares:

In [None]:
grid = np.arange(16).reshape((4, 4))
grid

In [None]:
upper, lower = np.vsplit(grid, [2])
print(upper)
print(lower)

In [None]:
left, right = np.hsplit(grid, [2])
print(left)
print(right)