# La base de NumPy - ndarray

Toda la libería de NumPy se articula alrededor de una única estructura de datos: la matriz multidimensional o ndarray (N-dimensional array).<br/>

### Características básicas de ndarray

<ul>
<li>Un ndarray puede contener elementos de <b>CUALQUIER TIPO</b></li>
<li>Todos los elementos de un ndarray deben tener <b>EL MISMO TIPO</b>.</li>
<li>El tamaño de un ndarray (número de elementos) se define en el momento de la creación y no puede modificarse.</li>
<li>Pero la organización de esos elementos entre diferentes dimensiones sí puede modificarse</li>
</ul>

### Uso básico de cualquier elemento de NumPy

Hay que recordar que NumPy no es un módulo del core de Python por lo que SIEMPRE habrá que importarlo de forma completa o componente a componente.

In [2]:
import numpy as np

### Creación básica de ndarrays

Existen varias formas de crear un ndarray en NumPy. Vamos a ver las más relevantes.

#### Creación de un ndarray vacío

In [3]:
# Especificando dimensiones
array_vacio = np.empty((2, 2))
array_vacio

array([[1.86918699e-306, 8.01089062e-307],
       [2.11392033e-307, 1.33508845e-306]])

In [None]:
# Copiando dimensiones y tipo desde otra estructura
array_vacio_copia = np.empty_like([1, 2, 3, 4, 5])
array_vacio_copia

#### Creación de un ndarray de unos

In [None]:
# Especificando dimensiones
array_unos = np.ones((2, 2))
array_unos

In [None]:
# Copiando dimensiones y tipo desde otra estructura
array_unos_copia = np.ones_like([1, 2, 3, 4, 5])
array_unos_copia

#### Creación de un ndarray de ceros

In [None]:
# Especificando dimensiones
array_ceros = np.zeros((2, 2))
array_ceros

In [None]:
# Copiando dimensiones y tipo desde otra estructura
array_ceros_copia = np.zeros_like([1, 2, 3, 4, 5])
array_ceros_copia

#### Creación de un ndarray con la matriz identidad

In [None]:
array_identidad = np.identity(3)
array_identidad

#### Creación de un ndarray con unos en una de las diagonales

In [None]:
# Cuadrada con unos en la diagonal principal
array_identidad = np.eye(4)
array_identidad

In [None]:
# Cuadrada con unos en la diagonal especificada
array_con_segunda_diagonal = np.eye(4, k = 1)
array_con_segunda_diagonal

In [None]:
# No cuadrada con unos en la diagonal especificada
array_no_cuadrado = np.eye(4, 3, k = -1)
array_no_cuadrado

#### Creación de un ndarray cuyos elementos son una secuencia numérica

In [None]:
# Un parámetro: desde 0 (incluido) hasta el valor indicado (no incluido)
array_secuencia_1 = np.arange(10)
array_secuencia_1

In [None]:
# Dos parámetros: desde el primer valor (incluido) hasta el segundo valor (no incluido)
array_secuencia_2 = np.arange(5, 10)
array_secuencia_2

In [None]:
# Tres parámetros: desde el primer valor (incluido) hasta el segundo (no incluido) con saltos del tercer valor
array_secuencia_3 = np.arange(5, 20, 2)
array_secuencia_3

#### Creación de un ndarray a partir de una secuencia básica de Python

In [None]:
# Unidimensional
array_basico = np.array([1, 2, 3, 4, 5])
array_basico

In [None]:
# Multidimensional
array_basico_multidimensional = np.array([[1, 2, 3, 4], [5, 6, 7, 8]])
array_basico_multidimensional

### Tipos de dato en ndarrays de NumPy

<ul>
<li><b>Enteros con signo:</b> np.int8, np.int16, np.int32 y np.int64</li>
<li><b>Enteros sin signo:</b> np.uint8, np.uint16, np.uint32 y np.uint64</li>
<li><b>Números en coma flotante:</b> np.float16, np.float32, np.float64, np.float128</li>
<li><b>Booleanos:</b> np.bool</li>
<li><b>Objetos:</b> np.object</li>
<li><b>Cadenas de caracteres:</b> np.string\_, np.unicode\_</li>
<li>...</li>
</ul>

### Especificación/Casting/Conversión de tipos entre ndarrays

In [None]:
array_inicial_enteros = np.array([1, 2, 3, 4, 5], dtype=np.int32)
array_inicial_enteros

In [None]:
array_float = np.asarray(array_inicial_enteros, dtype=np.float64)
array_float

In [None]:
array_strings = np.asarray(array_float, dtype=np.unicode_)
array_strings

### Consulta de la composición de un ndarray

<ul>
<li><b>dtype</b>: Tipo del contenido del ndarray.</li>
<li><b>ndim</b>: Número de dimensiones/ejes del ndarray.</li>
<li><b>shape</b>: Estructura/forma del ndarray, es decir, número de elementos en cada uno de los ejes/dimensiones.</li>
<li><b>size</b>: Número total de elementos en el ndarray.</li>
</ul>

In [None]:
array = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])

In [None]:
# Tipo de dato (único)
array.dtype

In [None]:
# Número de dimensiones
array.ndim

In [None]:
# Forma/Dimensiones
array.shape

In [None]:
# Número total de elementos
array.size

### Operaciones aritméticas entre ndarrays y escalares

In [None]:
array = np.array([1, 2, 3, 4, 5, 6], dtype=np.float64)

In [None]:
# Suma
array + 5

In [None]:
# Resta
array - 2

In [None]:
# Multiplicación
array * 3

In [None]:
# División
1 / array

In [None]:
# División entera
array // 2

In [None]:
# Potencia
array ** 2

In [None]:
# Asignación con operador
array += 1
array

### Operaciones aritméticas entre ndarrays

<b>IMPORTANTE:</b> Los dos términos de la operación tienen que ser ndarrays de las mismas dimensiones y forma. Se aplica la operación elemento a elemento.

In [None]:
array = np.array([1, 2, 3, 4, 5, 6], dtype=np.float64)

In [None]:
# Suma (elemento a elmento)
array + array

In [None]:
# Resta (elemento a elmento)
array - array

In [None]:
# Multiplicación (elemento a elmento)
array * array

In [None]:
# División (elemento a elmento)
array / array

In [None]:
# Asignación con operador
array += array
array

In [None]:
# Suma de ndarrays de distinto tamaño
array1 = np.array([1, 2, 3, 4, 5])
array + array1

### Indexación y slicing básico

En ndarrays unidimensionales el funcionamiento es idéntico al que se tiene en secuencias básicas de Python. Es decir, se utiliza la indexación [a:b:c].

In [None]:
array = np.arange(1, 11)

In [None]:
# Indexación con primer parámetro
array[2]

In [None]:
# Indexación con primer y segundo parámetro
array[2:5]

In [None]:
# Indexación con tercer parámetro
array[::2]

In [None]:
# Indexación con negativos
array[::-1]

En ndarrays multidimensionales, existen dos posibles formas de realizar el acceso:<br/>
<ul>
<li><b>Mediante indexación recursiva:</b> array[a:b:c en dim_1][a:b:c en dim_2]...[a:b:c en dim_n]</li>
<li><b>Mediante indexación con comas:</b> array[a:b:c en dim_1, a:b:c en dim_2, ...a:b:c en dim_n]</li>
</ul>

In [None]:
array = np.array([[[1, 2, 3, 4], [5, 6, 7, 8]], [[9, 10, 11, 12], [13, 14, 15, 16]]])
array

In [None]:
# Forma de la matriz
array.shape

In [None]:
# Indexación recursiva primer nivel
array[1]

In [None]:
# Indexación recursiva segundo nivel
array[1][0]

In [None]:
# Indexación recursiva tercer nivel
array[1][0][3]

In [None]:
# Indexación con comas segundo nivel
array[1, 0]

In [None]:
# Indexación con comas tercer nivel
array[1, 0, 3]

In [None]:
# Indexación recursiva tercer nivel con slice
array[0][0][:2]

In [None]:
# Indexación recursiva tercer nivel con slice de índice negativo
array[1][0][::-1]

Del mismo modo a como ocurre en Python básico, se puede utilizar la indexación/slicing para modificar secciones del contenido de un ndarray.

In [None]:
array = np.array([[1, 2, 3, 4],[5, 6, 7, 8]])

In [None]:
# Modificación de una posición
array[0][1] = 50
array

In [None]:
# Modificación de un slice
array[0][::2] = 30
array

### Indexación y slicing booleano

In [None]:
personas = np.array(['Miguel', 'Pedro', 'Juan', 'Miguel'])
personas

In [None]:
datos = np.random.randn(4, 4)
datos

In [None]:
# Indexación/slicing booleano sobre valores
datos[datos < 0]

In [None]:
# Indexación/slicing booleano (múltiple) sobre valores (AND)
datos[(datos < 0) & (datos > -0.5)]

In [None]:
# Indexación/slicing booleano (múltiple) sobre valores (OR)
datos[(datos < 0) | (datos > -0.5)]

In [None]:
# Máscara booleana
personas == 'Miguel'

In [None]:
# Indexación/slicing mediante máscara
datos[personas == 'Miguel']

In [None]:
# Indexación/slicing mediante máscara y básico combinado
datos[personas == 'Miguel', ::2]

In [None]:
# Indexación/slicing mediante máscara negativo por operador
datos[personas != 'Miguel']

In [None]:
# Indexación/slicing mediante máscara negativa por signo
datos[~(personas == 'Miguel')]

De nuevo, podemos utilizar indexación/slicing booleano para realizar modificaciones sobre el contenido de un ndarray.

In [None]:
array = np.random.randn(7, 4)
array

In [None]:
# Eliminación de valores negativos mediante slicing
array[array < 0] = 0
array

### Indexación y slicing basado en secuencias de enteros - Fancy indexing

In [None]:
array = np.empty((8, 4))
for i in range(8):
    array[i] = i
array    

In [None]:
# Indexación/slicing de un conjunto (arbitrario) de elementos
array[[2, 5]]

In [None]:
# Indexación/slicing de un conjunto (arbitrario) de elementos (índices negativos)
array[[-2, -5]]

También podemos indexar de manera arbitraria en múltiples dimensiones, utilizando para ello, una secuencia de enteros por cada dimensión. El resultado será la combinación de secuencias.

In [None]:
array = np.arange(32).reshape((8, 4))
array

In [None]:
# Indexación/slicing con una secuencia de varios niveles (elemento a elemento)
array[[1, 5, 7, 2], [0, 3, 1, 2]]

In [None]:
# Indexación/slicing con una secuencia de varios niveles (región resultante)
array[[1, 5, 7, 2]][:, [0, 3, 1, 2]]

### Trasposición y modificación de ejes/dimensiones

In [None]:
array = np.arange(15)
array

In [None]:
# Modificación de ejes/dimensiones
array = array.reshape(3, 5)
array

In [None]:
# Trasposición de ejes/dimensiones"
array.T

### Concatenación de ndarrays

NumPy ofrece la posibilidad de combinar ndarrays de dos formas posibles:<br/>
<ul>
<li><b>concatenate:</b> Concatenación de arrays especificando la dirección.</li>
</ul>

Las siguientes funciones se pueden seguir usando para concatenar sin tener que especificar dirección pero su uso está desaconsejado ya que han sido marcadas como DEPRECATED (se eliminarán en sucesivas versiones de numpy):<br/>
<ul>
<li><b>hstack, column_stack:</b> Los elementos del segundo array se añaden a los del primero a lo ancho.</li>
<li><b>vstack, row_stack:</b> Los elementos del segundo array se añaden a los del primero a lo largo.</li>
</ul>

In [None]:
array1 = np.arange(15).reshape(3, 5)
array1

In [None]:
array2 = np.arange(15, 30).reshape(3, 5)
array2

In [None]:
# Concatenación horizontal
np.concatenate([array1, array2], axis = 1)

In [None]:
# Concatenación vertical
np.concatenate([array1, array2], axis = 0)

In [None]:
# Concatenación horizontal
np.hstack((array1, array2))

In [None]:
# Concatenación vertical
np.vstack((array1, array2))

### División de ndarrays

Al igual que para la concatenación, NumPy permite dividir los ndarray de tres formas distintas:<br/>
<ul>
<li><b>hsplit:</b> División de arrays en n partes "iguales" por columnas.</li>
<li><b>vsplit:</b> División de arrays en n partes "iguales" por filas.</li>
<li><b>split:</b> División de arrays en n partes no simétricas.</li>
</ul>

In [None]:
array = np.arange(16).reshape(4, 4)
array

In [None]:
# División simétrica por columnas
np.hsplit(array, 2)

In [None]:
# División simétrica por filas
np.vsplit(array, 2)

In [None]:
# División no simétrica
np.split(array, [2, 3], axis=1)