# Selección de  datos

Seleccionar datos significa extraer una parte específica de un arreglo NumPy para realizar operaciones adicionales, como cálculos estadísticos, visualización de datos, modelado de datos y más.

Al seleccionar solo los datos necesarios, se evita tener que trabajar con todo el conjunto de datos, lo que puede reducir el tiempo de procesamiento.

In [None]:
import numpy as np

### Indexing


Los elementos de un arreglo NumPy se pueden acceder mediante índices, que son números enteros que representan la posición del elemento en el arreglo.

Al igual que en otros lenguajes de programación, los índices de los arreglos comienzan en cero (0). 

In [None]:
a = np.array([1, 2, 3, 4, 5])
print(a[2]) 

Dependiendo de las dimensiones del arreglo, será necesario especificar más índices para acceder a un único valor

In [None]:
b = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(b[1, 2]) 

En caso de especificar menos el resultado sera un arreglo

In [None]:
b = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(b[0])

### Slicing


Las rebanadas o slices permiten acceder a subconjuntos de elementos de un arreglo NumPy. 



Las rebanadas se especifican mediante una notación de índices `[start:stop:step]`, donde `start` es el índice de inicio, `stop` es el índice final (***no se incluye en la selección***), y `step` es el número de elementos que se salta entre índices.



El resultado siempre sera otro arreglo de NumPy.

In [None]:
a = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

#El ultimi indice no se incluye
subarreglo = a[2:6]
print(subarreglo)

In [None]:
a = np.array([[ 0,  1,  2,  3],
              [ 4,  5,  6,  7],
              [ 8,  9, 10, 11],
              [12, 13, 14, 15]])

submatriz = a[1:3, 1:3]
print(submatriz)

Si no se especifica alguno de los dos índices en el slicing, se considera que se desea extraer todos los elementos hasta el final de la dimensión correspondiente.

In [None]:
a = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

subarreglo = a[:5]
print(subarreglo)

In [None]:
a = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

subarreglo = a[5:]
print(subarreglo)

### Sorting


Entre las funcionalidades que ofrece NumPy se encuentra la posibilidad de ordenar los elementos de un array de forma ascendente o descendente.

Para ordenar los elementos de un array de NumPy, se puede utilizar la función `sort()`. Esta función acepta como parámetros el array que se quiere ordenar y el eje a lo largo del cual se realizará la ordenación.

In [None]:
arr = np.array([3, 1, 4, 1, 5, 9, 2, 6, 5, 3])
print(arr)

arr = np.sort(arr)
print(arr)

In [None]:
arr = np.array([[3, 2, 1],
                [6, 5, 4]])

print(np.sort(arr, axis=1))


### Filtering


Se pueden filtrar los elementos de un array utilizando una expresión booleana para seleccionar solo los elementos que cumplen una determinada condición.

In [None]:
array = np.array([1, 2, 3, 4, 5, 6, 7])

En este caso, la expresión arr > 3 devuelve un array booleano con True para los elementos que cumplen la condición y False para los elementos que no. 

Luego, se utiliza este array booleano para seleccionar solo los elementos correspondientes del array original utilizando la sintaxis de indexación booleana.

In [None]:
print(array > 3)

print(array[array > 3])

También es posible combinar varias condiciones utilizando los operadores & (and) y | (or).

In [None]:
print( array[(array > 2) & (array < 5)] )

# Manipulación de arreglos

### Agregar elementos


Para agregar elementos a un arreglo NumPy, se puede utilizar la función `np.append() `.

Esta función permite agregar elementos al final de un arreglo existente y devuelve un nuevo arreglo con los elementos agregados.

In [None]:
arr = np.array([1, 2, 3])

arr = np.append(arr, 4)
print(arr)

También se pueden agregar varios elementos a la vez, pasándolos como una lista

In [None]:
arr = np.append(arr, [5, 6, 7])
print(arr)

## Eliminar elementos

En NumPy, se pueden eliminar elementos de un arreglo utilizando la función `np.delete(). `
Esta función toma tres argumentos: el arreglo del cual se eliminarán los elementos, el índice o los índices de los elementos a eliminar, y el eje a lo largo del cual se realizará la eliminación (opcional).



Es importante tener en cuenta que la función devuelve un nuevo arreglo sin los elementos eliminados, por lo que es necesario asignar el resultado a una variable si se desea mantener el arreglo original sin cambios.

In [None]:
arr = np.array([1, 2, 3, 4, 5])

arr = np.delete(arr, 2)
print(arr)

También se pueden eliminar múltiples elementos pasando una lista de índices a la función

In [None]:
arr = np.delete(arr, [1, 3])
print(arr)

También se puede especificar el eje a lo largo del cual se realizará la eliminación, en caso de tener un arreglo multidimensional

## Modificar dimensiones de un arreglo

En NumPy, es posible modificar la forma o dimensiones de un arreglo utilizando el método `reshape().` 




Este método devuelve un nuevo arreglo con la misma cantidad de elementos que el arreglo original, pero con una forma diferente.




El método `reshape()` toma como argumento una tupla que especifica la nueva forma deseada del arreglo. 



***Es importante que la cantidad total de elementos en el nuevo arreglo sea la misma que la del arreglo original.***

In [None]:
a = np.array([1, 2, 3, 4, 5, 6])

# Cambiamos la forma del arreglo a una matriz 2x3
b = a.reshape((2, 3))

print(b)

También es posible utilizar el valor `-1` como uno de los elementos de la tupla de la nueva forma. 

Cuando se usa `-1`, NumPy calcula automáticamente el valor faltante en función de la cantidad de elementos en el arreglo original.

In [None]:
a = np.array([1, 2, 3, 4, 5, 6])

# Cambiamos la forma del arreglo a una matriz 3x2
b = a.reshape((3, -1))

print(b)

## Guardar y leer Archivos

La función `numpy.save()` guarda un solo arreglo NumPy en un archivo binario de extensión .npy

In [None]:
a = np.array([1, 2, 3, 4, 5, 6])

np.save('mi_arreglo.npy', a)

Para leer un archivo NumPy con extensión .npy, se puede utilizar la función `numpy.load()`. 
  
Esta función devuelve un arreglo NumPy que contiene los datos del archivo.

In [None]:
data = np.load('mi_arreglo.npy')

# Utilizamos el arreglo cargado
print(data)