| **Inicio** | **atrás 8** | **Siguiente 10** |
|----------- |-------------- |---------------|
| [🏠](../../README.md) | [⏪](./8_Procesamiento_de_Datos_Numpy.ipynb)| [⏩](./10_arreglos_en_numpy.ipynb)|

# **9. Arrays de Numpy: Búsqueda y Filtrado de Datos con Python**

## **Introducción a las búsquedas y filtros en Numpy**

En NumPy, las búsquedas y filtros te permiten extraer información específica de un array o realizar búsquedas condicionales en los datos. Aquí te proporcionaré una introducción detallada a las operaciones de búsqueda y filtrado en NumPy, junto con ejemplos.

**Búsqueda en un Array:**

NumPy proporciona varias funciones para buscar elementos en un array, como `np.where`, que te permite encontrar las posiciones donde se cumple una condición dada.

In [1]:
import numpy as np

arr = np.array([10, 20, 30, 40, 50])

# Encontrar las posiciones donde los elementos son mayores que 30
indices = np.where(arr > 30)
print("Posiciones donde arr > 30:", indices)  # Output: (array([3, 4]),)

Posiciones donde arr > 30: (array([3, 4]),)


En este ejemplo, `np.where` devuelve una tupla que contiene un array con las posiciones donde la condición se cumple.

**Filtrado de Datos:**

Puedes filtrar un array utilizando una condición y obtener solo los elementos que cumplen con esa condición.

In [2]:
# Filtrar elementos mayores que 30
filtered_arr = arr[arr > 30]
print("Elementos mayores que 30:", filtered_arr)  # Output: [40, 50]

Elementos mayores que 30: [40 50]


**Filtros en Arrays Multidimensionales:**

Las operaciones de búsqueda y filtrado también son aplicables a arrays multidimensionales.

In [3]:
matrix = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

# Encontrar las posiciones donde los elementos son mayores que 5
indices_matrix = np.where(matrix > 5)
print("Posiciones donde matrix > 5:", indices_matrix)  # Output: (array([1, 2, 2]), array([2, 0, 1]))

# Filtrar elementos mayores que 5
filtered_matrix = matrix[matrix > 5]
print("Elementos mayores que 5:", filtered_matrix)  # Output: [6, 7, 8, 9]

Posiciones donde matrix > 5: (array([1, 2, 2, 2]), array([2, 0, 1, 2]))
Elementos mayores que 5: [6 7 8 9]


**Máscara Booleana:**

Una técnica común en NumPy es usar una máscara booleana para filtrar elementos.

In [4]:
# Crear una máscara booleana
mask = matrix > 5

# Usar la máscara para filtrar
filtered_by_mask = matrix[mask]
print("Elementos filtrados por máscara:", filtered_by_mask)  # Output: [6, 7, 8, 9]

Elementos filtrados por máscara: [6 7 8 9]


La máscara booleana crea un array de valores booleanos que indica qué elementos cumplen la condición.

En resumen, NumPy proporciona poderosas herramientas para realizar búsquedas y filtros en arrays de manera eficiente. Estas operaciones son esenciales para manipular y analizar datos de manera efectiva en el análisis numérico y científico.

## **Búsquedas con Where**

La función `np.where` en NumPy es una herramienta útil para realizar búsquedas condicionales en arrays y encontrar las posiciones donde se cumple una determinada condición. Esta función puede utilizarse tanto en arrays unidimensionales como en arrays multidimensionales. A continuación, te proporcionaré una explicación detallada junto con ejemplos de cómo usar `np.where`.

**Búsqueda con `np.where` en un Array Unidimensional:**

Supongamos que tenemos un array de temperaturas y queremos encontrar las posiciones donde la temperatura es mayor que 25 grados Celsius.

In [5]:
import numpy as np

temperaturas = np.array([22, 24, 27, 20, 30, 28, 25, 23])

# Encontrar las posiciones donde las temperaturas son mayores que 25
posiciones = np.where(temperaturas > 25)
print("Posiciones donde temperaturas > 25:", posiciones)  # Output: (array([2, 4, 5]),)

Posiciones donde temperaturas > 25: (array([2, 4, 5]),)


En este ejemplo, `np.where` devuelve una tupla que contiene un array de índices donde se cumple la condición (temperaturas mayores que 25).

**Filtrado con `np.where` en un Array Unidimensional:**

Podemos usar los resultados de `np.where` para filtrar los valores que cumplan con la condición.

In [6]:
temperaturas_filtradas = temperaturas[np.where(temperaturas > 25)]
print("Temperaturas mayores que 25:", temperaturas_filtradas)  # Output: [27, 30, 28]

Temperaturas mayores que 25: [27 30 28]


**Búsqueda con `np.where` en un Array Multidimensional:**

Ahora, supongamos que tenemos una matriz de puntuaciones y queremos encontrar las posiciones donde las puntuaciones son mayores que 80.

In [7]:
puntuaciones = np.array([[85, 75, 90],
                         [70, 88, 92],
                         [82, 78, 95]])

# Encontrar las posiciones donde las puntuaciones son mayores que 80
filas, columnas = np.where(puntuaciones > 80)
print("Posiciones donde puntuaciones > 80:")
for fila, columna in zip(filas, columnas):
    print(f"Fila: {fila}, Columna: {columna}")

Posiciones donde puntuaciones > 80:
Fila: 0, Columna: 0
Fila: 0, Columna: 2
Fila: 1, Columna: 1
Fila: 1, Columna: 2
Fila: 2, Columna: 0
Fila: 2, Columna: 2


En este ejemplo, `np.where` devuelve dos arrays, uno con las posiciones de fila y otro con las posiciones de columna donde se cumple la condición (puntuaciones mayores que 80).

En resumen, `np.where` es una función poderosa en NumPy que te permite buscar y filtrar elementos en arrays basados en condiciones específicas. Puedes usarla para encontrar las posiciones donde se cumple una condición y luego realizar operaciones adicionales utilizando esas posiciones, como filtrar los valores que cumplen con la condición.

## **Filtrado de elementos**

El filtrado de elementos en NumPy se refiere a la acción de seleccionar y extraer elementos específicos de un array en función de ciertas condiciones. Esta operación es esencial para trabajar con datos y realizar análisis más específicos y precisos. En NumPy, el filtrado se realiza utilizando operadores de comparación y máscaras booleanas. Aquí tienes una explicación detallada junto con ejemplos para comprender mejor el concepto de filtrado de elementos.

**Filtrado de Elementos con Operadores de Comparación:**

Los operadores de comparación, como `<`, `>`, `<=`, `>=`, `==` y `!=`, se utilizan para comparar elementos en un array con un valor o con elementos en otro array del mismo tamaño. El resultado de estas comparaciones es una máscara booleana que tiene `True` en las posiciones donde se cumple la condición y `False` en las posiciones donde no se cumple.

In [8]:
import numpy as np

arr = np.array([10, 20, 30, 40, 50])

# Crear una máscara booleana para elementos mayores que 30
mask = arr > 30
print("Máscara booleana:", mask)  # Output: [False False False  True  True]

Máscara booleana: [False False False  True  True]


**Filtrado de Elementos Utilizando Máscaras Booleanas:**

Una vez que tienes una máscara booleana, puedes utilizarla para filtrar los elementos del array original que cumplan con la condición.

In [9]:
filtered_arr = arr[mask]
print("Elementos filtrados:", filtered_arr)  # Output: [40 50]

Elementos filtrados: [40 50]


**Filtrado de Elementos con Múltiples Condiciones:**

Puedes combinar máscaras booleanas utilizando operadores lógicos como `&` (AND) y `|` (OR) para realizar filtrados más complejos.

In [10]:
mask_multiple = (arr > 20) & (arr < 50)
filtered_arr_multiple = arr[mask_multiple]
print("Elementos filtrados por múltiples condiciones:", filtered_arr_multiple)  # Output: [30 40]

Elementos filtrados por múltiples condiciones: [30 40]


**Filtrado de Elementos en Arrays Multidimensionales:**

El filtrado de elementos también se puede aplicar en arrays multidimensionales utilizando máscaras booleanas en todas las dimensiones.

In [11]:
matrix = np.array([[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]])

mask_matrix = matrix > 4
filtered_matrix = matrix[mask_matrix]
print("Elementos filtrados en matriz:", filtered_matrix)  # Output: [5 6 7 8 9]

Elementos filtrados en matriz: [5 6 7 8 9]


En resumen, el filtrado de elementos en NumPy te permite seleccionar y extraer los datos que cumplen con ciertas condiciones, lo que es esencial para analizar y trabajar con conjuntos de datos específicos. Las máscaras booleanas son una herramienta fundamental en este proceso, permitiéndote crear una lógica de selección flexible para tus datos.

## **Ejemplo de filtrado con vectores Pesos, Alturas y Países**

Claro, aquí tienes un ejemplo de cómo realizar filtrado utilizando vectores de pesos, alturas y países. En este ejemplo, filtraremos personas que cumplan con ciertas condiciones de peso y altura y luego mostraremos información sobre esas personas y sus países correspondientes.

Supongamos que tienes tres arrays: `pesos` (pesos en kilogramos), `alturas` (alturas en metros) y `paises` (países de origen).

In [12]:
import numpy as np

# Vectores de datos
pesos = np.array([70, 65, 80, 55, 90, 75, 68, 58])
alturas = np.array([1.75, 1.60, 1.85, 1.70, 1.90, 1.72, 1.68, 1.62])
paises = np.array(['USA', 'Mexico', 'Canada', 'Mexico', 'USA', 'Canada', 'USA', 'Mexico'])

# Definir condiciones de filtrado
condicion_peso = (pesos > 70) & (pesos <= 80)
condicion_altura = alturas >= 1.70

# Aplicar condiciones de filtrado
personas_filtradas = (condicion_peso & condicion_altura)

# Filtrar datos
pesos_filtrados = pesos[personas_filtradas]
alturas_filtradas = alturas[personas_filtradas]
paises_filtrados = paises[personas_filtradas]

# Mostrar información sobre personas filtradas
for i in range(len(pesos_filtrados)):
    print(f"Persona {i+1}: Peso {pesos_filtrados[i]} kg, Altura {alturas_filtradas[i]} m, País {paises_filtrados[i]}")

Persona 1: Peso 80 kg, Altura 1.85 m, País Canada
Persona 2: Peso 75 kg, Altura 1.72 m, País Canada


En este ejemplo, estamos filtrando personas que tienen un peso entre 70 y 80 kg y una altura mayor o igual a 1.70 metros. Luego, estamos extrayendo información sobre las personas que cumplen con estas condiciones y mostrando su peso, altura y país de origen.

Recuerda que este es solo un ejemplo y puedes ajustar las condiciones de filtrado según tus necesidades. El filtrado de datos es una herramienta poderosa para extraer información relevante de grandes conjuntos de datos y realizar análisis más específicos.

## **Filtrando información con operadores booleanos "and" y "or”**

Por supuesto, estaré encantado de proporcionarte una explicación detallada junto con ejemplos sobre cómo filtrar información utilizando los operadores booleanos "and" y "or" en NumPy.

**Operador Booleano "and" en Filtrado:**

El operador booleano "and" se utiliza para combinar dos o más condiciones, y devuelve `True` si todas las condiciones son verdaderas. En el contexto de filtrado en NumPy, esto significa que un elemento solo será incluido si cumple con todas las condiciones especificadas.

Supongamos que tienes un array de edades y un array de alturas, y quieres filtrar las personas que tienen más de 25 años y miden más de 1.70 metros.

In [13]:
import numpy as np

edades = np.array([30, 22, 28, 40, 18, 32, 27])
alturas = np.array([1.75, 1.68, 1.85, 1.78, 1.72, 1.60, 1.90])

# Definir condiciones de filtrado
condicion_edad = edades > 25
condicion_altura = alturas > 1.70

# Aplicar condiciones de filtrado utilizando el operador "and"
personas_filtradas = condicion_edad & condicion_altura

# Filtrar datos
edades_filtradas = edades[personas_filtradas]
alturas_filtradas = alturas[personas_filtradas]

# Mostrar información sobre personas filtradas
for i in range(len(edades_filtradas)):
    print(f"Persona {i+1}: Edad {edades_filtradas[i]} años, Altura {alturas_filtradas[i]} m")

Persona 1: Edad 30 años, Altura 1.75 m
Persona 2: Edad 28 años, Altura 1.85 m
Persona 3: Edad 40 años, Altura 1.78 m
Persona 4: Edad 27 años, Altura 1.9 m


**Operador Booleano "or" en Filtrado:**

El operador booleano "or" se utiliza para combinar dos o más condiciones, y devuelve `True` si al menos una de las condiciones es verdadera. En el contexto de filtrado en NumPy, esto significa que un elemento será incluido si cumple con al menos una de las condiciones especificadas.

Supongamos que quieres filtrar las personas que tienen más de 30 años o miden más de 1.75 metros.

In [14]:
# Definir condiciones de filtrado utilizando el operador "or"
condicion_edad = edades > 30
condicion_altura = alturas > 1.75

# Aplicar condiciones de filtrado utilizando el operador "or"
personas_filtradas = condicion_edad | condicion_altura

# Filtrar datos
edades_filtradas = edades[personas_filtradas]
alturas_filtradas = alturas[personas_filtradas]

# Mostrar información sobre personas filtradas
for i in range(len(edades_filtradas)):
    print(f"Persona {i+1}: Edad {edades_filtradas[i]} años, Altura {alturas_filtradas[i]} m")

Persona 1: Edad 28 años, Altura 1.85 m
Persona 2: Edad 40 años, Altura 1.78 m
Persona 3: Edad 32 años, Altura 1.6 m
Persona 4: Edad 27 años, Altura 1.9 m


En resumen, los operadores booleanos "and" y "or" son herramientas poderosas para combinar condiciones y realizar filtrados específicos en arrays de NumPy. Puedes utilizarlos para seleccionar elementos que cumplan con ciertas condiciones en función de tus necesidades de análisis de datos.

| **Inicio** | **atrás 8** | **Siguiente 10** |
|----------- |-------------- |---------------|
| [🏠](../../README.md) | [⏪](./8_Procesamiento_de_Datos_Numpy.ipynb)| [⏩](./10_arreglos_en_numpy.ipynb)|