# Filter
- Esta función permite extraer valores de iterables. Para extraer estos valores se debe definir una condición que los ítems deben cumplir y generar a su vez una nueva lista de iterables.
- La sintaxis es: filter(function, iterable).
- El primer argumento es objeto función "function" y debe ser llamada sin paréntesis.
- El segundo argumento es un iterable, que puede ser una lista, una tupla o un set.
- Filtering se aplica a cada ítem del iterable.
- Filter es una función built-in, lo que quiere decir que no debe importarse desde ninguna librería.
- Filter iba a ser eliminada de la versión 3 de Python, pero la comunidad pidió que se quedara.

In [1]:
# Ejemplo para ver números pares de una lista
# Se tiene una lista inicial de números a ser procesados
# Con cada ítem, se valida que su residuo (%) cuando se divide para 2 sea cero (Condición par / impar)
numbers = [1, 3, 10, 45, 6, 50]

def extract_even(numbers):
    even_numbers = []
    for number in numbers:
        if number % 2 == 0: # Filtering condition
            even_numbers.append(number)
    return even_numbers

extract_even(numbers)

[10, 6, 50]

In [2]:
# Función mod
10 % 7

3

In [3]:
# El mismo ejemplo usando filter()
numbers = [1, 3, 10, 45, 6, 50]

def is_even(number):
    return number % 2 == 0 # Filtering condition

is_even(10)

True

In [4]:
list(filter(is_even, numbers))

[10, 6, 50]

In [5]:
# Ejemplo simple, obtener los números positivos de una lista
# Se hace con un loop que valida, uno por uno, los números de la lista
# y pregunta si son mayores 0
# Si lo son, los incluye en el listado de números positivos
numbers = [-2, -1, 0, 1, 2, 10]

def extract_positive(numbers):
    positive_numbers = []
    for number in numbers:
        if number > 0: # Filtering condition
            positive_numbers.append(number)
    return positive_numbers

extract_positive(numbers)

[1, 2, 10]

In [6]:
# Aquí la misma función aplicada filter() y simplificada con una lambda

# Se define la lista de números a ser procesados
numbers = [-2, -1, 0, 1, 2, 10]

# Se define la función lambda que va a aplicarse como filtro (que los números sean mayores a cero)
positive_numbers = filter(lambda n: n > 0, numbers)
positive_numbers

list(positive_numbers)

[1, 2, 10]

In [7]:
# Eliminando outliers de un listado de números
import statistics as st
sample = [10, 8, 10, 8, 2, 7, 9, 3, 34, 9, 5, 9, 25]

# Calcula la media de la muestra, antes de eliminar los outliers
mean = st.mean(sample)

# Calcula dos desviaciones estándar como si el límite bajo y alto para filtrar la lista
stdev = st.stdev(sample)
low = mean - 2 * stdev
high = mean + 2 * stdev

print("Media =", mean, ". Bajo =", low, ". Alto =", high)

Media = 10.692307692307692 . Bajo = -7.128740076825961 . Alto = 28.513355461441343


In [8]:
# Formato de 2 decimales
print("Media = {:.2f}".format(mean), "Bajo = {:.2f}".format(low), "Alto = {:.2f}".format(high))

Media = 10.69 Bajo = -7.13 Alto = 28.51


In [9]:
# Los valores de la muestra que están fuera de los valores bajo y alto
# no van a ser mostrados, utilizando una combinación de filter y una función lambda simple
# que condiciona los límites de cada ítem

clean_sample = list(filter(lambda x: low <= x <= high, sample))
clean_sample

[10, 8, 10, 8, 2, 7, 9, 3, 9, 5, 9, 25]

In [10]:
# Función para buscar palabras Palíndromes
def is_palindrome(word):
    reversed_word = "".join(reversed(word))
    return word.lower() == reversed_word.lower()

# Madam
print(is_palindrome("Madam"))
# EBAC
print(is_palindrome("Python"))

True
False


In [11]:
# Ejemplo para encontrar palabras palindrome con filter
words = ("filter", "Ana", "hello", "world", "madam", "racecar", "sosos")

list(filter(is_palindrome, words))

['Ana', 'madam', 'racecar', 'sosos']

In [12]:
# Usando la función filter para excluir números de listas
def identity(x):
    return x

identity("")

''

In [13]:
objects = [0, 1, [], 4, 5, "", None, 8, 9, 15, "sss"]
list(filter(identity, objects))

[1, 4, 5, 8, 9, 15, 'sss']

In [14]:
objects = [0, 1, [], 4, 5, "", None, 8, 9, 15, ""]
list(filter(identity, objects))

[1, 4, 5, 8, 9, 15]