# Filter: No puedes pasar

![](https://cdn.cultofandroid.com/wp-content/uploads/2012/11/bouncer1.jpg)

-------------------

Hemos visto ya dos funciones clásicas:

* `map`
* `reduce`

`map` procesa una lista y produce una nueva, con el mismo tamaño, pero con los elementos transformados.

`reduce` procesa una lista y combina todos sus elementos en uno nuevo. Tampoco modifica la lista procesada.


Nos falta el tercero en discordia: `filter`.


## La función `filter`

La función `filter` hace lo siguiente:

* recibe una lista y un `predicado` (un predicado es una función que devuelve un booleano)
* ese `predicado` es un test que cada elemento de la lista debe de pasar
* el `predicado` es una función qe recib eun sólo parámetro (el elemento) y devuele un booleano
* `filter` devuelve una nueva lista, con **tan sólo los elementos que superaron el test**, es decir, los que devolvieron `True` al predicado.

### Ejemplos de predicado

`lambda x: x < 10`  Recibe un número y devuelve `True`si el número es menor que 10.

`lambda l: len(l) > 3` Recibe una lista y devuelve `True` si su longitud es mayor que 3 

In [28]:
def is_high_probability(probability):
    """
    Recibe una probabilidad (número entre 0 y 1.0) y devuelve
    True si dicha probabilidad está en el rango correcto y es alta (mayor o igual a 0.8)
    """
    if probability > 1 or probability < 0:
        result = False
    else:
        result = (probability >= 0.8)
    return result
        

# Pruebas
[is_high_probability(7), is_high_probability(-4), is_high_probability(0.8), is_high_probability(0.9), is_high_probability(0.7)]


[False, False, True, True, False]

## Implementación de `filter`

Rellena el patrón de la función `filter`. recuerda lo siguiente:

* recibe una lista y un predicado
* procesa una lista
* construye y devuelve otra, con aquellos elementos que supera el test del predicado

La llamaremos `my_filter` para no hacer sombra al `filter` propio de Python.

```
def my_filter(elements, predicate):
    """
    recibe una lista y un predicado. devuelve otra lista con aquellos elementos
    que superan el test del predicado
    """
    accum = ???? #qué se va acumulando? cial es el valor inicial?
    for element in elements:
        ??? # qué se hace en con cada elemento??
    return accum
```


¿Sabrías hacerlo también con un `while`?

---------------------------------

In [27]:
def filter_for(elements, predicate):
    """
    recibe una lista y un predicado. devuelve otra lista con aquellos elementos
    que superan el test del predicado
    """
    accum  = []
    for element in elements:
        if predicate(element):
            accum.append(element)
    return accum
    

In [30]:
filter_for([0.8, 0.1, 0.2, 0.9], lambda x: x > 0)

[0.8, 0.1, 0.2, 0.9]

In [34]:
def filter_w(elements, predicate):
    accum = []
    index = 0
    while index < len(elements):
        element = elements[index]
        if predicate(element):
            accum.append(element)
        index = index + 1
    return accum


filter_w([0.8, 0.1, 0.2, 0.9],    is_high_probability)

[0.8, 0.9]

## Ejercicios



In [40]:
def reduce(seq, initial_value, combinator):
    """
    Recorre una lista llamada seq y va combinando los valores mediante un 
    combinador (que no sabemos muy bien qué es, pero que se recibe como parámetro. 
    Devuelve el valor reducido o combinado de todos los elementos de la lista.
    """
    accum = initial_value
    for element in seq:
        accum = combinator(accum, element) 
    return accum

Usando tu `my_filter`, crea, apartir de `numbers`,  una nueva lista con sólo los números pares.

In [35]:
# lista inicial
numbers = [1,2,3,4,5,6,7,8,9,11, 12,14,19,12]

¿Cómo calcularías el total de números pares de la lista original? Usa `my_filter` y tu `reduce`.

¿Y el total de números *impares*?

-----------

In [47]:
def is_even(num):
    return num % 2 == 0


filtered = filter_w(numbers, lambda x : not is_even(x))

reduce(filtered, 0, lambda a, b : a + b)


'hola'

--------------------------

Te contrataron en un banco como Data Analyst y tu primer trabajo es recibir una lista (larguísima) que contiene la probabilidad, calculada mediante un modelo de ML, de que un cliente deje de pagar su hipoteca.

Tu trabajo es quitarle esos muertos al banco, eliminando de la lista los que tengan una probabilidad inferior a un valor que te pasan.

In [57]:
import random

# lista de probabilidades (usando "list comprehensions")
probs = [random.random() for i in range(100) ]


In [62]:
def remove_bad_customers(probabilities, threshold):
    """
    Recibe una lista de probabilidades de pago y un límite (threshold)
    Debe devolver una nueva lista con aquellas probabilidades que son iguales
    o mayores al threshold
    """
    return filter_for(probabilities, lambda x : x >= threshold) # rellena esto


remove_bad_customers(probs, 0.6)

[0.6674960131546082,
 0.7653109851963831,
 0.809418869219837,
 0.7918379428998756,
 0.7239420765869926,
 0.6306438084774322,
 0.7027909574590818,
 0.9103128044099225,
 0.9176162004243669,
 0.8285800732167836,
 0.7539501409937219,
 0.6098885247362172,
 0.9230805231350537,
 0.6892667045912663,
 0.689575208458878,
 0.6588772798832037,
 0.8895910240263617,
 0.6822380375123722,
 0.6993506075500984,
 0.7570036825758776,
 0.8281055364056605,
 0.8492818398530408,
 0.9705784748592451,
 0.7656850378651747,
 0.7168549660118906,
 0.9866671787507453,
 0.8911528799482906,
 0.8272411586444987,
 0.7176452553029687,
 0.802102275119469,
 0.7550020125554954]

¡OJO! El predicado de `my_filter` sólo puede recibir un parámetro (el elemento de la lista que está procesando). NO le puedes pasar por parámetro el límite (threshold). ¿Es eso un problema? ¿Por qué no?

---------------

Trabajas en un clínica de estética (en el departamento de IT, of course) y lo priemro que se le hace a los clientes es calcular su [bmi](https://www.cdc.gov/healthyweight/assessing/bmi/index.html).

![](https://calculatorsworld.com/health/wp-content/uploads/sites/4/bmi-chart-metric.png)

Tu trabajo es recibir una lista con dichos valores y crear una nueva con aquellos que están **por debajo de 15** o **por encima de 40**. En esos casos se supone que puede haberse producido un error,y se tiene que volver a calcular.

Crea una función que devuelve una lista con esos valores extremos. 

In [65]:
def is_extreme(bmi):
    return bmi > 40 or bmi < 15
        
def extreme_bmis(list_of_bmis):
    """
    Recibe una lista y devuelve otra lista con los valores de bmi que se consideran
    sospechosos de ser un error por extremos (menor que 15 o mayor que 40)
    """
    return filter_for(list_of_bmis, is_extreme)

extreme_bmis([12, 45, 21, 23.4, 45, 24, 13, 26])

[12, 45, 45, 13]

¡OJO! Hay dos maneras de hacerlo: con 1 sólo filtro o con dos filtros seguidos. Intenta hacerlo de las dos formas.

----------------

Tienes una lista de "cosas", como por ejemplo la siguiente:

```
[34, 'hola', False, [3,4,5], [None, None], [], ['grijandermoney'], 'EUR50']
```

Tu trabajo es dejar pasar todo lo que **no sea** una lista.

Para ello, primero averigua qué hace la función [type](https://www.w3schools.com/python/ref_func_type.asp) de Python y asegúrate de entender las siguientes expresiones:

In [21]:
type(34)

int

In [22]:
type([3,4])

list

In [23]:
type([])

list

In [24]:
type([]) == int

False

In [25]:
type([]) == list

True

Ahora, crea la función `lists_only` que recibe una lista de "cosas" y devuelve una nueva lista con todo aquello que no era una lista, eliminado.

Es decir:

```
lists_only([34, 'hola', False, [3,4,5], [None, None], [], ['grijandermoney'], 'EUR50']) 
```

devolverá

```
[ [3,4,5], [None, None], [], ['grijandermoney']]
```

---------

Usando la función `lists_only`, crea una función `non_empty_lists` que devuelve una lista con aquellos elementos que són listas y que **además NO están vacías**.

Para implementar `non_empty_lists` debes de llamar a `lists_only`.

```
non_empty_lists([34, 'hola', False, [3,4,5], [None, None], [], ['grijandermoney'], 'EUR50'])
```

devolverá

```
[ [3,4,5], [None, None],  ['grijandermoney'], ]
```

In [67]:
def lists_only(elements):
    """
    Recibe un alista y saca todo elemento que no sea una lista
    """
    return filter_for(elements, lambda x: type(x) == list)

In [68]:
lists_only([34, 'hola', False, [3,4,5], [None, None], [], ['grijandermoney'], 'EUR50'])

[[3, 4, 5], [None, None], [], ['grijandermoney']]

In [72]:
def non_empty_lists(elements):
    return filter_for(lists_only(elements), lambda x: len(x) > 0)

In [73]:
non_empty_lists([34, 'hola', False, [3,4,5], [None, None], [], ['grijandermoney'], 'EUR50'])

[[3, 4, 5], [None, None], ['grijandermoney']]