# **Comprensión de listas y otras colecciones**

### ***Listas***

La comprensión de listas en Python es un método sintáctico para crear listas (y por extensión también otras colecciones que veremos más abajo) a partir de los elementos de otras listas (o colecciones) de una forma rápida de escribir, muy legible y funcionalmente eficiente.

Consideremos la siguiente lista de lenguajes:

In [3]:
languages = ["python", "c", "c++", "java"]
cap_languages = []
for language in languages:
    cap_languages.append(language.capitalize())
    
print(cap_languages)

['Python', 'C', 'C++', 'Java']


Usando comprensión de listas

In [5]:
cap_languages = [language.capitalize() for language in languages]
print(cap_languages)

['Python', 'C', 'C++', 'Java']


Lo interesante del método de compresión es que, como decíamos al principio, se escribe más rápido y se lee mejor. Por otra parte, a través de este método podríamos incluso haber trabajado sobre la misma lista, sin necesidad de duplicar la información.

In [6]:
languages = ["python", "c", "c++", "java"]
print(languages)
languages = [language.capitalize() for language in languages]
print(languages)


['python', 'c', 'c++', 'java']
['Python', 'C', 'C++', 'Java']


Por contraste en métodos habituales, sería más complejo

In [8]:
languages = ["python", "c", "c++", "java"]
for language in languages[::]:
    languages.append(language.capitalize())
    del languages[0]
    
print(languages)


['Python', 'C', 'C++', 'Java']


Veamos otro ejemplo. Consderemos esta lista de números:

In [9]:
numbers = [1, 2, 3, 4, 5]
doubled_numbers = [n * 2 for n in numbers]
print(doubled_numbers)


[2, 4, 6, 8, 10]


En estos dos ejemplos trabajados todos los elementos de la lista primigenia aparecen de algún modo transformados en la nueva lista que generamos: en el primer caso se modificaba la primera letra de la cadena para que fuese mayúscula; en este segundo, se multiplica el número por dos. Ahora bien, si queremos indicar que los elementos deben incluirse en la nueva lista en función de una condición, podemos agregar ─justamente─ un condicional. Por ejemplo, el siguiente código crea una lista con números del 1 al 100 que sean múltiplos de 5.

In [10]:
multiples = [n for n in range(1, 101) if n % 5 == 0]
print(multiples)


[5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100]


Este código es funcionalmente igual al siguiente:

In [11]:
multiples = []
for n in range(1, 101):
    if n % 5 == 0:
        multiples.append(n)
        
print(multiples)


[5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100]


 También se obtiene el mismo resultado aplicando la función incorporada filter():

In [12]:
multiples = list(filter(lambda n: n % 5 == 0, range(1, 101)))
print(multiples)


[5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100]


Creo que hay consenso en que la comprensión de listas es mucho más elocuente en casos de estas características.

En función de estos tres ejemplos de comprensión de listas vamos a generalizar su sintaxis del siguiente modo:

#### ***[expresion for variable in colección if condición]***

A menudo la expresión (es decir, aquello que terminará inserto en la lista resultante) es igual a la variable (como vimos en el último ejemplo), y la condición es opcional. La colección puede ser una lista o cualquier otro objeto iterable (esto es, cualquier cosa sobre lo que podamos aplicar un bucle «for»).

A través de la comprensión de listas también podemos expresar de forma compacta un conjunto de bucles anidados. 

ejemplo, el siguiente código crea una lista points que contiene (en forma de tuplas de dos elementos) la posición de todos los puntos bidimencionales entre las coordenadas (0, 0) y (5, 10).

In [13]:
points = []
for x in range(0, 5 + 1):
    for y in range(0, 10 + 1):
        points.append((x, y))
        
print(points)

[(0, 0), (0, 1), (0, 2), (0, 3), (0, 4), (0, 5), (0, 6), (0, 7), (0, 8), (0, 9), (0, 10), (1, 0), (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (1, 7), (1, 8), (1, 9), (1, 10), (2, 0), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (2, 7), (2, 8), (2, 9), (2, 10), (3, 0), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (3, 7), (3, 8), (3, 9), (3, 10), (4, 0), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (4, 7), (4, 8), (4, 9), (4, 10), (5, 0), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6), (5, 7), (5, 8), (5, 9), (5, 10)]


¿Cómo traducimos esto usando el nuevo método? Sencillamente así:

In [14]:
points = [(x, y) for y in range(0, 5 + 1) for x in range(0, 10 + 1)]
print(points)

[(0, 0), (1, 0), (2, 0), (3, 0), (4, 0), (5, 0), (6, 0), (7, 0), (8, 0), (9, 0), (10, 0), (0, 1), (1, 1), (2, 1), (3, 1), (4, 1), (5, 1), (6, 1), (7, 1), (8, 1), (9, 1), (10, 1), (0, 2), (1, 2), (2, 2), (3, 2), (4, 2), (5, 2), (6, 2), (7, 2), (8, 2), (9, 2), (10, 2), (0, 3), (1, 3), (2, 3), (3, 3), (4, 3), (5, 3), (6, 3), (7, 3), (8, 3), (9, 3), (10, 3), (0, 4), (1, 4), (2, 4), (3, 4), (4, 4), (5, 4), (6, 4), (7, 4), (8, 4), (9, 4), (10, 4), (0, 5), (1, 5), (2, 5), (3, 5), (4, 5), (5, 5), (6, 5), (7, 5), (8, 5), (9, 5), (10, 5)]


### ***Otras colecciones***

Esto que acabamos de decir se aplica por extensión a otras colecciones. Por ejemplo, podemos crear un diccionario de la misma forma, pero en este caso utilizamos llaves en lugar de corchetes.

In [15]:
doubles = {n: n * 2 for n in range(1, 11)}
print(doubles)

{1: 2, 2: 4, 3: 6, 4: 8, 5: 10, 6: 12, 7: 14, 8: 16, 9: 18, 10: 20}


La sintaxis para la comprensión de diccionarios es muy similar:

#### ***{clave: valor for variable in coleccion if condicion}***

Algo casi idéntico sintácticamente es la comprensión de conjuntos (sets), que también se realiza con llaves pero prescindiendo de los dos puntos.

In [16]:
# ¡Esto crea un conjunto, no un diccionario!
doubles = {n * 2 for n in range(1, 11)}
print(doubles)

{2, 4, 6, 8, 10, 12, 14, 16, 18, 20}


Por último, una de las cosas más interesantes de esta técnica es la comprensión de generadores. 

Se trata de colecciones cuyos elementos se crean a medida que se recorren en un bucle «for» (o bien a medida que son pasados como argumento a la función incorporada next()). 

La sintaxis para ello es usando paréntesis:

In [20]:
doubles = (n * 2 for n in range(1, 1000000000000000000))

In [19]:
def get_doubles():
    for n in range(1, 1000000000000000000):
        yield n * 2
doubles = get_doubles()



Dado que los paréntesis se usan para esa situación en particular (en lugar de los corchetes o las llaves), si queremos generar una tupla usando el método de comprensión lo debemos indicar específicamente así:

In [22]:
doubles = list((n * 2 for n in range(1, 11)))
print(doubles)

[2, 4, 6, 8, 10, 12, 14, 16, 18, 20]


In [17]:
doubles = tuple(n * 2 for n in range(1, 11))
print(doubles)

(2, 4, 6, 8, 10, 12, 14, 16, 18, 20)
