<p>
<font size='5' face='Georgia, Arial'>IIC-2233 Apunte Programación Avanzada</font><br>
<font size='1'>&copy; 2015 Karim Pichara - Christian Pieringer. Todos los derechos reservados.</font>
<br>
<font size='1'> Modificado en 2018-1 por Equipo Docente IIC2233</font>
</p>

# Listas por Comprensión

Desde el punto de vista de la lógica, la definición de comprensión es:  "Conjunto de caracteres que forman un concepto". Así mismo, las listas por comprensión se pueden ver como listas formadas por un conjunto de objetos que cumplen con un concepto o condición en particular.

Por ejemplo, tenemos una lista de números guardados como `strings` y queremos construir una lista con los mismos números, pero guardados como `ints`. Una forma de hacerlo sería lo siguiente:

In [1]:
# lista por extensión
lista = ['1', '4', '55', '65','4', '15', '90']

int_lista = []

for c in lista:
    int_lista.append(int(c))
    
print(int_lista)

[1, 4, 55, 65, 4, 15, 90]


Usando listas por comprensión, podemos hacer lo mismo de forma más clara y concisa:

In [2]:
# lista por extensión
lista = ['1', '4', '55', '65','4', '15', '90']

# lista por comprensión
int_lista = [int(c) for c in lista]
# por cada elemento c en lista, entonces int_lista contiene int(c)

print(int_lista)

[1, 4, 55, 65, 4, 15, 90]


La sentencia `if` se puede usar dentro de una lista por comprensión para construir la lista incluyendo solamente los elementos que cumplan una cierta condición.

Por ejemplo, a continuación convertiremos a `int` e incluiremos en la nueva lista solamente los números que estén representados en un `string` con largo estrictamente mayor a uno.

In [3]:
# lista por comprensión
int_lista_2d = [int(c) for c in lista if len(c) > 1]
# por cada elemento c en lista, 
# si c tiene más de 1 dígito, entonces int_lista_2d contiene int(c)

print(int_lista_2d)

[55, 65, 15, 90]


<h1>Sets y Diccionarios por comprensión</h1>

  La misma idea la podemos aplicar a otras estructuras de datos, como sets y diccionarios:

In [4]:
from collections import namedtuple

# namedtuple es una subclase de tuplas que tiene campos (con nombres arbitrarios), 
# pueden ser accesados como tupla.campo

Pelicula = namedtuple("Pelicula", ["titulo", "director", "genero"])
peliculas = [Pelicula("Into the Woods", "Rob Marshall", "Adventure"),
             Pelicula("American Sniper", "Clint Eastwood", "Action"),
             Pelicula("Birdman", "Alejandro González Inárritu", "Comedy"),
             Pelicula("Boyhood", "Richard Linklater", "Drama"), 
             Pelicula("Taken 3", "Olivier Megaton", "Action"), 
             Pelicula("The Imitation Game", "Morten Tyldum", "Biography"),
             Pelicula("Gone Girl", "David Fincher", "Drama")]

# set por comprensión
directores_accion = {p.director for p in peliculas if p.genero == 'Action'}  
# por cada elemento p en películas,
# si el genero de p es 'Action', entonces
# el director de p pertenece a directores_accion

print(directores_accion)


{'Olivier Megaton', 'Clint Eastwood'}


<h3> Podemos crear diccionarios con los resultados de búsqueda:</h3>

In [5]:
# diccionario por comprensión
dict_directores_accion = {p.director: p for p in peliculas if p.genero == 'Action'}
# por cada elemento p en películas,
# si el genero de p es 'Action', entonces
# el par "key:value" -> "director de p: p" pertenece a dict_directores_accion

print(dict_directores_accion)

{'Olivier Megaton': Pelicula(titulo='Taken 3', director='Olivier Megaton', genero='Action'), 'Clint Eastwood': Pelicula(titulo='American Sniper', director='Clint Eastwood', genero='Action')}


In [6]:
dict_directores_accion['Olivier Megaton']

Pelicula(titulo='Taken 3', director='Olivier Megaton', genero='Action')