# List comprehension
El concepto de list comprehension nos va a ayudar a simplificar aún más las iteraciones. Su nombre list comprehension viene de generar una lista basándose en otra lista y haciendo funciones sobre los elementos.  


In [1]:
# imagina que tienes una lista de palabras y quieres una lista con los elementos que cumplan que la palabra mida 3 caracteres
# con una iteración a la que estamos acostumbrados
palabras = ['sol', 'mar', 'tierra', 'luna', 'espacio', 'uno']
palabras3 = []
for palabra in palabras: # usando que la lista es un iterable
    if len(palabra) == 3:
        palabras3.append(palabra)

print(palabras3)


['sol', 'mar', 'uno']


In [3]:
# con sintáxis de list comprehension
palabras = ['sol', 'mar', 'tierra', 'luna', 'espacio', 'uno']
palabras3 = [palabra for palabra in palabras if len(palabra)==3]
print(palabras3)

['sol', 'mar', 'uno']


se vuelve más rápido y eficiente hacer iteraciones. Si avanzamos un poco más y quieres aplicar una función a cada elemento de la lista, con el list comprehension lo puedes hacer fácilmente

In [4]:
import numpy as np
# generamos una lista con números del 1 al 10
numeros = [i for i in range(1,11)]
# le aplicamos la función cuadrática a cada elemento
numeros_sqrt = [np.sqrt(x) for x in numeros]
print(numeros_sqrt)

[np.float64(1.0), np.float64(1.4142135623730951), np.float64(1.7320508075688772), np.float64(2.0), np.float64(2.23606797749979), np.float64(2.449489742783178), np.float64(2.6457513110645907), np.float64(2.8284271247461903), np.float64(3.0), np.float64(3.1622776601683795)]


para la sintáxis del list comprehension definimos un valor que es el que va tomando la iteración y sobre ese elemento aplicamos la función y finalmente definimos ese valor "x" de dónde lo tiene que ir tomando.  
También podemos aplicar funciones ifelse de la siguiente forma:

In [5]:
# catalogar si es número par o impar
numeros = [x for x in range(10)]
catalogados = ["par" if x%2 == 0 else "impar" for x in numeros] # utilizamos la función módulo (%) para saber si es par o impar
print(catalogados)

['par', 'impar', 'par', 'impar', 'par', 'impar', 'par', 'impar', 'par', 'impar']


y podemos juntar la sintáxis de if else para que sólo considere algunos números

In [6]:
numeros = [x for x in range(12)]
catalogados = ["par" if x %2 == 0 else "impar" for x in numeros if x >10] # catalogamos los números mayores a 10 nada más
print(catalogados)

['impar']


También existe su similar en dict comprehension

In [8]:
numeros = [x for x in range(12)]
catalogo = {x: "par" if x%2 == 0 else "impar" for x in numeros}
catalogo

{0: 'par',
 1: 'impar',
 2: 'par',
 3: 'impar',
 4: 'par',
 5: 'impar',
 6: 'par',
 7: 'impar',
 8: 'par',
 9: 'impar',
 10: 'par',
 11: 'impar'}

In [9]:
atributos = {"par": 0, "impar": 1}
{atr: [x for x in numeros if x%2==atributos[atr]] for atr in atributos}

{'par': [0, 2, 4, 6, 8, 10], 'impar': [1, 3, 5, 7, 9, 11]}

In [12]:
import pandas as pd
ciudades = pd.DataFrame({'pais': ['Mexico', 'Mexico', 'Mexico', 'USA', 'USA'], 'ciudad': ['cdmx', 'toluca', 'tijuana', 'miami', 'nueva york']})
paises = ciudades.pais.unique()
dicc = {pais: ciudades[ciudades.pais == pais].ciudad.values for pais in paises}
dicc

{'Mexico': array(['cdmx', 'toluca', 'tijuana'], dtype=object),
 'USA': array(['miami', 'nueva york'], dtype=object)}