<h1>Comprensión de listas</h1>

Sintaxis básica:
`[<expresion> for <variable> in <secuencia> if <condicion>]`

In [3]:
a = [1, 2, 3, 4, 5]
b = [2*x for x in a]
b

[2, 4, 6, 8, 10]

Los list comprehension pueden ser empleados como *filtros*

In [4]:
a = [1, -5, 4, 2, -2, 10]
b = [2*x for x in a if x > 0]
b

[2, 8, 4, 20]

Los **list comprehension** son muy poderosos. Podés, por ejemplo, recolectar los valores de un campo específico de un diccionario.

In [16]:
camion = [
    {
        'nombre': 'Naranja',
        'cajones': 150,
        'precio': 490.1
    },
    {
        'nombre': 'Mandarina',
        'cajones': 100,
        'precio': 350.5
    },
    {
        'nombre': 'Pera',
        'cajones': 80,
        'precio': 610.5
    },
    {
        'nombre': 'Naranja',
        'cajones': 250,
        'precio': 340.3
    }

]

nombre_frutas = [elemento['nombre'] for elemento in camion]
nombre_frutas

['Naranja', 'Mandarina', 'Pera', 'Naranja']

O se pueden hacer **queries** (consultas) como si se tratara de una base de datos:

In [17]:
a = [fruta['nombre'] for fruta in camion if fruta['cajones'] > 85 and fruta['precio'] > 400]
a

['Naranja']

También se puede combinar con reducciones de secuencias:

In [18]:
costo = sum([frutas['precio']*frutas['cajones'] for frutas in camion])
costo

242480.0

El código análogo a un list comprehension es el siguiente:

In [None]:
resultado = []
for variable in secuencia:
    if condición:
        resultado.append(expresión)

Y una analogía con la matemática:<br>
`a = [ x * x for x in s if x > 0 ] # Python`
<br>
`a = { x^2 | x ∈ s, x > 0 }        # Matemática`

Podemos construir una lista de tuplas utilizando list comprehension

In [20]:
nombre_cajones = [(fruta['nombre'], fruta['cajones']) for fruta in camion]
nombre_cajones

[('Naranja', 150), ('Mandarina', 100), ('Pera', 80), ('Naranja', 250)]

Se cambiamos los corchetes por llaves se obtiene lo que se conoce como **comprensión de conjuntos** (set comprehension). De esta manera, se van a obtener valores únicos

In [25]:
nombres = [fruta['nombre'] for fruta in camion]
print(nombres, type(nombres))

['Naranja', 'Mandarina', 'Pera', 'Naranja'] <class 'list'>


In [26]:
nombres = {fruta['nombre'] for fruta in camion}
print(nombres, type(nombres))

{'Pera', 'Naranja', 'Mandarina'} <class 'set'>


Si se especifica pares `key:value` se puede construir un diccionario **(Comprensión de diccionario)**

In [36]:
stock = {nombre: 0 for nombre in nombres}
stock

{'Pera': 0, 'Naranja': 0, 'Mandarina': 0}

In [37]:
for fruta in camion:
    stock[fruta['nombre']] += fruta['cajones']

In [38]:
stock

{'Pera': 80, 'Naranja': 400, 'Mandarina': 100}

Ejercicio 3.14: Extraer datos de una arhcivo CSV

Saber usar combinaciones de comprensión de listas, diccionarios y conjuntos resulta útil para procesar datos en diferentes contextos. Aunque puede volverse medio críptico si no estás habituade. Acá te mostramos un ejemplo de cómo extraer columnas seleccionadas de un archivo CSV que tiene esas características. No es dificil cuando lo entendés, pero está muy concentrado todo.

Primero, leamos el encabezado (header) del archivo CSV:

>>> import csv
>>> f = open('Data/fecha_camion.csv')
>>> rows = csv.reader(f)
>>> headers = next(rows)
>>> headers
['nombre', 'fecha', 'hora', 'cajones', 'precio']
>>>

Luego, definamos una lista que tenga las columnas que nos importan:

>>> select = ['nombre', 'cajones', 'precio']
>>>

Ubiquemos los índices de esas columnas en el CSV:

>>> indices = [ headers.index(ncolumna) for ncolumna in select ]
>>> indices
[0, 3, 4]
>>>

Y finalmente leamos los datos y armemos un diccionario usando comprensión de diccionarios:

>>> row = next(rows)
>>> record = { ncolumna: row[index] for ncolumna, index in zip(select, indices) }   # comprensión de diccionario
>>> record
{'precio': '32.20', 'nombre': 'Lima', 'cajones': '100'}
>>>

No es trivial este comando. El comando es sintácticamente muy compacto, pero es conceptualmente (un poco) complejo. Cuando te sientas cómode con esta lectura de una línea del archivo (si no pasa, tranca, podemos seguir sin esto), leé el resto:

>>> camion = [ { ncolumna: row[index] for ncolumna, index in zip(select, indices) } for row in rows ]
>>> camion
[{'cajones': '50', 'nombre': 'Naranja', 'precio': '91.1'},
 {'cajones': '150', 'nombre': 'Caqui', 'precio': '103.44'},
 {'cajones': '200', 'nombre': 'Mandarina', 'precio': '51.23'},
 {'cajones': '95', 'nombre': 'Durazno', 'precio': '40.37'},
 {'cajones': '50', 'nombre': 'Mandarina', 'precio': '65.1'},
 {'cajones': '100', 'nombre': 'Naranja', 'precio': '70.44'}]
>>>

¡Por las barbas de mi abuelo! Acabamos de reducir casi toda la función leer_camion() a un solo comando.
Comentario

La comprensión de listas se usa frecuentemente Python. Es una forma eficiente de transformar, filtrar o juntar datos. Tiene una sintaxis potente pero tratá de no pasarte con su uso: mantené cada comando tan simple como sea posible. Está perfecto descomponer un solo comando complejo en muchos pasos. Concretamente: compartir el último ejemplo con personas desprevenidas puede no ser lo ideal.

Dicho esto, saber manipular datos rápidamente es una habilidad increíblemente útil. Hay numerosas situaciones donde puede que tengas que resolver algún tipo de problema excepcional (en el sentido de raro o único) para importar, extraer o exportar datos. La comprensión de listas te puede ahorrar muchísimo tiempo en esas tareas.

In [None]:
camion_pre