#Comprensions de llistes

Les comprensions de llistes són una de les característiques més apreciades de Python. Permeten forma una nova llista de forma compacta filtrant els elements d'una col·lecció, i transformant-los. Les comprensions prenen la forma básica següent.

    [expr for val in collection if condition]

Això és equivalent al bucle següent

    result = []
    for val in collection:
        if condition:
            result.append(expr)

Es pot ometre la condició del filtre, deixant només l'expressió. Com a exemple, donada una llista de cadenes, podem filtrar les de longitud 3 o menys, i convertir-les a majúscules.

In [None]:
text = ['una', 'expressió', 'breu', 'de', 'codi']

[word.upper() for word in text if len(word) > 3]

['EXPRESSIÓ', 'BREU', 'CODI']

Les comprensions de conjunts (set) i diccionaris (dict) són una extensió natural, i produeixen conjunts i diccionaris amb una sintaxi semblant a la de les llistes.
Una comprensió de diccionari té aquest aspecte.

    dict_comp = {key-expr : value-expr for value in collection if condition}

Una comprensió de conjunt és com la de llista però amb claus en comptes de claudàtors.
    set_comp = {expr for value in collection if condition}

Com les comprensions de llistes, les comprensions de conjunts i diccionaris es fan per conveniència, però fan el codi més bo de llegir i d'escriure. Considerem la llista de cadenes d'abans. Imaginem que volem un conjunt que conté només les longituds de les cadenes. El podem trobar així.

In [None]:
unique_lengths = {len(word) for word in text}
unique_lengths

{2, 3, 4, 9}

Veim que el 4, que correspon a les longituds de 'breu' i 'codi', apareix una sola vegada, com correspon a la idea de conjunt. Observem la diferència si ho feim com a llista, on sí que apareixerà dues vegades.

In [None]:
unique_lengths = [len(word) for word in text]
unique_lengths

[3, 9, 4, 2, 4]

Podem expressar l'operació de conjunt de forma més funcional.

In [None]:
unique_lengths = set(map(len,text)) # <== Quan saps com dir les coses. Wow!
unique_lengths

{2, 3, 4, 9}

Com a exemple de comprensió de diccionari, crearem un mapa de cerca de les paraules, associat a la seva posició a la llista.



In [None]:
loc_mapping = {val : index for index, val in enumerate(text)}
loc_mapping

{'una': 0, 'expressió': 1, 'breu': 2, 'de': 3, 'codi': 4}

#Comprensions niades (nested)

Quan tenim una estructura dins una altra, pot ser pràctic imbricar també les comprensions. Per exemple, considerem una llista de llistes que representa un text format per frases formades per paraules.

In [None]:
text = [ ['Python','és','un','llenguatge','de','programació','molt','poderós'] ,
        ['Sort','que','em','vaig','matricular','en','aquesta','especialització']]

paraules_importants = []
for frase in text:
  noves_paraules = [mot.lower() for mot in frase if len(mot)>3]
  paraules_importants.extend(noves_paraules)

paraules_importants

['python',
 'llenguatge',
 'programació',
 'molt',
 'poderós',
 'sort',
 'vaig',
 'matricular',
 'aquesta',
 'especialització']

El mateix resultat es pot obtenir amb una sola comprensió (una línia!)

In [None]:
text = [ ['Python','és','un','llenguatge','de','programació','molt','poderós'] ,
        ['Sort','que','em','vaig','matricular','en','aquesta','especialització']]

'''
paraules_importants = []
for frase in text:
  noves_paraules = [mot.lower() for mot in frase if len(mot)>3]
  paraules_importants.extend(noves_paraules)
'''

#basta de xerrameca!
mots_importants = [mot.lower() for frase in text for mot in frase if len(mot)>3]
mots_importants

['python',
 'llenguatge',
 'programació',
 'molt',
 'poderós',
 'sort',
 'vaig',
 'matricular',
 'aquesta',
 'especialització']

Al principi, les comprensions niades costen una mica. Les parts `for` de la comprensió es col·loquen d'acord amb l'ordre de la imbricació, i les condicions van al final.

Aquí tenim un altre exemple, en què *aplanam* una llista de tuples en una llista simple d'enters.

In [None]:
unes_tuples = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]
plana = [x for tupla in unes_tuples for x in tupla]
plana

[1, 2, 3, 4, 5, 6, 7, 8, 9]

L'ordre de les expressions for seria el mateix si escrivíssim un bucle imbricat en lloc d'una comprensió de llista.

    flattened = []
        for tup in some_tuples:
            for x in tup:
                flattened.append(x)

Podem tenir un nombre arbitrari de nivells d'imbricació, tot i que per ventura per més de dos o tres nivells hauríem de començar a pensar si té sentit, pel que fa a la llegibilitat del codi.

Convé distingir la sintaxi que hem vist respecte d'una comprensió dins una altra comprensió, que també pot tenir sentit.   


In [None]:
[[x for x in tupla] for tupla in unes_tuples]

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

Això produeix una llista de llistes, en comptes d'una llista plana de tots els elements interns.