# LIST y DICT COMPREHENSION. Compresión de listas y diccionarios

Python es un lenguaje de alto nivel y está pensado para reducir en lo posible el tamaño del código. Esto se puede conseguir gracias a la llamada compresión, que reduce el código a la hora de crear listas y diccionarios.

[Video - Machine Learnia(FR)](https://www.youtube.com/watch?v=Whoe3p-sGEY&list=PLO_fdPEVlfKqMDNmCFzQISI2H_nJcEDJq&index=6)

## Compresión de listas
Imaginemos que queremos constriur una lista de números con los cuadrados de los números del 1 al 10. 
El código para crear eso sería el siguiente.

In [1]:
# inicializamos una lista vacía
lista_1=[]

for i in range(1, 11):    # un bucle que toma valores entre 1 y 11
    lista_1.append(i**2)  # eleva al cuadrado i y lo añade a lista_1
    
lista_1

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

Para que entendamos bien cómo funciona el concepto de la compresión, se trata de inicializar una lista y dentro de ella añadir las reglas que van a definir la construcción de la misma. Dicho así a priori puede sonar un poco raro, pero a continuación podemos verlo.

In [5]:
# aquí podemos ver el código de arriba en una sola línea
lista_2 = [i**2 for i in range (1, 11)]

lista_2

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

### ¿Por qué es útil usar la compresión?
Pues hay tres razones para hacer esto:
1. El código es más legible al estar escrito en una sola línea
2. Es una buena práctica propia de Python
3. El código se ejecuta más rápido

Esta forma de trabajar tiene mucho sentido cuando usamos grandes cantidades de datos o por ejemplo, bucles con una cantidad enorme de iteraciones. 

In [3]:
# cargamos la librería time
import time

In [4]:
# inicializamos un reloj
start = time.time()

lista_1=[]
for i in range(10000):    # 10.000 iteraciones
    lista_1.append(i**2)

# guardamos el instante final
end = time.time()

# tiempo de ejecución
print(end-start)

0.0030031204223632812


In [5]:
start = time.time()

lista_2 = [i**2 for i in range (10000)] # el mismo bucle de arriba en una sola línea

end = time.time()

print(end-start)  # tiempo de ejecución menor

0.0019998550415039062


Otra funcionalidad de Python es poder crear una lista anidada, algo muy útil cuando representamos matrices. La matriz funcionará como una lista de listas, siendo cada lista un vector dentro de ella.

In [2]:
# un vector tiene la siguiente forma
vector = [i for i in range(3)]
vector

[0, 1, 2]

In [18]:
# anidando el mismo esquema podemos crear una matriz (3x3)
matriz = [[i for i in range(3)] for i in range(3)]
matriz

[[0, 1, 2], [0, 1, 2], [0, 1, 2]]

## Compresión en diccionarios

In [20]:
# un diccionario es un conjunto de parjeras clave:valor
apellidos = {'0':'Garcia', '1':'Valero', '2':'Jimenez', '3':'Rodriguez'}

In [21]:
# puedo usar una lista para introducirla dentro de un diccionario
nombres = ['Sofia', 'Javier', 'Matías', 'Alba']

In [22]:
d_nombres = {k:v for k,v in enumerate(nombres)}
d_nombres

{0: 'Sofia', 1: 'Javier', 2: 'Matías', 3: 'Alba'}

También podemos juntar dos listas de tal modo que usamos una como clave y el otro como valor.
Todo ello se hace con el método `zip()`

In [None]:
# creamos una lista de edades
edades =  [24, 65, 12, 84]

In [None]:
d_edades = {nombres:edades for nombres, edades in zip(nombres, edades)}

In [None]:
d_edades

los diccionarios y listas podemos aplicarles condicionales que modifiquen la salida

In [None]:
# le aplicamos la condicion de que cree el diccionario con edades superiores a 20 años
d_edades = {nombres:edades for nombres, edades in zip(nombres, edades) if edades>20}
d_edades

En esencia la extructura se resume a la forma:

`[HAZ ESTO + PARA ESTA COLECCION + EN ESTOS CASOS]`

- Haz esto : elevar al cuadrado `i**2`, hacer minúsculas `palabra.lower()`...
- Para esta colección: `for i in range(10)`, `for palabra in texto`
- En estos casos: si la palabra empieza por A `if palabra[0] == 'A'`

In [None]:
ejemplo = [i**2 for i in range(50) if i % 3 == 0]
ejemplo

### Comprehensión en tuplas 

Para el caso de las tuplas tenemos que tener en cuenta que Python lo tiene un poco complicado, porque las tuplas son listas de invariantes

In [23]:
tupla_1 = (i**2 for i in range(10))
tupla_1

<generator object <genexpr> at 0x000002ED8EF19BA0>

Si queremos evitar este mensaje de error tenemos que usar la palabra reservada `tuple` para que en el proceso de generación tenga en cuenta Python el tipo de dato

In [25]:
tupla_1 = tuple(i**2 for i in range(10))
tupla_1

(0, 1, 4, 9, 16, 25, 36, 49, 64, 81)