# Compresiones
**Autores**: Rogelio Mazaeda, Félix Miguel Trespaderne.   

## Contenidos
[Introducción](#Introducción)<br>
[Compresiones con listas](#compresiones_listas)<br>
[Compresiones con diccionarios](#compresiones_diccionarios)<br>
[Compresiones con conjuntos](#compresiones_sets)<br>

***
<a id='Introducción'></a>

## Introducción.

Los recursos de creación y manipulación de colecciones que se han visto hasta ahora nos permiten enfrentar todo tipo de problemas concebibles.

Python es un lenguaje de muy alto nivel, que intenta  brindar al programador las herramientas más adecuadas para lidiar con el problema que se tenga entre manos. El utilizar una **abstracción** concreta u otra depende, en buena medida, del grado en que la misma se *acerque* al referente real que nuestro programa informático quiera representar o modelar.

En el caso de las colecciones como: **listas**, **diccionarios** y **conjuntos**, un referente importante lo constituyen los conjuntos en matemáticas.

De nuestra formación previa en matemáticas, nos resulta familiar una notación concreta a la hora de referinos a conjuntos. 

Por ejemplo, si queremos caracterizar el conjunto de elementos que se obtiene tras elevar al cuadrado los primeros 10 enteros, lo podríamos describir de la siguiente forma:

$$
\begin{align}
\\ \{x^2, \, x \in \aleph, \, 0 \leq x < 10 \}\\
\end{align}
$$

Supongamos que quisieramos crear una lista de Python que representara esos números. Tendríamos varias alternativas, pero una de ellas es siempre el acudir a bucles como el que sigue:

```python
lista = []
for x in range(10):
    lista.append(x**2)
```

Pero en Python tenemos la posibilidad de utilizar la sintaxis de las **compresiones** (**comprehesions**) para obtener un código muy escueto y cercano al referente matemático, de la siguiente forma:

```Python
lista = [x**2 for x in range(10)]
```

In [1]:
lista = [x**2 for x in range(10)]
print(lista)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


***
<a id='compresiones_listas'></a>

## Compresiones con listas

Las compresiones se pueden aplicar a las colecciones ya vistas. La determinación de si se trata de una **lista**, un **diccionario**, o un **conjunto** se realiza en base a la presencia o no de determinados elementos sintácticos como los corchetes `[]` para las listas, o la presencia de una *clave* para los diccionarios, que además deben estar provistos de  claves, `{}`, etc. 

Para simplificar la explicación, nos centraremos inicialmente en las **compresiones de listas** para posteriormente abrir el abánico hacia las otras colecciones.

La sintaxis general sería:

```python
[expr(var_1 ... var_n) for var1 in iterable_1 [....var_n in iterable_n] [if expr_bool]]  
```

- expr(var_1 ...var_2): será una expresión de Python que en general involucra `n` variables.
- A continuación aparece un `for` que indica, mendiante algún *iterable*, el dominio de los valores a considerar.
- Se pueden poner tantos `for` como sean necesarios (los corchetes internos indican que estos son opcionales).
- Puede opcionalmente aparecer un único `if` que determina la condición lógica a cumplir por las variables de todos los dominios para poder ser incluida en el conjunto resultante.

In [2]:
pares = [x for x in range(0, 10, 2)]
impares = [x+1 for x in pares]
print(pares, impares)

[0, 2, 4, 6, 8] [1, 3, 5, 7, 9]


La lista ```pares``` esta compuesta para todos los elementos que cumplen que están en el rango de `[0,10[`, pero tomados de dos es dos.

Nótese que la variable `x` en la compresión esta **ligada** (**bound**) a la misma: su alcance está limitado a la compresión donde está definida. 

La lista `impares` es conformada a su vez a partir de la lista `pares`. Obsérvese que de nuevo se usa  `x` para describir esta otra _compresión_ con un significado diferente: ahora `x` *recorre* todos los elementos del _iterable_ `pares` para incluir su sucesor (`x + 1`).

Una alternativa para conformar los pares hubiera sido:

In [None]:
pares = [x for x in range(10) if x%2 == 0]
pares

La siguiente compresión usa dos variables internas a la misma, las variables ```x``` e ```y``` y una variable _libre_ definida fuera de la compresión, `desplazamiento`. Los elementos de la listas se calculan a partir de la expresión definida sobre esas variables y es calculada mientras `x` _recorre_ la lista que se ofrece literalmente y la variable `y` el iterable expresado por la función `range()`.  

In [3]:
desplazamiento = 10
tabla = [x*y + desplazamiento for x in [1, 2, 3] for y in range(1,5)]
tabla

[11, 12, 13, 14, 12, 14, 16, 18, 13, 16, 19, 22]

Nótese que la compresión anterior sería la forma compacta del siguiente código:

In [4]:
desplazamiento = 10
tabla = []
for x in [1, 2, 3]:
    for y in range(1,5):
        tabla.append(x*y + desplazamiento)
tabla

[11, 12, 13, 14, 12, 14, 16, 18, 13, 16, 19, 22]

Otro ejemplo:

In [5]:
lista_tuplas = [(x,y,z) for x in range(3) for y in range(3) for z in range(3) if x != y and y != z and x != z]
lista_tuplas

[(0, 1, 2), (0, 2, 1), (1, 0, 2), (1, 2, 0), (2, 0, 1), (2, 1, 0)]

De nuevo, el código equivalente sería:

In [6]:
lista_tuplas = []
for x in range(3):
    for y in range(3):
        for z in range(3):
            if x != y and y != z and x != z:
                lista_tuplas.append((x,y,z))
lista_tuplas

[(0, 1, 2), (0, 2, 1), (1, 0, 2), (1, 2, 0), (2, 0, 1), (2, 1, 0)]

Observe en el ejemplo previo que las listas pueden a su vez estar compuestas de tuplas. Las posibilidades son inagotables y están solamente limitadas por nuestro ingenio.

En el siguiente ejemplo, se recibe una lista de tuplas, y se crea por _compresion_ otra lista de valores simples, integrado por el primer miembro (convertido a `float`) de aquellas tuplas cuyo segundo miembro sea diferente de cero.

In [7]:
original = [(1.5,1), (2.1,0), (3, 1), (4,0), (10.5,5)]
elegido = [float(x[0]) for x in original if x[1] != 0]
elegido

[1.5, 3.0, 10.5]

En el siguiente ejemplo, se itera sobre una lista anidada, que puede representar una matriz, y se crea por compresión, una lista (sin anidamientos) con todos los elementos de la matriz orginal. 

In [None]:
lista_anidada = [[1, 2, 3],[4, 5, 6],[7, 8, 9]]
lista_plana = [x for y in lista_anidada for x in y]
lista_plana

Observe que la variable interna `y` representa cada una de las sublistas (o las filas) de la lista anidada (matriz). Mientras que `x` itera por cada uno de los elementos de esas filas.

En el siguiente ejemplo se crea, de una manera muy sintética, una matriz de 3x3 inicializada a cero, usando una compresión anidada en otra.

In [None]:
matriz = [[0 for col in range(3)] for row in range(3)]
matriz

***
<a id='compresiones_diccionarios'></a>

## Compresiones con diccionarios

Las listas son las colecciones más utilizadas pero el concepto de _compresiones_ es igualmente útil para crear de forma muy sintética **diccionarios** y **conjuntos**.

Lo único que se debe tener en cuenta es respetar la sintaxis de cada uno.

```python
{expr_clave(x_1,...x_n): expr_dato(x_1,...x_n) for x_1 in _iterable_1_ [...for x_n in _iterable_v] if exp_boll}
```
Para los diccionarios, se utilizan los delimitadores ```{}``` y se plantean expresiones para la _clave_ y los datos.

In [8]:
from math import sqrt, log

delta = 0.1

abscisas = [round(float(x)/10 + delta, 1) for x in range(20)]

tabla = {x:log(sqrt(x**5)) for x in abscisas}
tabla

{0.1: -5.756462732485114,
 0.2: -4.023594781085251,
 0.3: -3.00993201081484,
 0.4: -2.2907268296853873,
 0.5: -1.7328679513998633,
 0.6: -1.277064059414977,
 0.7: -0.891687359846831,
 0.8: -0.5578588782855243,
 0.9: -0.2634012891445657,
 1.0: 0.0,
 1.1: 0.2382754495108123,
 1.2: 0.45580389198488647,
 1.3: 0.6559106611687278,
 1.4: 0.8411805915530322,
 1.5: 1.0136627702704109,
 1.6: 1.175009073114339,
 1.7: 1.3265706276554259,
 1.8: 1.4694666622552977,
 1.9: 1.6046347154309868,
 2.0: 1.7328679513998633}

En el ejemplo previo, se crea un diccionario que *implementa* una tabla a partir de evaluar una expresión matemática para cada uno de los elementos de una lista de _floats_ creada previamente.

Otro ejemplo:

In [10]:
ascii = {ch:ord(ch) for ch in "abcdefghijklmnopqrstvwxyx"}
ascii

{'a': 97,
 'b': 98,
 'c': 99,
 'd': 100,
 'e': 101,
 'f': 102,
 'g': 103,
 'h': 104,
 'i': 105,
 'j': 106,
 'k': 107,
 'l': 108,
 'm': 109,
 'n': 110,
 'o': 111,
 'p': 112,
 'q': 113,
 'r': 114,
 's': 115,
 't': 116,
 'v': 118,
 'w': 119,
 'x': 120,
 'y': 121}

***
<a id='compresiones_sets'></a>

## Compresiones con conjuntos

Para el caso de **conjuntos**, la sintaxis sería:

```python
{expr_dato(x_1,...x_n) for x_1 in _iterable_1_ [...for x_n in _iterable_v] if exp_boll}
```
El elemento distintivo fundamental de los conjuntos es el hecho de que la propia colección garantiza que sus elementos nunca están repetidos, por así decirlo, los _filtra_.

In [11]:
cadena = "Una cadena con palabras repetidas. La cadena es filtrada. Resultado: cadena con palabras sin repetir"
palabras_usadas = {pal for pal in cadena.split()}
palabras_usadas

{'La',
 'Resultado:',
 'Una',
 'cadena',
 'con',
 'es',
 'filtrada.',
 'palabras',
 'repetidas.',
 'repetir',
 'sin'}