# Compresión de listas y diccionarios
<a href="https://colab.research.google.com/github/milocortes/diplomado_ciencia_datos_mide/blob/edicion-2024/talleres/list_dictionary_comprehensions_mide_2024.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>
![list_comprehensions-2.jpg](attachment:list_comprehensions-2.jpg)
source : https://coderpad.io/blog/development/python-list-comprehension-guide/


## Compresión de listas y diccionarios

El patrón de usar un <code>for</code> loop para iterar a través de una lista, modificar o seleccionar elementos individuales y crear una nueva lista es muy común. Dichos loops a menudo se parecen mucho a lo siguiente:

In [4]:
x = [1,2,3,4]
x_cuadro = []

for i in x:
  x_cuadro.append(
      i**2
  )
x_cuadro

[1, 4, 9, 16]

In [17]:
[i**2 for i in x  if i > 2]

[9, 16]

In [14]:
el_dict = {
    "6467878" : "Master",
    "8787122" : "Visa",
    "6467902" : "Master",
    "8787298" : "Visa"
}

#{k:v for k,v in el_dict.items() if k.startswith("6467")}
{k:v for k,v in el_dict.items() if v == "Master"}

{'6467878': 'Master', '6467902': 'Master'}

In [15]:
[k for k,v in el_dict.items() if v == "Master"]

['6467878', '6467902']

In [19]:
[(i,j)  for i in range(5) for j in range(10,15)]

[(0, 10),
 (0, 11),
 (0, 12),
 (0, 13),
 (0, 14),
 (1, 10),
 (1, 11),
 (1, 12),
 (1, 13),
 (1, 14),
 (2, 10),
 (2, 11),
 (2, 12),
 (2, 13),
 (2, 14),
 (3, 10),
 (3, 11),
 (3, 12),
 (3, 13),
 (3, 14),
 (4, 10),
 (4, 11),
 (4, 12),
 (4, 13),
 (4, 14)]

In [20]:
[i for i in range(5)]

[0, 1, 2, 3, 4]

In [21]:
{i:i**2 for i in range(5)}

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16}

In [24]:
cubico = (i**3 for i in range(5))

for i in cubico:
  print(i)

0
1
8
27
64


Este tipo de situación es tan común que Python que ofrece una forma especial para este tipo de operaciones que es denominada llama *comprensión*.

Pensemos la compresión de listas o diccionarios como un  <code>for</code> loop de una línea que crea una nueva lista o diccionario a partir de una secuencia.

El patrón de comprensión de una lista es el siguiente:

y una comprensión de diccionario se ve así:

El siguiente código hace exactamente lo mismo que el código anterior pero con una comprensión de lista:

Incluso se puede usar declaraciones <code>if</code> para seleccionar elementos de la lista:

Las comprensiones de diccionarios son similares, pero se debe proporcionar una llave y un valor.

Si se desea hacer algo similar al ejemplo anterior pero que el número sea la llave y el cuadrado del número sea el valor en un diccionario, se puede usar una comprensión de diccionario, de la siguiente forma:

## Multiples declaraciones <code>for</code>

Puede usar varias declaraciones <code>for</code> juntas y usar la declaración <code>if</code> para filtrar elementos.

# Expresiones generadoras

Las expresiones generadoras son similares a la comprensión de listas. Una expresión generadora se parece mucho a una comprensión de lista, excepto que en lugar de corchetes, usa paréntesis.

El siguiente ejemplo es la versión en expresión generadora de la compresión de lista ya vista:

Aparte del cambio de los corchetes, la expresión no devuelve una lista.

En su lugar, devuelve un objeto generador que podría usarse como iterador en un  <code>for</code> loop, que es muy similar a lo que hace la función <code>range()</code>.

La ventaja de usar una expresión generadora es que la lista completa no se genera en la memoria, por lo que se pueden generar secuencias arbitrariamente grandes con poca sobrecarga de memoria.

# Programación Funcional

La programación funcional es un paradigma de programación que enfatiza la escritura de funciones que realizan cálculos sin modificar variables globales o cualquier estado externo (como archivos en el disco duro, conexiones a Internet o bases de datos).

Algunos lenguajes de programación, como Erlang, Lisp y Haskell, están fuertemente diseñados en torno a conceptos de programación funcional.

Python tiene algunas características de programación funcional como:

* side-effect-free functions
* higher-order functions
* lambda functions


## Side effect

*Side effect*s son los cambios que hace una función a las partes del programa que existen fuera de su alcance.

In [26]:
def resta(a,b):
  return a - b


Esta función <code>subtract()</code> no tiene side effects. Es decir, no afecta nada en el programa que no sea parte de su código.

Una función puede modificar variables locales dentro de la función, pero estos cambios permanecen aislados del resto del programa.

## Higher-Order Functions

Las *Higher-order function*s puede aceptar otras funciones como argumentos o devolver funciones como valores de retorno.

Las funciones <code>map()</code> y <code>filter()</code> son  higher-order functions comunes que transforman y filtran listas, a menudo con la ayuda de funciones lambda.

In [29]:
def cuadrado(valor):
  return valor**2

x = [1,2,3,4,5]

list(map(cuadrado, x))

[1, 4, 9, 16, 25]

In [37]:
list(map(lambda i : i**2, x))

[1, 4, 9, 16, 25]

In [40]:
datos = [34,1,3,7,9,45,79]
list(map(lambda z : z**2, filter(lambda i : i > 10, datos)))

[1156, 2025, 6241]

In [41]:
[i**2 for i in datos if i > 10]

[1156, 2025, 6241]

In [30]:
[i**2 for i in x]

[1, 4, 9, 16, 25]

In [None]:
filter()

In [34]:
def evalua(valor):
  return valor.startswith("T")

ciudades =  ["Tabasco", "Ciudad de México", "Monterrey", "Tampico"]

list(filter(evalua,ciudades))

['Tabasco', 'Tampico']

In [35]:
[i for i in ciudades if i.startswith("T")]

['Tabasco', 'Tampico']

### Aplicar funciones a elementos con <code>map()</code>

La función <code>map()</code> toma la forma <code>map(function,iterable)</code> y aplica <code>function</code> a cada elemento en el <code>iterable</code > para devolver una lista en Python 2 o un objeto iterable <code>map</code> en Python 3:

Podrías escribir un equivalente de <code>map()</code> usando la comprensión de listas, así:

### Lista de filtrado con <code>filter()</code>

La función <code>filter()</code> toma la forma <code>filter(function, iterable)</code> y filtra los elementos en <code>iterable</code> según el resultado devuelto por <code> function</code>. Devuelve una lista en Python 2 o un objeto iterable <code>filter</code> en Python 3:

Usando la comprensión de listas obtenemos un equivalente de <code>filter()</code>:

### Encontrar elementos que satisfagan condiciones con <code>any()</code> y <code>all()</code>

Las funciones <code>any(iterable)</code> y <code>all(iterable)</code> devuelven un booleano dependiendo de los valores devueltos por <code>iterable</code>. Estas funciones son equivalentes a las siguientes implementaciones:

Estas funciones son útiles para verificar si alguno o todos los valores en un iterable satisfacen una condición dada.

Por ejemplo, lo siguiente verifica una lista para dos condiciones:

La diferencia es que <code>any()</code> devuelve <code>True</code> cuando al menos un elemento cumple la condición, mientras que <code>all()</code> devuelve <code>True</code> solo si todos los elementos cumplen la condición. La función <code>all()</code> también devolverá <code>True</code> para un iterable vacío, ya que ninguno de los elementos es <code>False</code>.

# Python Tricks

## Usar la comprensión de listas para encontrar quienes más ganan


Supongamos que trabajas en el departamento de recursos humanos de una gran empresa y necesitas encontrar a todos los miembros del personal que ganen al menos $100,000 por año.

El resultado deseado es una lista de tuplas, cada una de las cuales consta de dos valores: el nombre del empleado y el salario anual del empleado.


In [45]:
employees = {"Alice" : 100000,
             "Bob": 99817,
             "Carol": 122908,
             "Frank": 88123,
             "Eve": 93121}

[(empleado, salario) for empleado,salario in employees.items() if salario >= 100_000]

[('Alice', 100000), ('Carol', 122908)]

Solución propuesta:

## Expresiones generadoras para encontrar empresas que pagan por debajo del salario mínimo


Supon que trabajas en el Departamento de Trabajo de EE. UU. y tu trabajo consiste en encontrar empresas que pagan por debajo del salario mínimo para que puedan iniciar una investigación adicional.

Tus datos son un diccionario de diccionarios que almacenan los salarios por hora de los empleados de la empresa. Se desea extraer una lista de empresas que pagan por debajo del salario mínimo de su estado (<$9) para al menos un empleado:

In [48]:
## Data

companies = {
                "CoolCompany" : {"Alice" : 33, "Bob" : 28, "Frank" : 29},
                "CheapCompany": {"Ann" : 4, "Lee" : 9, "Chrisi" : 7},
                "SosoCompany" : {"Esther" : 38, "Cole" : 8, "Paris" : 18}
            }

[empresa for empresa in companies if any(salario <9 for salario in companies[empresa].values() ) ]

['CheapCompany', 'SosoCompany']

In [60]:
any( salario < 9 for salario in companies["CoolCompany"].values())

False

In [53]:
datos = [(empresa, empleado, salario) for empresa, nomina in companies.items() for empleado, salario in nomina.items() if salario < 9]

import pandas as pd

pd.DataFrame(datos, columns = ["empresa", "empleado", "salario"])

[('CheapCompany', 'Ann', 4),
 ('CheapCompany', 'Chrisi', 7),
 ('SosoCompany', 'Cole', 8)]

Solución propuesta:

In [46]:
any([False, False, True])

True

In [47]:
all([False, False, True])

False