#  I. Introducción a Python

## Comprensión de listas

### Introducción

A medida que sigas mejorando tus habilidades de programación en Python, encontrarás formas útiles de combinar algunos de los conceptos básicos que aprendiste anteriormente en el programa. En esta lección, aprenderemos acerca de la comprensión de listas. Las comprensiones de lista combinan los conceptos de almacenamiento en estructuras de datos, iteración, e incluso lógica condicional en una forma eficiente.

### Combinación de almacenamiento e iteración

La idea principal detrás de la comprensión de la lista es el almacenamiento iterativo. En algunas de las lecciones anteriores, nos hemos encontrado con escenarios en los que tuvimos que crear una lista vacía e iterar a través de un bucle para añadir un valor a la lista al final de cada iteración.

In [2]:
lst = []
 
for i in range(10):
    lst.append(i)
 
print(lst)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


En este ejemplo, creamos una lista vacía y para cada número de la gama, añadimos ese número a la lista a medida que lo encontramos.

### Comprensión de listas

La comprensión de una lista es una forma de racionalizar esa lógica en una sola línea de código Python. En lugar de crear una lista vacía y llenarla con el método del apéndice, los corchetes de la comprensión de la lista hacen que los resultados devueltos se empaqueten en una lista. A continuación se muestra el aspecto del ejemplo anterior como comprensión de la lista.

In [3]:
lst = [i for i in range(10)]
print(lst)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


Como pueden ver, obtenemos el mismo resultado con menos código, lo que generalmente es algo bueno. Dentro de los corchetes, pedimos el valor para cada valor en ese rango.

### Adición de condiciones a la comprensión de lista

También podemos incorporar declaraciones condicionales en nuestras listas de comprensión. Cuando se añaden condiciones, deben ser colocadas después del bucle for-loop apropiado para excluir los resultados que no satisfacen nuestra condición. El ejemplo siguiente devuelve cada valor en un rango pero sólo si el valor es mayor o igual a 5.

In [4]:
lst = [i for i in range(20) if i >= 5]
print(lst)

[5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]


La comprensión de la lista puede manejar un poco de complejidad. Incluso podemos incorporar la lógica condicional en las comprensiones de listas. Por ejemplo, supongamos que tuviéramos una lista de listas como la del ejemplo siguiente y quisiéramos extraer una lista de números pares que aparecen en listas anidadas de menos de 4 elementos de longitud. Podríamos lograrlo con una comprensión de lista que contenga dos para bucles y dos declaraciones condicionales como sigue.

In [5]:
lst_lst = [[1,2,3,4,5], [6,7,8], [9,10]]
 
lst = [y for x in lst_lst if len(x) < 4 for y in x if y % 2 == 0]
print(lst)

[6, 8, 10]


Tenga en cuenta que la condición para cada bucle viene directamente después del bucle para el que se aplica. Esta habilidad para manejar la lógica compleja con tal eficiencia hace que la comprensión de listas sea una herramienta muy poderosa para tener en su arsenal.

### Múltiples ciclos for en las comprensiones de listas

A veces nos encontramos con situaciones más complejas en las que se requieren múltiples bucles. Por ejemplo, supongamos que usted tiene algunas listas anidadas cuyos valores quiere desempaquetar en una sola lista. Usando listas regulares y para los bucles, lo haríamos de la siguiente manera.

In [6]:
lst_lst = [[1,2,3], [4,5,6], [7,8,9]]
 
lst = []
 
for x in lst_lst:
    for y in x:
        lst.append(y)
 
print(lst)

[1, 2, 3, 4, 5, 6, 7, 8, 9]


La comprensión de la lista nos proporciona una forma muy eficiente de manejar estos casos también. Para construir una comprensión de lista con múltiples para bucles, pediríamos el resultado final que queremos seguido de la serie de bucles. Esto puede parecer un poco confuso porque estamos pidiendo por adelantado el resultado que viene al final del último bucle, pero después de escribirlos durante un tiempo, encontrará que le ayuda a pensar en el resultado que quiere y luego en cómo obtenerlo.

In [7]:
lst_lst = [[1,2,3], [4,5,6], [7,8,9]]

lst = [y for x in lst_lst for y in x]
print(lst)

[1, 2, 3, 4, 5, 6, 7, 8, 9]


Observe que el orden de los bucles de la lista de comprensión es exactamente el mismo que el orden con el que lo habría escrito con el regular de los bucles. Estarás tentado a escribirlo al revés ( `[y para y en x para x en lst_lst]`), pero eso no devolverá el resultado que queremos. Así que recuerda que el orden de los bucles for es el mismo dentro de una comprensión de lista que fuera de la comprensión de lista.

### Usos prácticos para la comprensión de listas - Lectura de múltiples archivos

Un caso de uso en el que la comprensión de la lista es útil es cuando los datos se dividen en varios archivos. Por ejemplo, supongamos que tenemos un directorio de datos que contiene varios archivos CSV (entre otros archivos), cada uno con la misma información (columnas) para grupos o divisiones separadas. Podríamos usar una comprensión de la lista con una condición endswith('.csv') en ella para obtener una lista sólo de los archivos CSV de ese directorio. Podríamos usar otra comprensión de la lista para que Pandas lea cada uno de esos archivos y luego el método pd.concat para combinarlos todos en un único conjunto de datos que podamos analizar como sigue.

In [18]:
import os
import pandas as pd
 
file_list = [f for f in os.listdir('../data/data') if f.endswith('.csv')]
data_sets = [pd.read_csv(os.path.join('../data/data', f)) for f in file_list]
data = pd.concat(data_sets, axis=0)

### Selección de columnas del marco de datos con base a las condiciones

Otro caso de uso sería la selección de las columnas del marco de datos en base a una condición que tienen en común. En el ejemplo que figura a continuación se lee nuestro archivo de datos de vehículos, se utiliza el método _get_numeric_data para recuperar todas las columnas numéricas y luego se utiliza una comprensión de la lista para devolver sólo las columnas que tienen una media superior a 15.

In [22]:
data = pd.read_csv('../data/vehicles/vehicles.csv')

selected_columns = [col for col in data._get_numeric_data() if data[col].mean() > 15]
print(selected_columns)

['Year', 'Fuel Barrels/Year', 'City MPG', 'Highway MPG', 'Combined MPG', 'CO2 Emission Grams/Mile', 'Fuel Cost/Year']


### Más ejercicios de comprensión de listas

#### Listas

Una lista es un conjunto de elementos de cualquier tipo que se ponen entre corchetes y se separan mediante comas, por ejemplo:

In [23]:
lst=[10,24,3,4,65,6,722,8,9]

Podemos acceder a cada elemento mediante un ciclo for imprimiendo cada elemento `e`

In [24]:
for e in lst:
    print (e)

10
24
3
4
65
6
722
8
9


De la misma manera podemos hacer operaciones matemáticas con cada elemento de la lista y seleccionar los elementos desados con base a alguna condición en un ciclo `for`. A continuación se imprimen aquellos elementos pares de la lista.

In [25]:
for e in lst:
    if e%2==0:
        print (e)

10
24
4
6
722
8


Otra manera de generar listas es mediante la generación de iterables, que no son otra cosa que listas. la función `range` genera una lista de números enteros consecutivos que inicia por default en 0  y va incrementandose de uno en uno hasta un número de terminado, lo que puede ser modificado a conveniencia mediante dos parámetros adicionales. En caso de solo indicar un parámetro este será el número de elementos de la lista. Por lo anterior debe considerarse que  se tendrán numeros de `0 a n-1` siendo `n` el número ingresado en la función. Por ejemplo tomando la longitud de la lista definida previamente con la función `len` obtenemos un interable u otra lista con el número de elementos de la lista definada: 

In [26]:
for i in range(len(lst)):
    print (i)

0
1
2
3
4
5
6
7
8


Por ejemplo, asignando todos los parámetros a la función `range` si le indicamos que comience en 1, que queremos un elemento más que la longitud de la lista `lst`y que incremente cada elemento en pasos de 3 en 3, nos quedaría como sigue:

In [27]:
for i in range(1, len(lst)+1, 3):
    print (i)

1
4
7


Contamos para el control de ciclos for y el manejo de listas con la función `enumerate` que entrega dos valores, el primero es el índice de las listas y el segundo el elmenento de la lista. Observa el ejemplo utilizando la lista descrita con anterioridad: 

In [28]:
for i,e in enumerate(lst):
    print (i,e)

0 10
1 24
2 3
3 4
4 65
5 6
6 722
7 8
8 9


Para agregar elementos a las listas (recordemos que son dinámicas) utilizaremos el método `append` esto agregará un elemento al final de lista. Consideremos una lista vacia a la que le iremos agregando elementos mediante un ciclo `for`y el método `append`:

In [29]:
lst=[]
for i in range(20):
    lst.append(i)
print (lst)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]


Tambien podemos  agergar elementos haciendo un cálculo previo e ir guardando nuestros resultados, lo que es múy útil para general listas con números que pueden ir describiendo una función acumulativa, o una   función de cualquier tipo.

In [30]:
a=5
for i in range(5):
    a+=.1
    print (a)

5.1
5.199999999999999
5.299999999999999
5.399999999999999
5.499999999999998


Como mencioné anteriormente una lista puede contener cualquier tipo de elemento, incluso otras listas, y estas no necesariamente deben de ser de la lisma longitud o profundidad, aunque la simetría de los elementos nos ayuda a calcular la ubicación de los elementos. A continuación se genera una lista de listas mediante un ciclo `for`

In [31]:
lst_lst=[]
for i in range(0,9,3):
    lst_lst.append([i+1, i+2, i+3])
print (lst_lst)

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]


Para acceder a cada lista, al estar en el primer nivel de esta la invocamos  con su índice:

In [32]:
lst_lst[0]

[1, 2, 3]

Para entrar a los elementos de cada sub-lista, debemos encadenar los índices en orden según su profundidad, de modo que el segundo elemento de la primera lista deberá buscarse con los índices `[0][1]`recordando que los índices de las listas funcionan con el formato `n-1`

In [33]:
lst_lst[0][1]

2

La comprensión de listas se usa precimenta para sintetizar la dedclaración y creación de listas mediante un ciclo for, asignando directamente los valores a la lista integrando el ciclo `for` a la declaración de la lista, por lo que para crear la lista que hice con anterioridad lo harémos de la siguiente forma:

In [34]:
lst_lst=[[i, i+1, i+2] for i in range(1,10,3)]
print(lst_lst)

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]


*In[22]

## Diccionarios, Conjuntos y Tuplas