# Aula VI - List Comprehensions

O paradigma de programação funcional trata loops como a aplicação de uma função (o corpo do loop) à uma coleção de objetos (o iterável do loop). Hoje veremos como utilizar uma das ferramentas de programação funcional, as list comprehensions, para simplificar a execução de um padrão comum.

## Criando listas com loops

Vimos um padrão ocorer algumas vezes tanto em aula quanto nos labs: criamos uma lista vazia, utilizamos um loop para percorrer um iterável e guardamos o resultado deste loop em nossa lista vazia. Vamos ver um exemplo simples desse padrão:

In [4]:
# crie uma lista que tenha os número de outra lista ao quadrado
lista_orig = [1, 2, 6, 10, 24, 42]
lista_vazia = []
for i in lista_orig:
    lista_vazia.append(i ** 2)

print(lista_vazia)

[1, 4, 36, 100, 576, 1764]


## Comprehensions

As `list comprehensions` existem para simplificar a construção deste padrão! Ao invés de criar uma lista e fazer um loop, criaremos a `lista_vazia` de forma que ela já execute este loop.

In [3]:
lista_orig = [1, 2, 6, 10, 24, 42]
new_lc = [item**2 for item in lista_orig]
print(new_lc)

[1, 4, 36, 100, 576, 1764]


In [8]:
[item for item in range(10)]

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

## Funções em `list comprehensions`

Vimos na introdução que o paradigma funcional é pensado a partir da aplicação de funções à conjuntos. Sendo assim, é natural que podemos aplciar funções dentro de uma `list comprehension`!

In [5]:
def quadrado(x):
    '''
    Retorna o quadrado de um número.
    Parameters:
        x Float: número a ser elevado ao quadrado
    Returns:
        Float: x ao quadrado
    '''
    return x ** 2

new_lc = [quadrado(x) for x in range(10)]

In [6]:
print(new_lc)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


Podemos construir filtros complexos utilizando todos os operadores lógicos que usamos em condicionais normais:

In [26]:
new_lc = [x for x in range(10) if x > 5 or x < 2]
print(new_lc)

[0, 1, 6, 7, 8, 9]


## Filtros em `list comprehension`

Vimos até agora formas de aplicar funções (definidas explicitamente ou implicitamente) aos elementos de um iterável utilizando `list comprehension`. No entanto, muitos loops que seguem este padrão não são tão simples. Vamos ver um destes casos: a aplicação de um filtro sobre os elementos do iterável.

In [14]:
new_list = []

for item in range(10):
    if item % 2 == 0:
        new_list.append(item)
        
print(new_list)

[0, 2, 4, 6, 8]


O loop acima utiliza o operador `%` para verificar se um número é par ou impar, e guarda em nossa lista vazia apenas os números pares.

Para conseguir replica-lo em uma `list comprehension` precisamos aprender uma nova forma de sintáxe:

In [7]:
new_lc = [x for x in range(10) if x % 2 == 0]
print(new_lc)

[0, 2, 4, 6, 8]


As `list comprehension` condicionais tem todas as funcionalidades: podemos realizar operações com os elementos do iterável e podemos aplicar funções.

In [16]:
new_list = []

for item in range(10):
    if item % 2 == 0:
        new_list.append(item ** 2)
        
print(new_list)

[0, 4, 16, 36, 64]


In [17]:
new_lc = [x ** 2 for x in range(10) if x % 2 == 0]
print(new_lc)

[0, 4, 16, 36, 64]


In [8]:
def gosto_de_pares(x):
    '''
    Retorna o string 'Woop!' quando um número é par e o
    string 'BOOOO!' quando o número é impar.
    Parameters:
        x Integer: número a ser analisado
    Returns:
        string: Woop! ou BOOOO!
    '''
    if x % 2 == 0:
        return 'Woop!'
    else:
        return 'BOOOO!'

In [10]:
new_lc = []

for i in range(10):
    if i % 2 == 0:
        new_lc.append(gosto_de_pares(i))

print(new_lc)

['Woop!', 'Woop!', 'Woop!', 'Woop!', 'Woop!']


In [12]:
new_lc = [gosto_de_pares(x) for x in range(10) if x % 2 == 0]
print(new_lc)

['Woop!', 'Woop!', 'Woop!', 'Woop!', 'Woop!']


## Dois loops `for`

Até agora utilizamos as `comprehensions` para percorrer listas simples (o equivalente de **um** loop `for`). Mas, como vimos no pré-work e nas primeiras aulas, podemos executar loops dentro de loops. Um exemplo simples é percorrendo listas de listas (ou listas de tuplas).

Vamos ver um caso dessa aplicação e como resolver o mesmo problema através de `list comprehensions`. Temos uma lista de listas e precisamos guardar, em uma lista chata, os elementos das listas internas que forem maior que 5.

In [13]:
list_of_lists = [[1,2,3,4], [5,6,7,8], [1,3,6,8]]
my_results = []

for lista in list_of_lists:
    for item in lista:
        if item > 5:    
            my_results.append(item)
#
print(my_results)

[6, 7, 8, 6, 8]


A sintáxe do loop duplo é um pouco complexa nas `comprehensions` então precisamos prestar atenção na ordem dos elementos:

- **O QUE VAMOS FAZER** a função que vamos aplicar

- **for lista in list_of_lists** percorre a lista de listas, extraindo cada lista

- **for item in lista** percorre os items de cada lista

- **CONDICIONAL** quando aplicamos a função e guardamos o resultado


In [20]:
new_lc = [
    item
    for lista in list_of_lists
    for item in lista 
    if item > 5
    ]

In [21]:
print(new_lc)

[6, 7, 8, 6, 8]


A forma mais comum de escrever esse tipo de operação é em uma linha só:

In [22]:
new_lc = [item for lista in list_of_lists for item in lista  if item > 5]

## Aplicação condicional de Funções

Além de poder filtrar os elementos sobre o qual aplicamos uma função, podemos utilizar condicionais em um loop para aplicar funções diferentes.

In [23]:
lst = []
for item in range(10):
    if item < 5:
        lst.append(0)
    else:
        lst.append(1)
print(list(range(10)))
print(lst)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 0, 0, 0, 0, 1, 1, 1, 1, 1]


In [25]:
new_lc = [
    0 if i < 5 
    else 1 
    for i in range(10)
    ]
print(list(range(10)))
print(new_lc)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 0, 0, 0, 0, 1, 1, 1, 1, 1]


## Iteração dupla

Vimos que podemos 'desempacotar' valores na declaração de um loop - podemos fazer o mesmo em `comprehensions`.

In [27]:
lista_uplas = [(19, 2), (12, 3), (12, 4), (15, 2)]
lista_vazia = []

for x, y in lista_uplas:
    lista_vazia.append(x ** y)

print(lista_vazia)

[361, 1728, 20736, 225]


Vejamos a sintaxe em `comprehensions`:

In [28]:
lista_uplas = [(19, 2), (12, 3), (12, 4), (15, 2)]

new_lc = [x ** y for x, y in lista_uplas]
print(new_lc)

[361, 1728, 20736, 225]


# Aplicações
Vamos ver como podemos utilizar programação funcional para simplificar nosso código em situções práticas.

## Aplicação - Filtrando Arquivos pela Extensão

Vamos utilizar a função `os.listdir()` para construir uma lista com o nome de todos os arquivos em uma pasta. Precisamos filtrar esses nomes a partir da extensão de cada arquivo, mantendo apenas os arquivos `.csv`

In [33]:
import os
lista_arquivos = os.listdir('data/arquivos/')
print(lista_arquivos)

['.DS_Store', 'knn.png', 'PLS.png', 'boosting.png', 'sample_1.csv', 'sample_2.csv', 'ensemble.png', 'sample_3.csv', 'sample_2.txt', 'sample_3.txt', 'sample_1.txt']


### Solução Tradicional

In [None]:
lista_csv = []
for file in lista_arquivos:
    if file.lower().endswith('csv'):
        lista_csv.append(file)

print(lista_csv)

### Solução Funcional

In [34]:
lista_csv = [file for file in lista_arquivos if file.lower().endswith('csv')]
print(lista_csv)

## Aplicação - Dados Geográficos

Temos uma lista de pontos Lat/Long que precisamos percorrer, processando apenas os pontos que estejam no hemisfério Sul ou no hemisfério Oeste. Precisamos guardar uma dupla representando os hemisférios desses pontos: ('S', 'O') por exemplo.

### Solução Tradicional

In [None]:
lista_coords = [(-19, -36), (-37, 40), (22, -37), (51, -7), (33, 22), (-39, -8)]
lista_hem = []
for lat, long in lista_coords:
    if lat < 0:
        hem_lat = 'S'
    else:
        hem_lat = 'N'
    
    if long < 0:
        hem_long = 'O'
    else:
        hem_long = 'L'
    
    if hem_lat == 'S' or hem_long == 'O':
        lista_hem.append((hem_lat, hem_long))

print(lista_hem)

### Solução Funcional

In [None]:
# DESAFIO!