<span style="color:green">Introdução à Programação para Engenharias - scc0124</span>

<span style="color:blue">*Comprehension*</span><br>

*Moacir A. Ponti*<br>
*ICMC/USP São Carlos*

# Comprehension
 
Recurso que permite aplicar uma operação *para cada item de uma sequência* de forma eficiente. 

A sintaxe de um comprehension é:
```
lista = [expressao for variavel_local in objeto]
```
O resultado é equivalente a:
```
lista = []
for variavel_local in objeto:
    lista.append(expressao)
```

Porém, comprehension é executado de forma muito mais rápida. 

Tipicamente se emprega *comprehension* para construir listas ou dicionários.

---

Exemplo: criar uma lista com os valores entre -50 e 50 ao quadrado

In [1]:
quadr = [x**2 for x in range(-50,51)]

* `range(-50,51)` gera um intervalo entre -50 e 50
* comprehension eleva ao quadrado cada número `x` nesse intervalo
* o resultado é armazenado na lista `quadr`

In [2]:
print(quadr)

[2500, 2401, 2304, 2209, 2116, 2025, 1936, 1849, 1764, 1681, 1600, 1521, 1444, 1369, 1296, 1225, 1156, 1089, 1024, 961, 900, 841, 784, 729, 676, 625, 576, 529, 484, 441, 400, 361, 324, 289, 256, 225, 196, 169, 144, 121, 100, 81, 64, 49, 36, 25, 16, 9, 4, 1, 0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100, 121, 144, 169, 196, 225, 256, 289, 324, 361, 400, 441, 484, 529, 576, 625, 676, 729, 784, 841, 900, 961, 1024, 1089, 1156, 1225, 1296, 1369, 1444, 1521, 1600, 1681, 1764, 1849, 1936, 2025, 2116, 2209, 2304, 2401, 2500]


In [3]:
quadr_for = []
for x in range(-50,51):
    quadr_for.append(x**2)

In [4]:
print(quadr_for)

[2500, 2401, 2304, 2209, 2116, 2025, 1936, 1849, 1764, 1681, 1600, 1521, 1444, 1369, 1296, 1225, 1156, 1089, 1024, 961, 900, 841, 784, 729, 676, 625, 576, 529, 484, 441, 400, 361, 324, 289, 256, 225, 196, 169, 144, 121, 100, 81, 64, 49, 36, 25, 16, 9, 4, 1, 0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100, 121, 144, 169, 196, 225, 256, 289, 324, 361, 400, 441, 484, 529, 576, 625, 676, 729, 784, 841, 900, 961, 1024, 1089, 1156, 1225, 1296, 1369, 1444, 1521, 1600, 1681, 1764, 1849, 1936, 2025, 2116, 2209, 2304, 2401, 2500]


Podemos compará-los com o comando `%%timeit`

> É possível omitir a variável local caso essa não seja necessária.

In [5]:
import random as rd

n = 20
rand_num = [rd.randint(1,100) for _ in range(n)]
print(rand_num)

[78, 34, 17, 99, 53, 25, 51, 93, 79, 17, 72, 17, 32, 89, 29, 90, 69, 61, 93, 9]


---

#### <font color="blue">Exercício 7a.1 </font>

Codifique uma função que use comprehension para retornar uma lista com `n` valores numéricos iniciando em 0 e  com passo `p` permitindo um número float como passo. Arredonde cada número para 5 casas decimais usando a função `round(,5)`

Exemplo para n=8, p=0.05
```
[0.0, 0.05, 0.1, 0.15, 0.2, 0.25, 0.3, 0.35, 0.4]
```

In [6]:
def frange(n,p):
    lista = [round(x*p,5) for x in range(n+1)]
    return lista

In [7]:
lista = frange(8,0.05)
print(len(lista))

9


In [8]:
print(lista)

[0.0, 0.05, 0.1, 0.15, 0.2, 0.25, 0.3, 0.35, 0.4]


---
## Compreehension com filtragem

Combinado com `if` permite filtrar a sequência gerada
```python
variavel = [expressao for variavel_local in objeto if condicao]
```

O código acima é equivalente a:
```
variavel=[]
for variavel_local in objeto:
    if condicao:
        variavel.append(expressao)
```

Gerar o quadrado dos números entre -20 e 20, e montar uma lista apenas com os números ímpares resultantes

In [9]:
l = [x**2 for x in range(-20,21) if x%2 != 0]
print(l)

[361, 289, 225, 169, 121, 81, 49, 25, 9, 1, 1, 9, 25, 49, 81, 121, 169, 225, 289, 361]


Notar que ali a condição se refere à variável local `x`

#### Iterando por coleções

Na aula sobre conjuntos havia um exercício com uma função que retornasse apenas disciplinas com um certo mínimo de créditos.

Vamos fazer isso usando comprehensions

In [10]:
disciplinas = {('Programação', 4), ('Cálculo',4), ('Isostática',2), ('Semicondutores', 2),
                ('Manufatura Discreta',2), ('Análise real', 4), ('Seminários', 1), ('Processamento de Imagens', 3)}

In [11]:
mincred = 3
disciplinas_mincred = [(nome,cred) for (nome,cred) in disciplinas if cred >= mincred]
print(disciplinas_mincred)

[('Programação', 4), ('Processamento de Imagens', 3), ('Cálculo', 4), ('Análise real', 4)]


In [12]:
disciplinas_mincred_for = list()
for (nome,cred) in disciplinas:
    if (cred >= mincred):
        disciplinas_mincred_for.append((nome,cred))
print(disciplinas_mincred_for)        

[('Programação', 4), ('Processamento de Imagens', 3), ('Cálculo', 4), ('Análise real', 4)]


In [13]:
disciplinas_mincred == disciplinas_mincred_for

True

### Usando `if-else`

Podemos usar `else` mas nesse caso a estrutura deve vir **antes** do `for`:

```python
variavel = [<expressao> if <condicao> else <resultado_se_falso> for <variavel_local> in <objeto>]
```

> É útil quando temos um valor para substituir no caso em que a condição é falsa

In [14]:
# computando o quadrado dos números entre -20 e 20. Se o resultado for par, substituir por -1
l = [x**2 if x%2 != 0 else -1 for x in range(-20,21)]
print(l)

[-1, 361, -1, 289, -1, 225, -1, 169, -1, 121, -1, 81, -1, 49, -1, 25, -1, 9, -1, 1, -1, 1, -1, 9, -1, 25, -1, 49, -1, 81, -1, 121, -1, 169, -1, 225, -1, 289, -1, 361, -1]


---

#### <font color="blue">Exercício 7a.2 </font>

A partir de um vetor com números inteiros aleatórios, calcular seu `log` e criar uma lista com o resultado.
* se o número for 0 substituir o valor por `nan` (not a number) da biblioteca `math` para indicar que o resultado não é numérico

In [15]:
import random as rd

n = 25
rand_num = [rd.randint(0,10) for _ in range(n)]
print(rand_num)

[10, 7, 1, 2, 10, 2, 3, 7, 9, 9, 1, 2, 7, 2, 2, 7, 9, 3, 6, 3, 6, 3, 10, 7, 9]


## Comprehensions com iteração paralela em diferentes coleções

Aninhando comprehensions:
```
lista = [<expressao> for <var1,var2,...> in zip(<colecao1>,<colecao2>,...)]
```
O resultado do comando acima é equivalente a:
```python
lista=[]
for <var1,var2,...> in zip(<colecao1>,<colecao2>,...)
    lista.append(expressao)
```

Há várias situações em que é interessante percorrer duas coleções ou sequências

Para isso podemos usar a função `zip()` em que passamos as sequencias para o zip que irá retornar um elemento de cada por vez

```
zip(seq1, seq2, ... seq2n)
```

In [18]:
l1 = list(range(1,10))
l2 = list(range(0,26,2))
t1 = tuple(range(10,100,10))

print(l1)
print(l2)
print(t1)
print()

for i,j,t in zip(l1, l2, t1):
    print(i,j,t)

[1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24]
(10, 20, 30, 40, 50, 60, 70, 80, 90)

1 0 10
2 2 20
3 4 30
4 6 40
5 8 50
6 10 60
7 12 70
8 14 80
9 16 90


Note que a  `l2` possui mais elementos, nesse caso o `for` vai nivelar pela sequência de menor tamanho

---
Combinando com comprehensions, vamos usar essa idéia para percorrer duas listas e montar uma nova lista em que copiamos os elementos iguais, e atribuímos `False` nas posições em que as listas são diferentes

In [19]:
vals1 = [5, 5, 5, 1, 2, 3, 4, 6, 7, 7]
vals2 = [5, 5, 5, 1, 2, 4, 4, 6, 6, 7]

equal_pos = [x if x == y else False for (x,y) in zip(vals1, vals2)]
print(equal_pos)

[5, 5, 5, 1, 2, False, 4, 6, False, 7]


---

#### <font color="blue">Exercício 7a.3 </font>

Codifique uma função que receba como argumento duas listas de números com o mesmo tamanho. Use comprehension para retornar uma nova lista que é a multiplicação elemento-a-elemento das duas listas.  Caso as listas não possuam o mesmo tamanho emita uma mensagem de erro e retorne a constante `math.nan` do módulo `math`.

Exemplo:
```
l1 = [1, 2, 3, 4, 5]
l2 = [5, 5, 5, 10, 10]
multiplica_listas(l1,l2)

  [5, 10, 15, 40, 50]
```

---

## Comprehensions Aninhados (Nested Loops)

Aninhando comprehensions:
```
lista = [<expressao> for <var_local1> in <objeto1> if <condicao1>
                        for <var_local2> in <objeto2> if <condicao2>]
```
O resultado do comando acima é equivalente a:
```python
lista=[]
for var_local1 in objeto1:
    if condicao1:
        for var_local2 in objeto2:
            if condicao2:
                lista.append(expressao)
```

Uma aplicação é gerar o *produto cartesiano* entre duas coleções, ou seja, todas as combinações possíveis das duas coleções.

Mais formalmente, se $A$ e $B$ são conjuntos, o seu produto cartesiano é o conjunto de todos os pares $(a,b)$ em que $a \in A$ e $b \in B$.

In [20]:
A = ['a', 'b']
B = [10, 20, 30]

prod_cart = {(a,b) for a in A for b in B}
print("Com comprehension:", prod_cart)

# com for
prod_cart_for = set()
for a in A:
    for b in B:
        prod_cart_for.add((a,b))

print("Com for:          ", prod_cart_for)

Com comprehension: {('a', 30), ('a', 20), ('a', 10), ('b', 30), ('b', 20), ('b', 10)}
Com for:           {('a', 30), ('a', 20), ('a', 10), ('b', 30), ('b', 20), ('b', 10)}


In [21]:
A = ['a', 'b']
B = [10, 20, 30, 10, 10]

prod_cart = {(a,b) for a in A for b in B}
print(prod_cart)

{('a', 30), ('a', 20), ('a', 10), ('b', 30), ('b', 20), ('b', 10)}


#### Formando lista de listas

O elemento do comprehension pode ser uma coleção por exemplo para montar uma lista usamos:

In [22]:
lista1 = [x for x in range(1,6)]
print(lista1)

[1, 2, 3, 4, 5]


Inserindo esse comprehension num outro comprehension podemos repetí-lo

In [23]:
lista_listas = [[x for x in range(1,6)] for _ in range(3)]
print(lista_listas)

[[1, 2, 3, 4, 5], [1, 2, 3, 4, 5], [1, 2, 3, 4, 5]]


Num cenário mais complexo, podemos querer formar uma lista de listas com um padrão, em que cada lista possui valores 0, exceto por um elemento igual a 1 que equivale a sua posição.


Exemplo com 3 listas:
```
[[1, 0, 0],
 [0, 1, 0],
 [0, 0, 1]]
```

Vamos começar produzindo apenas a primeira linha

In [24]:
n = 3
pos = 0
linha = [1 if x == pos else 0 for x in range(n)]
print(linha)

[1, 0, 0]


Agora, como aninhar isso num outro comprehension que permita mudar a a posição?

In [25]:
n = 3
linhas = [[1 if x == pos else 0 for x in range(n)] for pos in range(n)]
print(linhas)

[[1, 0, 0], [0, 1, 0], [0, 0, 1]]


---

#### <font color="blue">Exercício 7a.4 </font>

Codifique uma comprehension que simule uma matriz de tamanho n x n, cujos elementos são dados por `(i+j*i)`, sendo `i` o índice da linha e `j` o índice da coluna. Para simular isso com uma lista de listas, o `i` corresponde ao índice da lista principal e o `j` aos índices das listas aninhadas.

Por exemplo, seja a segunda lista (posição i=1), o seu terceiro elemento (posição j=2) seria obtido por `1+2*1 = 3`

Exemplo com n = 3:
```
  [[0, 0, 0],
   [1, 2, 3],
   [2, 4, 6]] 
```

---

####  <font color="red">Desafio! Exercício 7a.5 </font>

Temos uma série de pontos 3D organizados numa lista e gostaríamos de computar as distâncias entre todos os pontos pareados.

Calcular a distância entre dois pontos $p1 = (x_1,y_1,z_1)$ e  $p2 = (x_2,y_2,z_2)$ usando a fórmula

$$d(p1,p2) = |x_1 - x_2| +|y_1 - y_2| + |z_1 - z_2|,$$
em que $|.|$ representa o valor absoluto.

Exemplo com 2 pontos organizados em listas:
```
[[1.0, 1.0, 1.0],
 [3.0, 3.0, 3.0]]
```

A saída deve ser:
```
[[0.0, 6.0],
 [6.0, 0.0]]
```

Note que a diagonal principal tem sempre valor zero já que representa a distância de um ponto para ele mesmo, e que a matriz é simétrica pois a distância entre dois pontos p1 e p2 é tal que: d(p1,p2) = d(p2,p1).

Para isso utilize uma única linha contendo comprehensions aninhadas e com iteração em paralelo

In [26]:
from math import fabs, fsum

pontos3d = [ [1.0, 1.0, 1.0],
             [0.0, 1.0, 3.0],
             [2.0, 2.0, 2.0],
             [0.0, 0.0, 0.0] ]

dists = [[fsum([fabs(a-b) for a,b in zip(p1,p2)]) for p2 in pontos3d] for p1 in pontos3d ]

for linha in dists:
    print(linha)

[0.0, 3.0, 3.0, 3.0]
[3.0, 0.0, 4.0, 4.0]
[3.0, 4.0, 0.0, 6.0]
[3.0, 4.0, 6.0, 0.0]
