# üéØ Aula 3 - List Comprehension e Express√µes geradorasüéØ<br>

# Caso real

O time de marketing est√° prestes a lan√ßar uma campanha de um novo programa de refinanciamento de d√≠vidas voltados para devedores em condi√ß√µes extremas. Eles querem ter uma ideia de quantas pessoas podem ser impactadas pela campanha e quais os poss√≠veis clientes para iniciar a estrat√©gia. 

Como analista de dados em uma institui√ß√£o financeira, voc√™ foi encarregado de auxiliar o time de marketing na identifica√ß√£o do p√∫blico-alvo. O time de marketing pediu para enviar uma lista de poss√≠veis clientes-alvo para iniciar a campanha dentro das regioes dos estados de MG, SP e RJ.

Segue os dados de clientes fornecidos para an√°lise:

``` json
contas_bancarias = [
    {"numero": "123456", "saldo": -100.50, "estado": "SP"},
    {"numero": "789012", "saldo": 200.30, "estado": "RJ"},
    {"numero": "345678", "saldo": -50.70, "estado": "SP"},
    {"numero": "901234", "saldo": -300.00, "estado": "MG"},
    {"numero": "567890", "saldo": 150.75, "estado": "MG"},
    {"numero": "234567", "saldo": -20.00, "estado": "RJ"},
    {"numero": "890123", "saldo": -10.50, "estado": "SP"},
    {"numero": "456789", "saldo": 50.25, "estado": "SP"},
    {"numero": "012345", "saldo": -75.80, "estado": "MG"},
    {"numero": "678901", "saldo": -200.00, "estado": "RJ"},
    ...
]
```

Como voc√™ faria para resolver esta quest√£o?

# List Comprehension

Compreens√£o de listas √© uma das maneiras mais <s>r√°pidas e elegantes</s> pythonicas de se criar uma lista:<br>

```python
novaLista = [expressao for item in algoIteravel]
```

In [None]:
# criando uma lista a partir de list comprehension de 0 a 100
%%timeit
listaZeroACem = [i for i in range(101)]

4.32 ¬µs ¬± 215 ns per loop (mean ¬± std. dev. of 7 runs, 100000 loops each)


Vamos comparar com o `for` que cria uma lista sem utilizar o list comprehension:

In [2]:
# criando uma lista de 0 a 100 a partir de for e append
%%timeit
listaZeroACem = []

for i in range(101):
    listaZeroACem.append(i)

18.2 ¬µs ¬± 1.72 ¬µs per loop (mean ¬± std. dev. of 7 runs, 100,000 loops each)


Podemos peceber que o tempo de execu√ß√£o do list comprehension √© **menor** que o for tradicional.<br>
Ou seja, o list comprehension √© mais **otimizado** neste caso.

**OBS.:** Ao usar %%timeit em uma c√©lula do Jupyter Notebook, o c√≥digo contido na c√©lula √© executado v√°rias vezes e o tempo m√©dio de execu√ß√£o √© calculado. Isso ajuda a obter uma medi√ß√£o mais precisa e est√°vel do tempo de execu√ß√£o, j√° que fatores como flutua√ß√µes de carga do sistema podem afetar as medi√ß√µes individuais.

Vamos ent√£o colocar em pr√°tica:

In [3]:
# criar uma lista de 0 a 100 SOMENTE com numeros divisiveis por 3 e zero
listaParesZeroACem = [i for i in range(0, 101, 3)]
print(listaParesZeroACem)

[0, 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 51, 54, 57, 60, 63, 66, 69, 72, 75, 78, 81, 84, 87, 90, 93, 96, 99]


## Adicionando condicionais

Imagine agora que temos uma lista de strings. Como voc√™ faria para selecionar somente emails dessa lista?

In [9]:
%%timeit
# criar uma lista filtrando somente emails
lista_strings = [
    "joao@gmail.com",
    "123456",
    "exemplo.com",
    "fulano@yahoo.com",
    "beltrano",
    "ciclano@gmail.com",
    "teste",
    "outroexemplo.com",
    "enivaldo@gmail.com"
]

emails = []

for item in lista_strings:
    if '@' in  item:
        emails.append(item)

841 ns ¬± 130 ns per loop (mean ¬± std. dev. of 7 runs, 1,000,000 loops each)


Podemos incrementar nossa list comprehension com a seguinte estrutura:

```python
novaLista = [expressao for item in algoIteravel if condicao == True]
```

In [10]:
%%timeit


emails = [item for item in lista_strings if '@' in item]

1.09 ¬µs ¬± 106 ns per loop (mean ¬± std. dev. of 7 runs, 1,000,000 loops each)


Agora vimos que neste caso o list comprehension n√£o foi o mais otimizado :(<br>
Por isso, varia de caso a caso...

Imagine agora que queremos classificar se o texto √© um email ou n√£o. <br>
Para isso, vamos ver a √∫ltima estrutura elementar de _List Comprehension_:

```python
novaLista = [valor1 if condicao else valor2 for item in algoIteravel ]
```


In [None]:
# criar uma lista que classifica se o text √© email ou n√£o
lista_strings = [
    "joao@gmail.com",
    "123456",
    "exemplo.com",
    "fulano@yahoo.com",
    "beltrano",
    "ciclano@gmail.com",
    "teste",
    "outroexemplo.com",
    "enivaldo@gmail.com"
]

is_email = [True if '@' in item else False for item in lista_strings]

## For aninhados


Podemos ainda aninhar _fors_ em nossa estrutura com a seguinte estrutura:

```python
novaLista = [valor1 for sublista in algoIteravel for item in sublista]
```

E tamb√©m √© poss√≠vel adicionar condicionais neste caso.

Imagine que temos um dicionario de listas de clientes por regi√£o (soa familiar?) e estamos interessados somente nos clientes de id '123456' e '789012'. Retorne os indices para obter estes clientes:

In [13]:
# contas por regiao
dict_contas = {
    'SP': ['123456', '345678', '890123', '456789'],
    'RJ': ['789012', '234567', '678901'],
    'MG': ['901234', '567890', '012345']
}

# identificar os indices que retorna onde est√£o os ids dos clientes de interesse
# usar list comprehension
ids_de_interesse = ['123456','789012']

loc_ids = [(k, dict_contas[k].index(id)) for k in dict_contas.keys() for id in dict_contas[k] if id in ids_de_interesse]

## HANDS-ON

1) Dada uma lista de lista de 3 em 3 numeros de 1 a 9, simplifique para uma unica lista com todos os numeros.

In [None]:
listaAninhada = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
listaContinua = [it for sublista in listaAninhada for it in sublista]
print(listaContinua)

[1, 2, 3, 4, 5, 6, 7, 8, 9]


2. Crie uma lista que multiplica **cada** numero de uma lista1 pela outra lista2:

In [None]:
lista1 = [1, 2, 3]
lista2 = [6, 0, 8]
lista1_pela_2 = [it1 *it2 for it1 in lista1 for it2 in lista2]
print(lista3)

[6, 14, 24]


## Extra: filtros e mappings

Podemos usar a compreens√£o de listas para filtrar elementos, mapear elementos para uma nova forma ou combinar elementos de diferentes sequ√™ncias.

Exemplos pr√°ticos de compreens√£o de listas:

* **Filtragem**: [x for x in lista if condi√ß√£o] - cria uma nova lista contendo apenas os elementos que atendem √† condi√ß√£o especificada.

* **Mapeamento**: [mapping(x) for x in lista] - cria uma nova lista aplicando um mapping a cada elemento da lista original.

**Filtragem:**

Suponha que temos uma lista de n√∫meros e queremos criar uma nova lista contendo apenas os n√∫meros pares.

In [1]:
numeros = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
pares = [x for x in numeros if x % 2 == 0]
print(pares)

[2, 4, 6, 8, 10]


**Mapeamento:**

Suponha que temos uma lista de nomes e queremos criar uma nova lista contendo o comprimento de cada nome.

In [2]:
nomes = ["Alice", "Bob", "Charlie", "David"]
comprimentos = [len(nome) for nome in nomes]
print(comprimentos)

[5, 3, 7, 5]


-----

# Express√µes geradoras

As express√µes geradoras s√£o estruturas semelhantes √† compreens√£o de listas, mas geram valores √† medida que s√£o necess√°rios em vez de criar uma nova lista completa, e n√£o armazenados em lugar algum da mem√≥ria (_lazy generation_).<br>
Elas s√£o criadas usando a mesma sintaxe b√°sica da compreens√£o de listas, utilizando par√™nteses ao inv√©s de colchetes.


In [15]:
numeros = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
#criar um gerador de numero pares da lista acima
gerador = (x for x in numeros if x % 2 == 0)

No caso acima, geramos uma express√£o que retorna todos os n√∫meros pares da lista `n√∫meros`.<br>
Mas os n√∫meros n√£o est√£o gerados. Observe o resultado:

In [16]:
# chamar o gerador (o que acontece?)
gerador

<generator object <genexpr> at 0x0000022937D631D0>

Para obter o resultado, precisamos iterar sobre a express√£o geradora:

In [17]:
# Iterando sobre a express√£o geradora
for numero in gerador:
    print(numero)

2
4
6
8
10


Mas temos um por√©m: n√£o √© poss√≠vel obter os dados novamente ap√≥s utilizar a express√£o geradora:

In [18]:
# Iterando sobre a express√£o geradora (novamente)
for numero in gerador:
    print(numero)

**Mas qual a necessidade da express√£o geradora ent√£o?** √µ.√≥

As express√µes geradoras s√£o particularmente √∫teis quando trabalhamos com grandes volumes de dados, pois evitam o armazenamento em mem√≥ria de uma lista completa. Al√©m disso, elas s√£o adequadas para lidar com sequ√™ncias infinitas, onde n√£o seria poss√≠vel criar uma lista completa.

**Filtrando palavras por tamanho:**

In [11]:
frase = "Eu gosto de programar em Python"
gerador = (palavra for palavra in frase.split() if len(palavra) > 2)

# Imprimindo palavras com mais de 2 caracteres
for palavra in gerador:
    print(palavra)

gosto
programar
Python


# Fun√ß√µes geradoras e a palavra reservada yield

Mas o que fazer quando os dados s√£o imensos (ou talvez infinitos) e n√£o seja poss√≠vel realizar uma simples transforma√ß√£o ou filtragem?

Ent√£o √© necess√°rio criar uma express√£o geradoras mais sofisticada, as **fun√ß√µes geradoras**.

Mas, para criarmos um fun√ß√£o geradora, precisamos entender como utilizar a palavra **yield**, e pra entendermos, precisamos entender o que s√£o **iteradores** vs iteraveis.

## iteradores vs iteraveis

Todo objeto que cont√©m dados e conseguimos percorrer pelo la√ßo `for` √© um **iter√°vel**.<br>
Por exemplo, uma lista, uma string. Os iter√°veis possuem seus dados armazenados na mem√≥ria e, por tanto, podemos acessar sempre que chamamos o objeto.

Por outro lado, **iteradores** s√£o objetos que geram os dados √† medida que √© pedido (soa familiar?).<br>
Portanto, uma express√£o geradora √© um iterador.

Podemos criar iteradores a partir de uma lista, utilizando `iter`:

```python
lista = [0,10,11,9,4,3]
iterador = iter(lista)
```

## Yield

A palavra reservada **yield** (tradu√ß√£o: _produzir_) √© usada em Python para criar uma **fun√ß√£o geradora**. <br>
Yield √© muito semelhante a palavra _return_ nas fun√ß√µes que aprendemos:

ao utilizar _yield_ em uma fun√ß√£o geradora, a fun√ß√£o **pausa** naquele ponto, retornando o valor pedido (at√© a√≠ igual ao _return_). 
Por√©m, ao ser chamada novamente, a fun√ß√£o continua de onde parou at√© um pr√≥ximo yield. E assim por diante, at√© terminar a fun√ß√£o.

Aqui est√° um exemplo simples para ilustrar o uso da palavra yield em uma fun√ß√£o geradora:

In [19]:
# gerador de numeros pares (indicar uma flag de inicio da funcao)
def numeros_pares():
    n = 0
    print('inicio da funcao')
    while True:
        yield n
        n += 2

gerador = numeros_pares()

Sempre que quisermos chamar os valores da fun√ß√£o geradora, utilizamos a fun√ß√£o `next`, que retorna o pr√≥ximo valor a ser gerado pela fun√ß√£o geradora.

In [20]:
print(next(gerador))  # Sa√≠da: 0
print(next(gerador))  # Sa√≠da: 2
print(next(gerador))  # Sa√≠da: 4

inicio da funcao
0
2
4


Repara que a flag de inicio da fun√ß√£o foi printada apenas uma vez (sabe dizer o porqu√™?). Qual seria o resultado se fosse uma fun√ß√£o?

# Dicas e Boas Pr√°ticas

Deu pra perceber que agora as coisas ficaram um pouco mais sofisticadas, n√£o √© mesmo? Mas n√£o adianta utilizar tudo o que aprendeu se n√£o consegue passar clareza e interpretabilidade para as outras pessoas que v√£o reutilizar analisar ou revisar o teu c√≥digo. Portanto, v√£o aqui algumas dicas:

**Legibilidade do c√≥digo:**

Ao utilizar compreens√£o de listas e express√µes geradoras, √© importante manter o c√≥digo leg√≠vel e compreens√≠vel. Evite criar express√µes muito complexas ou muito longas, pois isso pode dificultar a leitura e manuten√ß√£o do c√≥digo.
Utilize nomes significativos para as vari√°veis dentro das express√µes, de forma a tornar o prop√≥sito do c√≥digo mais claro.

**Utilize coment√°rios:**

Adicione coment√°rios explicativos quando utilizar compreens√£o de listas e express√µes geradoras complexas, especialmente se elas tiverem v√°rias etapas ou condi√ß√µes.
Coment√°rios ajudam a documentar o c√≥digo e torn√°-lo mais f√°cil de entender para voc√™ e outros desenvolvedores.

**Considere o desempenho:**

Embora as compreens√µes de listas e as express√µes geradoras sejam ferramentas poderosas, √© importante considerar o desempenho ao utiliz√°-las.
Se estiver lidando com uma grande quantidade de dados, uma express√£o geradora pode ser mais eficiente em termos de uso de mem√≥ria e tempo de execu√ß√£o em compara√ß√£o com a cria√ß√£o de uma lista completa.
No entanto, √© sempre recomend√°vel fazer medi√ß√µes e testes para avaliar o desempenho real do seu c√≥digo em cen√°rios espec√≠ficos.

**Combine com outras funcionalidades:**

As compreens√µes de listas e express√µes geradoras podem ser combinadas com outras funcionalidades da linguagem Python, como fun√ß√µes embutidas (map, filter, etc.) e m√≥dulos especializados (como itertools) para realizar opera√ß√µes mais avan√ßadas.
Explore a documenta√ß√£o da linguagem Python para descobrir recursos e funcionalidades adicionais que possam aprimorar suas compreens√µes de listas e express√µes geradoras.
Lembre-se de encorajar seus alunos a praticar e experimentar por conta pr√≥pria. Eles podem tentar resolver problemas utilizando compreens√£o de listas e express√µes geradoras, para aprimorar sua familiaridade e habilidades com esses conceitos.

# Exerc√≠cios - Regra: Tudo deve ser feito em **UMA** linha!

Encontre todos os n√∫meros divisiveis por 8 de 1 a 1000 (intervalo fechado)

In [None]:
print([x for x in range(8, 1001, 8)])

[8, 16, 24, 32, 40, 48, 56, 64, 72, 80, 88, 96, 104, 112, 120, 128, 136, 144, 152, 160, 168, 176, 184, 192, 200, 208, 216, 224, 232, 240, 248, 256, 264, 272, 280, 288, 296, 304, 312, 320, 328, 336, 344, 352, 360, 368, 376, 384, 392, 400, 408, 416, 424, 432, 440, 448, 456, 464, 472, 480, 488, 496, 504, 512, 520, 528, 536, 544, 552, 560, 568, 576, 584, 592, 600, 608, 616, 624, 632, 640, 648, 656, 664, 672, 680, 688, 696, 704, 712, 720, 728, 736, 744, 752, 760, 768, 776, 784, 792, 800, 808, 816, 824, 832, 840, 848, 856, 864, 872, 880, 888, 896, 904, 912, 920, 928, 936, 944, 952, 960, 968, 976, 984, 992, 1000]


---

FacÃßa um programa que escreva todos os nuÃÅmeros muÃÅltiplos de 7 entre 1 e N, sendo N um valor introduzido pelo usu√°rio. Por exemplos: 7, 14, 21, 28, 35.

In [None]:
print([x for x in range(7, int(input("At√© onde deseja saber a tabuada do 7? "))+1, 7)])

At√© onde deseja saber a tabuada do 7? 35
[7, 14, 21, 28, 35]


---

Fa√ßa uma lista com todos n√∫meros entre 1 e 1000 (intervalo fechado) que tenha pelo menos um d√≠gito "6" nele

In [None]:
print([x for x in range(1, 1001) if "6" in str(x)])

[6, 16, 26, 36, 46, 56, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 76, 86, 96, 106, 116, 126, 136, 146, 156, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 176, 186, 196, 206, 216, 226, 236, 246, 256, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 276, 286, 296, 306, 316, 326, 336, 346, 356, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 376, 386, 396, 406, 416, 426, 436, 446, 456, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 476, 486, 496, 506, 516, 526, 536, 546, 556, 560, 561, 562, 563, 564, 565, 566, 567, 568, 569, 576, 586, 596, 600, 601, 602, 603, 604, 605, 606, 607, 608, 609, 610, 611, 612, 613, 614, 615, 616, 617, 618, 619, 620, 621, 622, 623, 624, 625, 626, 627, 628, 629, 630, 631, 632, 633, 634, 635, 636, 637, 638, 639, 640, 641, 642, 643, 644, 645, 646, 647, 648, 649, 650, 651, 652, 653, 654, 655, 656, 657, 658, 659, 660, 661, 662, 663, 664, 665, 666, 667, 668, 669, 670, 671, 672, 673, 674, 675, 676, 677, 678, 679, 680, 681, 682, 683, 684, 685, 686, 687, 688, 689,

---

Quantas vezes o n√∫mero 6 aparece entre 1 e 1000 (intervalo fechado)?

In [None]:
print(sum([str(x).count("6") for x in range(1, 1001)]))

300


---

Use compreens√£o de listas aninhadas para encontrar todos os numeros entre 1-1000 (intervalo fechado) divisiveis por qualquer n√∫mero entre 2-9 (intervalo fechado)

In [None]:
print([x for x in range(1, 1001) if True in [x % y == 0 for y in range(2, 10)]])

[2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 15, 16, 18, 20, 21, 22, 24, 25, 26, 27, 28, 30, 32, 33, 34, 35, 36, 38, 39, 40, 42, 44, 45, 46, 48, 49, 50, 51, 52, 54, 55, 56, 57, 58, 60, 62, 63, 64, 65, 66, 68, 69, 70, 72, 74, 75, 76, 77, 78, 80, 81, 82, 84, 85, 86, 87, 88, 90, 91, 92, 93, 94, 95, 96, 98, 99, 100, 102, 104, 105, 106, 108, 110, 111, 112, 114, 115, 116, 117, 118, 119, 120, 122, 123, 124, 125, 126, 128, 129, 130, 132, 133, 134, 135, 136, 138, 140, 141, 142, 144, 145, 146, 147, 148, 150, 152, 153, 154, 155, 156, 158, 159, 160, 161, 162, 164, 165, 166, 168, 170, 171, 172, 174, 175, 176, 177, 178, 180, 182, 183, 184, 185, 186, 188, 189, 190, 192, 194, 195, 196, 198, 200, 201, 202, 203, 204, 205, 206, 207, 208, 210, 212, 213, 214, 215, 216, 217, 218, 219, 220, 222, 224, 225, 226, 228, 230, 231, 232, 234, 235, 236, 237, 238, 240, 242, 243, 244, 245, 246, 248, 249, 250, 252, 254, 255, 256, 258, 259, 260, 261, 262, 264, 265, 266, 267, 268, 270, 272, 273, 274, 275, 276, 278, 279, 280, 282,

---

Fa√ßa uma lista com o(s) maior(es) valor(es) de uma outra lista, exemplo:

Entrada: [1, 2, 3, 4, 5, 6]<br>
Sa√≠da: [6]

Entrada: [6, 3, 1, 8, -10, 10, 0, 2, 10]<br>
Sa√≠da: [10, 10]

Entrada: [6, 3, 1, 8, -10, 6, 0, 2]<br>
Sa√≠da: ??

In [None]:
print([x for x in [6, 3, 1, 8, -10, 10, 0, 2, 10] if not False in [x >= y for y in [6, 3, 1, 8, -10, 10, 0, 2, 10]]])

[10, 10]
