# Compreensão de listas e expressões geradoras

Muito do que estudamos até o momento em Python pode ser reproduzido de maneira parecida em outras linguagens. Comandos como if, else, while e for, bem como conceitos como criar funções, passar parâmetros e retornar valores são comuns a uma infinidade de linguagens de programação.

Porém, um dos objetivos da linguagem Python é realizar o máximo possível de trabalho com a menor quantidade possível de código, resultando em um código mais limpo e com menos efeitos colaterais. 

Com isso, o Python traz maneiras diferentes e mais enxutas de resolver problemas que já lidávamos bem utilizando outras técnicas. Parte dessas técnicas foi inspirada em conceitos de **programação funcional**, que será explicada um pouco melhor em um capítulo futuro.

As **compreensões de listas** e **expressões geradoras** são algumas dessas ferramentas.

## Compreensão de listas

### Compreensão de listas contendo apenas um loop
Vamos considerar um problema simples: montar uma lista com os quadrados dos números de 1 até 10. Você provavelmente resolveria esse problema da seguinte maneira:

Note que utilizamos 3 linhas de código para criar uma lista: uma para declarar a lista, uma para percorrer alguns valores e uma para executar o cálculo e adicionar o resultado à lista.

Além disso, criamos uma variável extra, `x`, que segue existindo em nosso programa mesmo após o loop, como você pode observar pelo segundo `print` do exemplo.

A **compreensão de listas** resolve todos esses problemas: iremos resumir em uma única linha a criação da nova lista já com todos os valores desejados, e sem variáveis *sobrando* após a execução:

Note que a variável `x`, criada na versão extensa, ainda existe. A variável `num`, utilizada na compreensão, não:

https://www.datacamp.com/tutorial/python-dictionary-comprehension

Vale destacar que você não precisa necessariamente utilizar `range` em suas compreensões. Você pode utilizar **qualquer** tipo de iterável, como listas, tuplas, strings etc.

O exemplo abaixo monta uma lista contendo a metade do valor de cada elemento de uma outra lista:

### Condicionais em compreensões

Podemos utilizar compreensões em nossas condicionais. 
Imagine que não fossem aceitos valores "quebrados" no exemplo anterior. Logo, não podemos dividir os números ímpares, apenas os pares. Fazemos isso usando um `if` na expressão:

Podemos também utilizar `else` na expressão. Vejamos mais um exemplo: 

Considere que são aceitos números quebrados no exemplo das metades. Porém, não queremos utilizar o tipo float desnecessariamente. Portanto, faremos uma divisão **inteira** quando o número for par (para que o resultado seja int) e uma divisão **real** quando o número for ímpar (para que o resultado seja float). A expressão ficaria assim:

Note que quando usamos o `else`, a ordem da compreensão sofre uma alteração. Quando usamos apenas o `if`, ele vem após o `for`. Com o ```else```, ambos vêm antes.

Outro ponto importante é que no caso do `else` passamos a ter uma segunda expressão. Quando a condição do `if` é verdadeira, a compreensão irá executar a expressão original. Caso contrário, ela irá executar a expressão do `else`.


Generalizando a sintaxe das compreensões de lista, temos as seguintes combinações:

### Aninhando compreensões

É possível aninhar compreensões de lista. Ao colocarmos mais de um `for` consecutivo, o primeiro for será considerado o mais externo, e o seguinte, mais interno. O exemplo abaixo mostra todas as combinações possíveis entre alguns nomes e sobrenomes:

A linha ```combinacoes = [nome + ' ' + sobrenome for nome in nomes for sobrenome in sobrenomes]``` equivale a:

Inclusive podemos utilizar essa forma para trabalhar com matrizes. O exemplo abaixo lê pelo teclado a quantidade de vitórias, empates e derrotas para cada time em um grupo:

### Compreensão de dicionários

Da mesma forma que utilizamos compreensão para listas, podemos utilizá-la para dicionários. A diferença é que precisamos, obrigatoriamente, passar um par chave-valor. O exemplo abaixo parte de uma lista de notas e uma lista de alunos e chega em um dicionário associando cada aluno a uma nota.

Talvez você não tenha achado esse código tão *pythonico*, e você tem razão. Não gostamos de percorrer listas por índices dessa maneira. Uma estratégia melhor é utilizar o *zip*, estudado em capítulos anteriores:

> 
> **Observação:** se você tentou fazer uma compreensão de dicionário e esqueceu de utilizar um par chave-valor, talvez você tenha se surpreendido ao notar que não gerou um erro. Isso ocorre porque existe *outra* estrutura de dados em Python que não estudamos no curso que utiliza os símbolos **{** e **}**: o `set` (conjunto). Ele é uma coleção **mutável** de elementos (como a lista), mas ele não possui índice (porque a ordem não importa) e ele não aceita elementos repetidos. Caso tenha curiosidade, segue material de referência com o básico de como trabalhar com conjuntos: https://www.programiz.com/python-programming/set
> 

## Expressões geradoras

### Criando uma expressão geradora

Se você executar o código abaixo, não notará erros de execução. Ambas as linhas executam com sucesso:

Listas são representadas por colchetes, e fazemos compreensão de listas utilizando colchetes. Dicionários utilizam chaves (**{** e **}**), e utilizamos chaves para fazer compreensão de dicionários. A expressão entre parênteses só pode ser uma tupla, certo?

Errado. Não existe compreensão de tuplas em Python. Quando colocamos uma expressão semelhante a uma compreensão de lista entre parênteses, estamos criando uma expressão geradora. Note que podemos iterar uma expressão geradora:

Também podemos convertê-la para outras estruturas, como uma lista ou uma tupla:

Porém, não podemos utilizar nosso gerador uma segunda vez. Execute o código abaixo:

Para entender porque o resultado foi uma lista vazia, precisamos entender a diferença entre um **iterável** e um **iterador** em Python.

### Iteráveis e iteradores

Um **iterável** é um objeto em Python que podemos percorrer utilizando um loop. Geralmente pensamos em iteráveis como algum tipo de coleção. Listas, tuplas, dicionários e strings são todos iteráveis.

Porém, o que o loop realmente utiliza não é o iterável, mas o **iterador**. Quando tentamos percorrer um iterável, é criado um iterador a partir dele utilizando a função `iter`. Em cada passo da iteração (do loop), a função `next` é chamada, e ela irá retornar o próximo elemento. Quando os elementos são esgotados, ela irá lançar a exceção (uma espécie de erro sinalizado, que estudaremos em um capítulo futuro) `StopIteration`.

Veja o exemplo abaixo:

Uma diferença fundamental entre um **iterável** e um **iterador** é que o iterador já possui todos os exemplos salvos em algum lugar. O iterável não. Ele irá gerar/buscar cada elemento no momento que a função `next` é chamada, e ele não irá salvar os elementos anteriores.

Uma expressão geradora não é um **iterável**, ela é um **iterador**. Uma lista é um **iterável**.

Ou seja, quando nós fazemos uma compreensão de lista, a expressão é avaliada na mesma hora e todos os elementos são gerados e salvos na memória.

Quando utilizamos uma expressão geradora, cada elemento é gerado apenas quando solicitado, e os elementos não ficam salvos.

Podemos utilizar expressões geradoras quando:

* Iremos trabalhar com uma base de dados tão grande que a geração da lista pode ser excessivamente lenta ou consumir memória demais.  
* Quando desejamos obter dados infinitos (uma sequência numérica sem fim, ou então um *stream* de dados que pode estar chegando por um sensor ou pela internet, por exemplo).  
* Quando sabemos com certeza absoluta que só precisaremos iterar uma única vez por cada elemento e não precisaremos deles posteriormente.  

Caso você precise dos dados mais de uma vez, a expressão geradora deixa de ser atrativa e compensa mais utilizar compreensão de listas.

## Funções geradoras

Expressões geradoras são uma forma compacta para criar iteradores. Uma das formas mais completas envolve utilizar programação orientada a objeto para definir uma classe com alguns métodos específicos para que os objetos se comportem como geradores. A outra envolve utilizar uma função geradora.

Funções geradoras lembram bastante funções convencionais, mas ao invés de `return` elas utilizarão a palavra `yield`. 

A função irá retornar um iterador, e iremos sempre chamar `next` passando esse gerador.

Cada vez que o `next` for chamado, o iterador irá executar a função até encontrar o `yield`. O estado da função é salvo e o valor do `yield` é retornado. Quando chamarmos `next` novamente, a função irá executar do ponto que parou até encontrar novamente o `yield`. Quando não houver mais `yield`, a exceção `StopIteraction` será lançada.

Vejamos um exemplo:

In [2]:
def funcaoGeradora():

    yield 1
    yield 2
    yield 3

meuGerador = funcaoGeradora()

print(next(meuGerador))
print(next(meuGerador))
print(next(meuGerador))
print(next(meuGerador))

1
2
3


StopIteration: 

A nossa função geradora pode, inclusive, ter malhas de repetição:

In [4]:
def geradorSequencia(limite: int):
    contador = 0

    while contador < limite:
        yield contador
        contador += 1

iteradorSequencia = geradorSequencia(limite=5)

print(iteradorSequencia)

for x in iteradorSequencia:
    print(x)


<generator object geradorSequencia at 0x7f940ef70ba0>
0
1
2
3
4


Caso tenha interesse em se aprofundar nos assuntos deste capítulo e ver alguns experimentos envolvendo tamanho e performance de cada um, segue algumas boas referências:

>https://djangostars.com/blog/list-comprehensions-and-generator-expressions/
>
>https://towardsdatascience.com/comprehensions-and-generator-expression-in-python-2ae01c48fc50
>
>https://docs.python.org/3/howto/functional.html#generator-expressions-and-list-comprehensions

1. Coloque em uma lista todos os números entre 1 e 1000 que sejam divisiveis por N, sendo N um número recebido no *standard input*;

In [5]:
N = int(input("Digite o valor de N: "))

divisiveis = [x for x in range(1, 1001) if x % N == 0]

print(divisiveis)


[15, 30, 45, 60, 75, 90, 105, 120, 135, 150, 165, 180, 195, 210, 225, 240, 255, 270, 285, 300, 315, 330, 345, 360, 375, 390, 405, 420, 435, 450, 465, 480, 495, 510, 525, 540, 555, 570, 585, 600, 615, 630, 645, 660, 675, 690, 705, 720, 735, 750, 765, 780, 795, 810, 825, 840, 855, 870, 885, 900, 915, 930, 945, 960, 975, 990]


2. Coloque em uma lista todos os números entre 1 e 1000 que possuam um dígito N em sua composição, sendo N um número recebido no *standard input*;

In [6]:
N = input("Digite o dígito N: ")

N_composicao = [x for x in range(1, 1001) if N in str(x)]

print(N_composicao)


[10, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 210, 310, 410, 510, 610, 710, 810, 910, 1000]


3. Conte o número de espaços em branco em uma *string* recebida pelo *standard input*;

In [7]:
entrada = input("Digite uma string: ")

contagem = sum(1 for caractere in entrada if caractere.isspace())

print(f"O número de espaços em branco na string é: {contagem}")


O número de espaços em branco na string é: 4


4. Crie uma lista com todas as consoantes em uma frase (de pelo menos 10 palavras) recebidas pelo *standard input*;

In [15]:
frase = input("Digite uma frase com pelo menos 10 palavras: ").lower()

consoantes = "bcdfghjklmnpqrstvwxyz"

consoantes_na_frase = [letra for letra in frase if letra in consoantes]

print(consoantes_na_frase)


Counter({'s': 8, 'm': 5, 'c': 3, 'r': 3, 'l': 3, 't': 3, 'n': 3, 'd': 2, 'p': 2, 'f': 1, 'v': 1})
['c', 'r', 'm', 'l', 's', 't', 'c', 'm', 't', 'd', 's', 's', 'c', 'n', 's', 'n', 't', 's', 'm', 'm', 'f', 'r', 's', 'd', 'p', 'l', 'm', 'n', 's', 'p', 'l', 'v', 'r', 's']


5. Pegue o índice e o valor, na forma de tupla, para os itens na lista: ['oi', 4, 8.99, 'mamao', ('t,b', 'n')]. O resultado seria semelhante a (indice, valor), (indice, valor);

In [18]:
lista = ['oi', 4, 8.99, 'mamao', ('t,b', 'n')]

resultado = [(indice, valor) for indice, valor in enumerate(lista)]

print(resultado)

# Saida com tuplas separadas
for i in resultado:
    print(i)

[(0, 'oi'), (1, 4), (2, 8.99), (3, 'mamao'), (4, ('t,b', 'n'))]
(0, 'oi')
(1, 4)
(2, 8.99)
(3, 'mamao')
(4, ('t,b', 'n'))


6. Encontre os números em comum em duas listas (sem utilizar "tupla" ou "set"), sendo ambas as listas recebidas pelo *standard input* e com, pelo menos, 5 valores em cada;

In [5]:
lista1 = input('Digite uma lista de números separando com espaço').split()
lista2 = input('Digite outra lista de números separando com espaço').split()

lista1 = [int(x) for x in lista1]
lista2 = [int(x) for x in lista2]

numerosEmComum = [num1 for num1 in lista1 if num1 in lista2]

print(numerosEmComum)


[1, 2, 3, 6]


7. Receba uma frase pelo *standard input* e salve apenas os números encontrados nesta frase em uma lista;

In [33]:
# entrada = input('Digite uma frase com números')

def encontraNumerosGenerator(entrada):
    '''
    Função retorna o endereço do objeto gerador
    '''
    yield [frase for frase in entrada if frase.isdigit()]

def encontraNumeros(entrada):
    '''
    Função retorna o resultado dos numeros contidos na entrada
    '''
    return [frase for frase in entrada if frase.isdigit()]


entrada = 'M1nh4 4t1v1d4d3 3m pyth0n'
resultado = encontraNumeros(entrada)
print(resultado)

['1', '4', '4', '1', '1', '4', '3', '3', '0']


8. Dado o  seguinte iterável: numeros = range(20), produza uma lista contendo as palavras 'par' e 'impar' caso o número daquela posição seja par/impar. Teremos, ao final, uma segunda lista com ['impar', 'par', 'par', 'impar', etc];

In [1]:
numeros = range(20)
segunda_lista = ['ímpar' if numero % 2 != 0 else 'par' for numero in numeros]

print(segunda_lista)


['par', 'ímpar', 'par', 'ímpar', 'par', 'ímpar', 'par', 'ímpar', 'par', 'ímpar', 'par', 'ímpar', 'par', 'ímpar', 'par', 'ímpar', 'par', 'ímpar', 'par', 'ímpar']


9. Construa uma lista de tuplas que tenha apenas os números em comum entre duas listas, sendo: lista1 = [1, 2, 3, 4, 5, 6, 7, 8, 9] e lista2 = [2, 7, 1, 12] e o resultado deve ser algo do tipo: [(1,1), (2,2), etc];

In [2]:
lista1 = [1, 2, 3, 4, 5, 6, 7, 8, 9]
lista2 = [2, 7, 1, 12]

tuplas_em_comum = [(x, x) for x in lista1 if x in lista2]

print(tuplas_em_comum)


[(1, 1), (2, 2), (7, 7)]


10. Encontre todas as palavras em uma *string*, que contenham menos de 4 letras;

In [3]:
import re

frase = input("Digite uma frase: ")

palavras_menos_de_4_letras = re.findall(r'\b\w{1,3}\b', frase)

print("Palavras com menos de 4 letras na frase:", palavras_menos_de_4_letras)


Palavras com menos de 4 letras na frase: []


11. Use uma compreensão de lista aninhada para encontrar todos os números entre 1-1000 que sejam divisiveis por algum número entre 2-9.

In [4]:
divisiveis = [numero for numero in range(1, 1001) if any(numero % divisor == 0 for divisor in range(2, 10))]

print(divisiveis)


[2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 15, 16, 18, 20, 21, 22, 24, 25, 26, 27, 28, 30, 32, 33, 34, 35, 36, 38, 39, 40, 42, 44, 45, 46, 48, 49, 50, 51, 52, 54, 55, 56, 57, 58, 60, 62, 63, 64, 65, 66, 68, 69, 70, 72, 74, 75, 76, 77, 78, 80, 81, 82, 84, 85, 86, 87, 88, 90, 91, 92, 93, 94, 95, 96, 98, 99, 100, 102, 104, 105, 106, 108, 110, 111, 112, 114, 115, 116, 117, 118, 119, 120, 122, 123, 124, 125, 126, 128, 129, 130, 132, 133, 134, 135, 136, 138, 140, 141, 142, 144, 145, 146, 147, 148, 150, 152, 153, 154, 155, 156, 158, 159, 160, 161, 162, 164, 165, 166, 168, 170, 171, 172, 174, 175, 176, 177, 178, 180, 182, 183, 184, 185, 186, 188, 189, 190, 192, 194, 195, 196, 198, 200, 201, 202, 203, 204, 205, 206, 207, 208, 210, 212, 213, 214, 215, 216, 217, 218, 219, 220, 222, 224, 225, 226, 228, 230, 231, 232, 234, 235, 236, 237, 238, 240, 242, 243, 244, 245, 246, 248, 249, 250, 252, 254, 255, 256, 258, 259, 260, 261, 262, 264, 265, 266, 267, 268, 270, 272, 273, 274, 275, 276, 278, 279, 280, 282,