# Compreensão de listas e expressões geradoras

Muito do que estudamos até o momento em Python pode ser reproduzido de maneira muito parecida em outras linguagens. Comandos como if, else, while e for, bem como conceitos como criar funções, passar parâmetros e retornar valores são comuns a uma infinidade de linguagens de programação.

Porém, um dos objetivos da linguagem Python é realizar o máximo possível de trabalho com a menor quantidade possível de código, resultando em um código mais limpo e com menos efeitos colaterais. 

Com isso, o Python traz maneiras diferentes e mais enxutas de resolver problemas que já lidávamos bem utilizando outras técnicas. Parte dessas técnicas foi inspirada em conceitos de **programação funcional**, que será explicada um pouco melhor em uma aula futura.

As **compreensões de listas** e **expressões geradoras** são algumas dessas ferramentas.

## Compreensão de listas

Vamos considerar um probleminha simples: montar uma lista com os quadrados dos números de 1 até 10. Você provavelmente resolveria esse problema da seguinte maneira:

In [None]:
quadrados = []

for x in range(1, 11):
    quadrados.append(x**2)

print(quadrados)
print(x)

Note que utilizamos 3 linhas de código para criar uma lista: uma para declarar uma lista, uma para percorrer alguns valores e uma para executar o cálculo e adicionar o resultado à lista.

Além disso, criamos uma variável extra, ```x```, que segue existindo em nosso programa mesmo após o loop, como você pode observar pelo segundo ```print``` do exemplo.

A **compreensão de listas** resolve todos esses problemas: iremos resumir em uma única linha a criação da nova lista já com todos os valores desejados, e sem variáveis *sobrando* após a execução:

In [None]:
quadrados_compreensao = [num**2 for num in range(1, 11)]

print(quadrados_compreensao)

Note que a variável ```x``` criada na versão extensa ainda existe. A variável ```num``` utilizada na compreensão, não:

In [None]:
print('x:', x)
print('num:', num)

Vale destacar que você não precisa necessariamente utilizar ```range``` em suas compreensões. Você pode utilizar **qualquer** tipo de iterável, como listas, tuplas, strings etc.

O exemplo abaixo monta uma lista contendo a metade do valor de cada elemento de uma outra lista:

In [None]:
numeros = [1, 9, 4, 7, 6, 2]

metades = [n/2 for n in numeros]

print(metades)

### Condicionais em compreensões

Podemos utilizar compreensões em nossas condicionais. Imagine que no exemplo anterior não pudéssemos aceitar valores "quebrados", e para isso não iremos dividir números ímpares, apenas pares. Podemos colocar um ```if``` na expressão:

In [None]:
metades_pares = [n/2 for n in numeros if n % 2 == 0 ]
print(metades_pares)

Podemos também utilizar ```else``` na expressão. Vejamos mais um exemplo e em seguida generalizaremos a sintaxe das compreensões de lista. 

Considere que vamos, sim, aceitar números quebrados no exemplo das metades. Porém, não queremos utilizar o tipo float desnecessariamente. Portanto, faremos uma divisão **inteira** quando o número for par (para que o resultado seja int) e uma divisão **real** quando o número for ímpar (para que o resultado seja float). A expressão ficaria assim:

In [None]:
metades_tipo = [n//2 if n % 2 == 0 else n/2 for n in numeros]

print(metades_tipo)

Note que quando colocamos o ```else```, a ordem da compreensão sofreu uma alteração. Quando era apenas ```if```, ele vinha após o ```for```. Com o ```else```, ambos vem antes.

Outro ponto importante é que no caso do ```else``` passamos a ter uma segunda expressão. Quando a condição do ```if``` é verdadeira, a compreensão irá executar a expressão original. Caso contrário, ele irá executar a expressão do ```else```.

Resumindo as combinações possíveis:

```py
lista = [expressao for item in colecao]

# equivale a:

for item in colecao:
    lista.append(expressao)
```
---

```py
[expressao for item in colecao if condicao]

# equivale a:

for item in colecao:
    if condicao:
        lista.append(expressao)
```

---

```py
[expressao if condicao else expressao_alternativa for item in colecao] 

# equivale a:

for item in colecao:
    if condicao:
        lista.append(expressao)
    else:
        lista.append(expressao_alternativa)
```

### Aninhando compreensões

É possível aninhar compreensões de lista. Ao colocarmos mais de um ```for``` consecutivo, o primeiro for será considerado o mais externo, e o seguinte, mais interno. O exemplo abaixo mostra todas as combinações possíveis entre alguns nomes e sobrenomes:

In [None]:
nomes = ['Ana', 'Bruno', 'Carla', 'Daniel', 'Emília']
sobrenomes = ['Silva', 'Oliveira']

combinacoes = [nome + ' ' + sobrenome for nome in nomes for sobrenome in sobrenomes]
print(combinacoes)

Inclusive podemos utilizar essa forma para trabalhar com matrizes. O exemplo abaixo lê pelo teclado a quantidade de vitórias, empates e derrotas para cada time em um grupo:

In [None]:
times = ['Atlético Python', 'JavaScript United', 'C Seniors', 'Javeiros do Norte']
entradas = ['V', 'E', 'D']

tabela = [[int(input(f'Digite a quantidade de {tipo} do time {time}')) for tipo in entradas] for time in times]

print(tabela)

### Compreensão de dicionários

Da mesma forma que utilizamos compreensão para listas, podemos utilizá-la para dicionários. A diferença é que precisamos, obrigatoriamente, passar um par chave-valor. O exemplo abaixo parte de uma lista de notas e uma lista de alunos e chega em um dicionário associando cada aluno a uma nota.



In [None]:
alunos = ['Ana', 'Bruno', 'Carla', 'Daniel', 'Emília']
medias = [9.0, 8.0, 8.0, 6.5, 7.0]

cadastro = {alunos[i]:medias[i] for i in range(len(alunos))}

print(cadastro)

Talvez você não tenha achado esse código tão *pythonico*, e você tem razão. Não gostamos de percorrer listas por índices dessa maneira. Uma estratégia melhor é utilizar o *zip*. Vejamos um exemplo para entender o que o *zip* faz com listas.
Execute o código abaixo:

In [None]:
alunos = ['Ana', 'Bruno', 'Carla', 'Daniel', 'Emília']
medias = [9.0, 8.0, 8.0, 6.5, 7.0]

zip_alunos = zip(alunos, medias)

for item in zip_alunos:
    print(item)

O *zip* montou uma coleção onde cada elemento é uma tupla contendo um elemento da primeira lista associado ao elemento da mesma posição na segunda lista. Utilizando o nosso bom e velho *tuple unpacking*, podemos tirar proveito disso para percorrer duas listas em paralelo:

In [None]:
for a, m in zip(alunos, medias):
    print(f'Aluno: {a}\t | Média:{m}')

Vamos refazer nossa compreensão de dicionários para ser mais *Pythonica*:

In [None]:
alunos = ['Ana', 'Bruno', 'Carla', 'Daniel', 'Emília']
medias = [9.0, 8.0, 8.0, 6.5, 7.0]

cadastro = {aluno:media for aluno,media in zip(alunos, medias)}

print(cadastro)

## Expressões geradoras

Se você executar o código abaixo, não notará nenhum erro de execução. Ambas as linhas executam com sucesso:

In [None]:
colchetes = [x for x in range(10)]

parenteses = (x for x in range(10))

Listas são representadas por colchetes, e fazemos compreensão de listas utilizando colchetes. Dicionários utilizam chaves (**{** e **}**), e utilizamos chaves para fazer compreensão de dicionários. A expressão entre parênteses só pode ser uma tupla, certo?

In [None]:
print(colchetes)
print(type(colchetes))

print(parenteses)
print(type(parenteses))

Não existe compreensão de tuplas em Python. Quando colocamos uma expressão semelhante a uma compreensão de lista entre colchetes, estamos criando uma expressão geradora. Note que podemos iterar uma expressão geradora:

In [None]:
gerador_quadrados = (x**2 for x in range(10))

for quadrado in gerador_quadrados:
    print(quadrado)

Também podemos convertê-lo para outras estruturas, como uma lista ou uma tupla:

In [None]:
gerador_impares = (x for x in range(20) if x % 2 == 1)

lista_impares = list(gerador_impares)

print(lista_impares)

Porém, não podemos utilizar nosso gerador uma segunda vez. Vamos tentar:

In [None]:
gerador_quadrados = (x**2 for x in range(10))

for quadrado in gerador_quadrados:
    print(quadrado)

lista_quadrados = list(gerador_quadrados)
print(lista_quadrados)

Para entender porque a lista saiu vazia, precisamos entender a diferença entre um **iterável** e um **iterador** em Python.

### Iteráveis e iteradores

Um **iterável** é um objeto em Python que podemos percorrer utilizando um loop. Geralmente pensamos em iteráveis como algum tipo de coleção. Listas, tuplas, dicionários e strings são todos iteráveis.

Porém, o que o loop realmente utiliza não é o iterável, mas o **iterador**. Quando tentamos percorrer um iterável, é criado um iterador a partir dele utilizando a função ```iter```. Em cada passo da iteração (do loop), a função ```next``` é chamada, e ela irá retornar o próximo elemento. Quando os elementos são esgotados, ela irá lançar a exceção ```StopIteration```.

Veja o exemplo abaixo:

In [None]:
lista = [1, 3, 5]

iterador = iter(lista)

print(iterador)

print(next(iterador))
print(next(iterador))
print(next(iterador))
print(next(iterador))

Uma diferença fundamental entre um **iterável** e um **iterador** é que o iterador já possui todos os exemplos salvos em algum lugar. O iterável não. Ele irá gerar/buscar cada elemento no momento que a função ```next``` é chamada, e ele não irá salvar os elementos anteriores.

Uma expressão geradora não é um **iterável**, ela é um **iterador**. Uma lista é um **iterável**.

Ou seja, quando nós fazemos uma compreensão de lista, a expressão é avaliada na mesma hora e todos os elementos são gerados e salvos na memória.

Quando utilizamos uma expressão geradora, cada elemento é gerado apenas quando solicitado, e os elementos não ficam salvos.



In [None]:
gerador = (x for x in range(5))

print(next(gerador))
print(next(gerador))
print(next(gerador))
print(next(gerador))
print(next(gerador))
#print(next(gerador)) # essa linha provoca uma exceção

Podemos utilizar expressões geradoras quando:

* Iremos trabalhar com uma base de dados tão grande que a geração da lista pode ser excessivamente lenta ou consumir memória demais.
* Quando desejamos obter dados infinitos (uma sequência numérica sem fim, ou então um *stream* de dados que pode estar chegando por um sensor ou pela internet, por exemplo).
* Quando sabemos com certeza absoluta que só precisaremos iterar uma única vez por cada elemento e não precisaremos deles posteriormente.

Caso você precise dos dados mais de uma vez, a expressão geradora deixa de ser atrativa e compensa mais utilizar compreensão de listas.


## Funções geradoras

Expressões geradoras são uma forma compacta para criar iteradores. Uma das formas mais completas envolve utilizar programação orientada a objeto para definir uma classe com alguns métodos específicos para que os objetos se comportem como geradores. A outra envolve utilizar uma função geradora.

Funções geradoras lembram bastante funções convencionais, mas ao invés de ```return``` elas utilizarão a palavra ```yield```. 

A função irá retornar um iterador, e iremos sempre chamar ```next``` passando esse gerador.

Cada vez que o ```next``` for chamado, o iterador irá executar a função até encontrar o ```yield```. O estado da função é salvo e o valor do ```yield``` é retornado. Quando chamarmos ```next``` novamente, a função irá executar do ponto que parou até encontrar novamente o ```yield```. Quando não houver mais ```yield```, a exceção ```StopIteraction``` será lançada.

Vejamos um exemplo:

In [None]:
def funcao_geradora():
    yield 1
    yield 3
    yield 5

meu_gerador = funcao_geradora()

print(next(meu_gerador))
print(next(meu_gerador))
print(next(meu_gerador))
print(next(meu_gerador))

A nossa função geradora pode, inclusive, ter malhas de repetição:

In [None]:
def gerador_de_sequencia(limite:int):
    contador = 0
    while contador < limite:
        yield contador
        contador += 1

iterador_sequencia = gerador_de_sequencia(10)

while True:
    try:
        print(next(iterador_sequencia))
    except StopIteration:
        print('Chegou no fim!')
        break

> 
> **Observação:** se você tentou fazer uma compreensão de dicionário e esqueceu de utilizar um par chave-valor, talvez você tenha se surpreendido ao notar que não deu erro. Isso ocorre porque existe *outra* estrutura de dados em Python que não estudamos no curso que utiliza os símbolos **{** e **}**: o ```set``` (conjunto). Ele é uma coleção **mutável** de elementos (como a lista), mas ele não possui índice (porque a ordem não importa) e ele não aceita elementos repetidos. Caso tenha curiosidade, segue material de referência com o básico de como trabalhar com conjuntos: https://www.programiz.com/python-programming/set
> 

Caso tenha interesse em se aprofundar nos assuntos de hoje e ver alguns experimentos envolvendo tamanho e performance de cada um, segue algumas boas referências:

>https://djangostars.com/blog/list-comprehensions-and-generator-expressions/
>
>https://towardsdatascience.com/comprehensions-and-generator-expression-in-python-2ae01c48fc50
>
>https://docs.python.org/3/howto/functional.html#generator-expressions-and-list-comprehensions

# Exercícios

> Nos exercícios mais simples, que consistem apenas em gerar uma lista ou dicionário, utilize necessariamente compreensão de lista/dicionário. Em exercícios com instruções mais específicas, siga as instruções. Em exercícios de geradores, fique à vontade para usar expressões geradoras ou funções geradoras, mas tenha em mente que nem todas as tarefas podem ser reduzidas a uma expressão geradora. 

---

Um professor precisou anular uma questão de uma prova. Faça uma função que recebe a lista de notas da turma, o valor da questão e soma esse valor em todas as notas.

In [None]:
notas = [5, 7, 8, 4]
def somar_notas(notas: list, valor: float):
    return [nota+valor for nota in notas]

somar_notas(notas, 1)

Faça uma função que recebe uma lista de números e retorna uma lista contendo os cubos dos números pares.

In [None]:
lista = [5, 7, 8, 4]
def cubos(lista: list):
    return [i**3 for i in lista if i%2 == 0]

cubos(lista)

Faça uma função que recebe uma lista de números e retorna uma lista contendo os cubos dos números positivos e o quadrado dos números negativos.

In [None]:
lista = [5, 7, 8, -4]
def cubos_e_quadrados(lista: list):
    return [i**3 if i >= 0 else i**2 for i in lista]

cubos_e_quadrados(lista)

Faça uma função que retorna uma lista contendo apenas float a partir de uma lista contendo variáveis inteiras, float e strings. Exemplo:

Entrada: [1, 2.0, '3', 4.0, '5.5', 6]

Saída: [1.0, 2.0, 3.0, 4.0, 5.5, 6.0]

In [None]:
lista = [1, 2.0, '3', 4.0, '5.5', 6]
def casting_float(lista: list):
    return [float(i) for i in lista]

casting_float(lista)

Faça uma função que retorna uma lista contendo apenas números a partir de uma lista contendo variáveis inteiras, float e strings. Valores já numéricos **não** devem ter seu tipo alterado, apenas strings. Exemplo:

Entrada: [1, 2.0, '3', 4.0, '5.5', 6]

Saída: [1, 2.0, 3.0, 4.0, 5.5, 6]

In [None]:
lista = [1, 2.0, '3', 4.0, '5.5', 6]
def casting_float_ex(lista: list):
    return [float(i) if isinstance(i, str) else i for i in lista]

casting_float_ex(lista)

Faça uma função que recebe uma lista de nomes, uma lista de médias e a nota mínima para aprovação. Ela deverá retornar uma lista com os nomes dos alunos reprovados.

In [None]:
lista = [5, 7, 8, -4]
nomes = ["Leonardo", "b", "c", "Brian"]
def avaliar(nomes: list, notas: list, minima: int):
    return [nome for nome,nota in zip(nomes, notas) if nota < minima]

avaliar(nomes, lista, 6)

Faça uma função que recebe uma lista de nomes, uma lista de médias e a nota mínima para aprovação. Ela deverá retornar um dicionário contendo os nomes dos alunos e "APR" ou "REP" indicando a situação de cada um deles.

In [None]:
lista = [5, 7, 8, -4]
nomes = ["Leonardo", "b", "c", "Brian"]
def avaliar(nomes: list, notas: list, minima: int):
    return {nome:"REP" if nota < minima else "APR" for nome,nota in zip(nomes, notas)}

avaliar(nomes, lista, 6)

Crie o seu próprio gerador que funcione como o **range**. 

* Se ele receber 1 parâmetro, considere como valor final (não incluso na sequência). Valor inicial será 0 e passo será 1.
* Se ele receber 2 parâmetros, interprete como valor inicial (incluso) e valor final (não incluso), respectivamente. O passo será 1.
* Se ele receber 3 parâmetros, interprete como valor inicial (incluso), valor final (não incluso) e passo.
* Caso não receba parâmetros, receba mais do que 3 parâmetros ou receba algum parâmetro que não seja **int**, lance uma exceção.

In [None]:
def range_manual(*kargs):
    if len(kargs) == 1: inicio, fim, passo = 0, kargs[0], 1
    elif len(kargs) == 2: (inicio, fim), passo = kargs, 1
    elif len(kargs) == 3: inicio, fim, passo = kargs

    while inicio < fim:
        yield inicio
        inicio += passo

for i in range_manual(0, 10, 2):
    print(i)

Crie um gerador infinito para representar uma **progressão aritmética**. Dada uma **razão** e um **termo inicial**, ele deverá calcular o restante dos termos.

In [None]:
def PA(inicio, razao):
    while True:
        yield inicio
        inicio += razao
for i in PA(0, 3):
    print(i)

Faça um gerador infinito para representar uma **progressão geométrica**. Dada uma **razão** e um **termo inicial** ele deverá calcular o restante dos termos.

In [None]:
def PG(inicio, razao):
    while True:
        yield inicio
        inicio *= razao

for i in PG(1, 3):
    print(i)

Crie um gerador capaz de gerar infinitos números de Fibonacci.

Lembre-se de como os números de Fibonacci são gerados:
> f(0) = 0
> f(1) = 1
> f(n) = f(n-1) + f(n-2)

Os primeiros números de Fibonacci são: 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144...

In [None]:
def fibo_gen():
    n = 0
    cache = []
    while True:
        if n == 0 or n == 1:
            cache.append(n)
            yield n
        else:
            cache.append(cache[n-1] + cache[n-2])
            yield cache[n]
        n += 1
        
        

for i in fibo_gen():
    # print(i)
    if i == 144:
        break

         


Crie um gerador capaz de gerar infinitos números primos.

Um número primo é divisível apenas por 1 e por ele mesmo.

Exemplos: 2, 3, 5, 7, 11, 13, 17, 19, 23, 29...

In [None]:
def eh_primo(n: int):
    for div in range(2, n):
        if n % div == 0:
            return False
    return True

def primos():
    n = 1
    while True:
        if eh_primo(n):
            yield n
        n += 1

In [None]:
for index,i in enumerate(primos()):
    print(i)
    if index == 50:
        break

Você fez o exercício abaixo na lista de arquivos:

> Faça um programa que carrega um arquivo CSV de notas (como o gerado pelo exercício anterior) e pede para o usuário digitar a nota mínima para aprovação. Ele deverá gerar um novo arquivo contendo as notas originais e 2 colunas adicionais: a média de cada aluno na primeira (com, no máximo, 2 casas decimais) e "APR" ou "REP" na segunda, indicando se a média atingiu o valor mínimo ou não.

Refaça esse exercício utilizando compreensão de listas para montar a tabela de notas já com todas as notas convertidas para float.

Enriqueça o exercício anterior lendo uma lista de nomes a partir de um arquivo, com os nomes separados por quebras de linha.

Utilize compreensão de dicionários para associar cada aluno a sua lista de notas. 

Salve o resultado em um arquivo .json.