<strong><font size = "4" color = "black">Introdução à Ciência de Dados</font></strong><br>
<font size = "3" color = "gray">Prof. Valter Moreno</font><br>
<font size = "3" color = "gray">2022</font><br>  

<hr style="border:0.1px solid gray"> </hr>
<font size = "5" color = "black">Introdução ao Python</font><p>
<font size = "5" color = "black">Aula 5: Geradores, Números Aleatórios e Anotações</font>
<hr style="border:0.1px solid gray"> </hr>

# Geradores

Geradores (***generators***) são estruturas de dados que permitem que se obtenha um elemento de cada vez, sem que todo o conteúdo tenha que ser guardado na memória. Geradores mantém registros apenas de seu estado atual, gerando, com base nesse estado, o próximo elemento de dado desejado.

O processo de geração de resultados não é reversível, no entanto. Uma vez gerado um resultado, os estados anteriores são perdidos. Se necessário, pode-se guardar os resultados gerados numa lista.

## Criação de geradores

Funções que devolvem resultados por meio do comando `yield` em vez do comando `return` funcionam como geradores.

In [1]:
def primo(inicio: int, limite: int) -> int:
    número = inicio
    while número <= limite:
        i = 2
        while i < número:
            if número % i == 0:
                break
            else:
                i +=1
        else:
            yield número
        número += 1

In [2]:
for i in primo(1000, 1100):
    print(f"{i} é primo.")

1009 é primo.
1013 é primo.
1019 é primo.
1021 é primo.
1031 é primo.
1033 é primo.
1039 é primo.
1049 é primo.
1051 é primo.
1061 é primo.
1063 é primo.
1069 é primo.
1087 é primo.
1091 é primo.
1093 é primo.
1097 é primo.


A estrutura usada em *list comprehensions* também serve para criar geradores. Para isso, basta substituir o `[]` por `()`.

In [3]:
pares_até_100 = (i for i in range(101) if i % 2 == 0)

In [4]:
print(type(pares_até_100))

<class 'generator'>


## Uso de geradores

Embora o gerador tenha sido criado, os números só serão gerados quando ele for usado em processos iterativos, como por exemplo num `for` ou `next`.

In [5]:
lista = [i for i in pares_até_100]
print(lista)

[0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100]


In [6]:
def natural_numbers():
    """returns 1, 2, 3, ..."""
    n = 1
    while True:
        yield n
        n += 1

# Os números só serão gerados se os geradores forem usados em estruturas de iteração
data = natural_numbers()
evens = (x for x in data if x % 2 == 0)
even_squares = (x ** 2 for x in evens)
even_squares_ending_in_six = (x for x in even_squares if x % 10 == 6)

In [7]:
print(data)
print(evens)
print(even_squares)
print(even_squares_ending_in_six)

<generator object natural_numbers at 0x000002A3DDD81DD0>
<generator object <genexpr> at 0x000002A3DDD81A50>
<generator object <genexpr> at 0x000002A3DDD81430>
<generator object <genexpr> at 0x000002A3DDD814A0>


Ao iterarmos no gerador `even_squares_ending_in_six`, todos os outros geradores são iterados também.

In [8]:
for i in even_squares_ending_in_six:
    if i <= 1000:
        print("Número: ", i)
    else:
        break

Número:  16
Número:  36
Número:  196
Número:  256
Número:  576
Número:  676


In [9]:
for i, j in enumerate(even_squares):
    print(f"O {i+1}o quadrado de um número par é {j}.")
    if i == 9: 
        break

O 1o quadrado de um número par é 1296.
O 2o quadrado de um número par é 1444.
O 3o quadrado de um número par é 1600.
O 4o quadrado de um número par é 1764.
O 5o quadrado de um número par é 1936.
O 6o quadrado de um número par é 2116.
O 7o quadrado de um número par é 2304.
O 8o quadrado de um número par é 2500.
O 9o quadrado de um número par é 2704.
O 10o quadrado de um número par é 2916.


Note que as iterações continuaram de onde pararam. Não há como resetar o gerador, a não ser o criando novamente.

# Números aleatórios

O pacote `random` contém várias funções para a geração de números aleatórios. Demonstramos algumas delas a seguir. Para mais informações, consulte as páginas [W3 Schools: Python Random Module](https://www.w3schools.com/python/module_random.asp) e [random — Generate pseudo-random numbers](https://docs.python.org/3/library/random.html).

In [10]:
import random
random.seed(12345) # Para que se possa obter resultados replicáveis

In [11]:
# Número aleatório inteiro numa faixa
random.randrange(1, 10)

7

In [12]:
# Similar à randrange
random.randint(1, 10)

1

Para entender melhor a diferença entre `randrange` e `randint`, consulte a página [What's the difference between randrange and randint?](https://www.codecademy.com/forum_questions/521bcf2b548c359b28000367)

In [13]:
lista = ["banana", "maçã", "laranja", "uva", "pera"]
random.choice(lista)

'laranja'

In [14]:
random.choices(lista, weights = [1, 10, 10, 1, 1], k = 5)

['laranja', 'uva', 'maçã', 'maçã', 'maçã']

In [15]:
random.shuffle(lista)
lista

['maçã', 'banana', 'pera', 'laranja', 'uva']

In [16]:
random.sample(lista, 2)

['uva', 'banana']

In [17]:
random.sample(range(100), 5)

[45, 94, 93, 11, 67]

In [18]:
random.random()  # Número aleatório entre 0.0 e 1.0

0.97863999557041

In [19]:
random.uniform(1, 2)  # Número gerado com distribuição uniforme com os limites fornecidos

1.412119392939301

In [20]:
random.normalvariate(mu = 10, sigma = .5)  # distribuição normal com média mu e std.dev. sigma

10.0039626711951

# Anotações de tipos (*type annotations*)

Python é uma linguagem de programação que define os tipos de objetos dinamicamente (*dynamically typed*). Nas versões recentes da linguagem, é possível definir os tipos dos objetos. Na prática, eles são ignorados pelo interpretador da linguagem, mas podem ser usados por ferramentas para identificar erros num script (ex., `mypy`, `pyanalyze`, `pycharm`, `pyre`, `pyright`). 

A página [Understanding type annotation in Python](https://blog.logrocket.com/understanding-type-annotation-python/) provê uma explicação clara e detalhada sobre anotações em Python. 

In [21]:
x: int = 10
y: int = 20

In [22]:
print(x, y)

10 20


Embora as variáveis tenham sido definidas como inteiras, o interpretador não gera erros quando as usamos para armazenar outros tipos de dados.

In [23]:
x = "Valter"
y = False

Os argumentos e resultados de funções também poder ter seus tipos definidos estaticamente.

In [24]:
def separa_números(texto: str) -> (int, list):
    palavras = texto.split()
    contador = 0
    números = []
    for i in palavras:
        try:
            num = float(i)
            números.append(num)
            contador += 1
        except:
            pass
    return contador, números

In [25]:
separa_números.__annotations__  # Exibe type annotations de um objeto ou função

{'texto': str, 'return': (int, list)}

In [26]:
total, números = separa_números("Tenho 30 cabras, 50 carneiros, e 20 galinhas.")
print("Total de números no texto:", total)
print("Números:", números)

Total de números no texto: 3
Números: [30.0, 50.0, 20.0]


O pacote `typing` provê diversos tipos que estendem os que são nativos no Python. Por exemplo, podemos definir o tipo dos elementos de uma lista.

In [27]:
from typing import List

In [28]:
x: List[int] = [10, 30, 50]

Podemos definir que o resultado da função `separa_números` é uma tupla formada por um número inteiro e uma lista de *floats*.

In [29]:
from typing import List, Tuple

def separa_números(texto: str) -> Tuple[int, List[float]]:
    palavras = texto.split()
    contador = 0
    números = []
    for i in palavras:
        try:
            num = float(i)
            números.append(num)
            contador += 1
        except:
            pass
    return contador, números