# Bibliotecas comuns
Nesse notebook, vamos explorar algumas bibliotecas bem comuns em diversas aplicações. Exploraremos NumPy, Pandas, Matplotlib e quaiquer bibliotecas voltadas a machine learning mais para frente.

## `datetime`

Biblioteca para trabalhar com datas.

Referência: https://www.w3schools.com/python/python_datetime.asp

In [3]:
import datetime

### Criação
Para criar datas, pode-se usar o método `now` ou através do construtor `datetime`.

In [4]:
now = datetime.datetime.now()
print(now)

date = datetime.datetime(2020, 5, 17)
print(date)

2021-03-18 10:35:49.220066
2020-05-17 00:00:00


### Formatando saída
datetime permite diversos tipos de formatação.

In [5]:
print(now.year)
print(now.strftime('%A'))
print(now.strftime('%y %m %d'))
print(now.strftime('%d/%m/%Y'))

2021
Thursday
21 03 18
18/03/2021


## `time`

Biblioteca para trabalhar com tempos.

Referência: https://docs.python.org/3/library/time.html

In [6]:
import time

In [7]:
start = time.time()
print(start)

1616074552.3438733


O resultado foi a quantidade de segundos a partir do tempo inicial, que pode ser obtido através do método abaixo.

In [8]:
time.gmtime(0)

time.struct_time(tm_year=1970, tm_mon=1, tm_mday=1, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=3, tm_yday=1, tm_isdst=0)

### Benchmarking

Existem várias funções da biblioteca, mas normalmente é usado para medir um tempo decorrido ou para para um por um período de tempo.

In [9]:
start = time.time()
time.sleep(5)
end = time.time()
print(f'Esse comando levou {end - start:.2f}s para concluir')

Esse comando levou 5.01s para concluir


## `math`

Biblioteca para trabalhar com algumas funções matemáticas.

Referência: https://docs.python.org/3/library/math.html

In [10]:
import math

In [11]:
# imprimindo valor de PI
print(math.pi)

# convertendo PI em graus
print(math.degrees(math.pi))

# convertendo 90 graus em radianos
print(math.radians(90.))

3.141592653589793
180.0
1.5707963267948966


In [12]:
n = 5.7

print('Número original:', n)
print('"Teto" do número:', math.ceil(n))
print('"Chão" do número:', math.floor(n))

Número original: 5.7
"Teto" do número: 6
"Chão" do número: 5


In [13]:
n = 100

print('Número original:', n)
print('Log:', math.log(n))
print('Log na base 10:', math.log10(n))
print('Log na base 2:', math.log2(n))
print('Raiz quadrada:', math.sqrt(n))

Número original: 100
Log: 4.605170185988092
Log na base 10: 2.0
Log na base 2: 6.643856189774724
Raiz quadrada: 10.0


In [14]:
numbers = [.1, .1, .1, .1, .1, .1, .1, .1, .1, .1]

print(numbers)
print('Soma com função "sum":', sum(numbers))
print('Soma com função "fsum":', math.fsum(numbers))

[0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1]
Soma com função "sum": 0.9999999999999999
Soma com função "fsum": 1.0


## `random`

Biblioteca especializada em geração de números aleatórios.

Referência: https://docs.python.org/3/library/random.html

In [15]:
import random

### Configurando seed
Você pode informar uma "semente" para início da geração dos números aleatórios. Muito importante quando se quer reproduzir algo com os mesmos resultados.

In [16]:
print('Sem seed')
for _ in range(5):
    print(random.randrange(0, 10))
    
print()

print('Com seed')
for _ in range(5):
    random.seed(0)
    print(random.randrange(0, 10))

Sem seed
7
2
7
1
9

Com seed
6
6
6
6
6


### Geração de números inteiros

In [17]:
print(random.randrange(10)) # imprime um valor aleatório de 0 a 9
print(random.randrange(20, 31)) # imprime um valor aleatório de 20 a 30
print(random.randrange(100, 201, 2)) # imprime um valor aleatório na sequência de 100 a 200 de 2 em 2

6
20
132


### Geração de números flutuantes

In [18]:
print(random.random()) # imprime um valor aleatório entre [0., 1.]
print(random.uniform(2, 5)) # imprime um valor aleatório entre [2., 5.]

0.9654648863619172
3.457783089688438


### Trabalhando com sequências

In [19]:
valores = ['A', '2', '3', '4', '5', '6', '7', '8', '9', '10', 'J', 'Q', 'K']
naipes = ['♠', '♣', '♥', '♦']
baralho = [valor + naipe for naipe in naipes for valor in valores]
print(baralho)

['A♠', '2♠', '3♠', '4♠', '5♠', '6♠', '7♠', '8♠', '9♠', '10♠', 'J♠', 'Q♠', 'K♠', 'A♣', '2♣', '3♣', '4♣', '5♣', '6♣', '7♣', '8♣', '9♣', '10♣', 'J♣', 'Q♣', 'K♣', 'A♥', '2♥', '3♥', '4♥', '5♥', '6♥', '7♥', '8♥', '9♥', '10♥', 'J♥', 'Q♥', 'K♥', 'A♦', '2♦', '3♦', '4♦', '5♦', '6♦', '7♦', '8♦', '9♦', '10♦', 'J♦', 'Q♦', 'K♦']


In [30]:
# escolhe aleatóriamente um item da lista
print(random.choice(baralho)) 

8♣


In [31]:
# embaralha lista
random.shuffle(baralho)
print(baralho) 

['5♣', '6♥', '8♥', '3♥', '10♥', 'A♥', '4♥', 'J♠', '4♦', 'J♣', '7♠', '7♣', '9♦', 'K♣', 'A♠', 'Q♠', 'Q♣', '10♣', 'K♦', 'J♦', '4♣', '9♠', 'Q♦', 'J♥', 'Q♥', '2♥', '8♠', '9♥', '6♦', '5♠', '2♠', '7♦', '10♦', '10♠', 'K♠', '2♦', '5♥', '3♦', 'K♥', '8♣', '6♣', '5♦', '6♠', '2♣', '3♠', 'A♦', '7♥', '4♠', '9♣', '8♦', '3♣', 'A♣']


In [32]:
# pega uma amostra da lista (no caso, amostra de 7 elementos)
print(random.sample(baralho, k=7))

['K♥', '5♦', '9♦', 'J♦', '10♣', '3♠', '7♣']


In [41]:
# escolhe aleatoriamente 10 itens da lista na proporção 1:2
opcoes = ['ganhar', 'perder']
print(random.choices(opcoes, [1, 2], k=10))

['perder', 'ganhar', 'perder', 'ganhar', 'perder', 'ganhar', 'perder', 'perder', 'perder', 'perder']


## `string`

Biblioteca com alguns recursos para trabalhar com strings.

Referência: https://docs.python.org/3/library/string.html

In [42]:
import string

### Constantes

In [43]:
print(string.ascii_letters)
print(string.ascii_lowercase)
print(string.ascii_uppercase)

abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
abcdefghijklmnopqrstuvwxyz
ABCDEFGHIJKLMNOPQRSTUVWXYZ


In [44]:
print(string.digits)
print(string.hexdigits)

0123456789
0123456789abcdefABCDEF


In [45]:
print(string.punctuation)

!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~


In [46]:
print(string.printable)

0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~ 	



In [47]:
print(string.whitespace)

 	



### Templates

Classe para criação de templates de texto.

In [48]:
s = string.Template('$quem gosta de $algo.')
print(s.substitute(quem='Mult', algo='baguete'))

Mult gosta de baguete.


In [52]:
d = dict(quem='Mult')

In [53]:
print(s.substitute(d))

KeyError: 'algo'

In [54]:
print(s.safe_substitute(d))

Mult gosta de $algo.


### Função `capwords`

Capitaliza todas as palavras da string.

In [56]:
s = 'o rato roeu a roupa do rei de roma'
print(string.capwords(s))

O Rato Roeu A Roupa Do Rei De Roma


## `textwrap`

Biblioteca com algumas conveniências para trabalhar com strings.

Referência: https://docs.python.org/3/library/textwrap.html

In [57]:
import textwrap

### Função `wrap`

Cria lista com strings de no máximo `width` caracteres.

In [58]:
texto = 'O rato roeu a roupa do rei de Roma'
print(textwrap.wrap(texto, width=20))

['O rato roeu a roupa', 'do rei de Roma']


### Função `fill`

Cria string multilinha de strings de no máximo `width` caracteres.

In [59]:
texto = 'O rato roeu a roupa do rei de Roma'
print(textwrap.fill(texto, width=20))

O rato roeu a roupa
do rei de Roma


### Função `shorten`

Encurta string com padrão indicado.

In [60]:
texto = 'O rato roeu a roupa do rei de Roma'
print(textwrap.shorten(texto, width=20))
print(textwrap.shorten(texto, width=20, placeholder='...'))

O rato roeu a [...]
O rato roeu a...


### Função `dedent`

Remove espaços iniciais de um texto multilinha.

In [61]:
sql = """
    SELECT
        COLUNA1,
        COLUNA2
    FROM
        TABELA
    WHERE
        CONDICAO
"""
print(sql)
print()
print(textwrap.dedent(sql))


    SELECT
        COLUNA1,
        COLUNA2
    FROM
        TABELA
    WHERE
        CONDICAO



SELECT
    COLUNA1,
    COLUNA2
FROM
    TABELA
WHERE
    CONDICAO



## `itertools`

Biblioteca para trabalhar com iterators para loopings eficientes.

Referência: https://docs.python.org/3/library/itertools.html

In [62]:
import itertools

### Função `chain`

Encadeia diversas listas em diversos níveis em uma só "flat".

In [63]:
# listas dentro de listas
print(list(itertools.chain([1, 2], [3, 4], [5, 6])))

[1, 2, 3, 4, 5, 6]


In [64]:
# listas dentro de listas
list1 = [[1, 2], [3, 4], [5, 6]]
print(list(itertools.chain.from_iterable(list1)))

[1, 2, 3, 4, 5, 6]


### Função `combinations`

Gera todas as combinações com o tamanho especificado.

In [65]:
list1 = [1, 2, 3, 4]
print(list(itertools.combinations(list1, r=2)))

[(1, 2), (1, 3), (1, 4), (2, 3), (2, 4), (3, 4)]


### Função `permutations`

Gera todas as permutações possíveis.

In [66]:
list1 = [1, 2, 3, 4]
print(list(itertools.permutations(list1, r=2)))

[(1, 2), (1, 3), (1, 4), (2, 1), (2, 3), (2, 4), (3, 1), (3, 2), (3, 4), (4, 1), (4, 2), (4, 3)]


## `functools`

Biblioteca com alguns aprimoramentos às funções, como cache, comparações automáticas, etc.

Referência: https://docs.python.org/3/library/functools.html

In [67]:
import functools

### Função `reduce`

Reduz uma lista a um único valor, assim como `sum`, que reduz uma lista à soma de todos os elementos.

A função é simples e poderia ser escrita da seguinte forma:
```python
def reduce(function, iterable, initializer=None):
    it = iter(iterable)
    if initializer is None:
        value = next(it)
    else:
        value = initializer
    for element in it:
        value = function(value, element)
    return value
```

In [68]:
lista = [10, 20, 30, 40, 50]

soma = functools.reduce(lambda x, y: x+y, lista)
print(soma)

150


In [69]:
maior = functools.reduce(lambda x, y: x if x > y else y, lista)
print(maior)

50


### `@lru_cache`

Guarda temporariamente o resultado de uma função em cache (memória) de acordo com os parâmetros passados na entrada.

In [70]:
import time

Vamos criar uma função qualquer para mostrar o potencial desse recurso. Note que `lru_cache` é um `decorator`, ou seja, deve ser declarado acima da função.

O número indicado em `lru_cache` indica quantos espaços serão reservados em memória para o cache.

In [71]:
@functools.lru_cache(maxsize=1)
def calculo_qualquer(numero):
    time.sleep(numero)
    return numero**2

Agora vamos executar uma única vez com o parâmetro `5`.

In [72]:
start = time.time()
print(calculo_qualquer(5))
print(time.time() - start)

25
5.003528118133545


Demorou 5 segundos para retornar o valor 25. Agora se executarmos novamente, veremos a diferença.

In [73]:
start = time.time()
print(calculo_qualquer(5))
print(time.time() - start)

25
0.0019948482513427734


O resultado foi imediato, pois o código não foi executado novamente, mas sim, o valor 25 já estava associado ao parâmetro 5.

Se executarmos com o parâmetro `2`, veremos que ele executará o código novamente.

In [74]:
start = time.time()
print(calculo_qualquer(2))
print(time.time() - start)

4
2.013794422149658


Note também que se executarmos novamente com o parâmetro `5` o código será executado novamente, pois indicamos que o tamanho máximo do cache é `1`, que na prática é como se quiséssemos guardar o último resultado.

In [75]:
start = time.time()
print(calculo_qualquer(5))
print(time.time() - start)

25
5.009026288986206


Podemos criar o concerito de `memoization` na função de fibonacci. Vamos comparar os resultados.

In [76]:
@functools.lru_cache(maxsize=None)
def cached_fibonacci(n):
    if n < 2:
        return n
    return cached_fibonacci(n-1) + cached_fibonacci(n-2)

def noncached_fibonacci(n):
    if n < 2:
        return n
    return noncached_fibonacci(n-1) + noncached_fibonacci(n-2)

In [77]:
start = time.time()
print(noncached_fibonacci(35))
print(time.time() - start)

9227465
10.750161170959473


In [81]:
start = time.time()
print(cached_fibonacci(35))
print(time.time() - start)

9227465
0.0


O resultado foi muito superior!

**Observação**: Como o resultado é associado a somente os parâmetros de entrada. Não é aconselhável guardar em cache resultados que por ventura foram obtidos em conjunto com valores aleatórios.

## `operator`

Biblioteca com diversas funções simples já programadas para tarefas comuns.

Referência: https://docs.python.org/3/library/operator.html

In [82]:
import operator

Podemos chamar algumas funções da seguinte forma.

### Operações aritméticas

In [83]:
print(operator.add(10, 20))
print(operator.sub(10, 20))
print(operator.mul(10, 20))
print(operator.truediv(10, 20))
print(operator.floordiv(10, 20))

30
-10
200
0.5
0


Dãã! Mas que coisa mais sem sentido. Bastaria usar os operadores no lugar.

A grande vantagem está quando usamos em conjunto com funções que recebem funções como parâmetros.

In [84]:
# esse seria o jeito de criarmos uma função de multiplicação acumulada
print(functools.reduce(lambda x, y: x * y, [1, 2, 3, 4, 5]))

# agora usando a função mul da biblioteca operator... fica bem mais simples de entender.
print(functools.reduce(operator.mul, [1, 2, 3, 4, 5]))

120
120


### `itemgetter` e `attrgetter`

Existem duas funções na biblioteca **operator** que facilitam a extração de valores pelos seus índices ou atributos.

Suponhamos que queremos ordenar uma lista pelo segundo índice.

In [85]:
lista = [('Duda', 20), ('Abelardo', 50), ('Maria', 10)]

In [86]:
sorted(lista, key=lambda item: item[1])

[('Maria', 10), ('Duda', 20), ('Abelardo', 50)]

Podemos usar a função `operator.itemgetter` no lugar para deixar ainda mais legível.

In [87]:
sorted(lista, key=operator.itemgetter(1))

[('Maria', 10), ('Duda', 20), ('Abelardo', 50)]

Agora vamos ver um outro caso. Quando queremos acessar uma chave ao invés de índice.

In [None]:
lista = [
    {'nome': 'Duda', 'idade': 20},
    {'nome': 'Abelardo', 'idade': 50},
    {'nome': 'Maria', 'idade': 10}
]

In [None]:
sorted(lista, key=lambda item: item['idade'])

In [None]:
sorted(lista, key=operator.itemgetter('idade'))

Para entendermos mais sobre `operator.attrgetter`, precisaremos seguir adiante nos notebooks, pois precisamos entender um pouco mais sobre propriedades em Python.

# Exercícios

**1)** Quantas combinações únicas existem para uma lista com 5 elementos?

**2)** Quanto tempo leva para extrair 4 cartas aleatórias de um baralho ordenado e as 4 forem Ás (a semente deve ser 0)?

In [None]:
valores = ['A', '2', '3', '4', '5', '6', '7', '8', '9', '10', 'J', 'Q', 'K']
naipes = ['♠', '♣', '♥', '♦']
baralho = [valor + naipe for naipe in naipes for valor in valores]

# seu código vai abaixo


**3)** Usando a função `functools.reduce` implemente a função `multireplace(s, repls)` que fará múltiplas substituições de termos em uma mesma string.

Parâmetros:
* **s**: string de entrada
* **repls**: dicionário onde cada chave é o termo a ser substituído e o valor é o termo de substituição

Retorno: string com todos os termos substituídos.

Exemplos de uso:
```python
multireplace('abracadabra', {'a': 'x', 'b': 'y', 'c': 'z'}) -> 'xyrxzxdxyrx'
multireplace('mult é meu amigo, mult é meu colega', {'mult': 'maomé', 'colega': 'camarada'}) -> 
    'maomé é meu amigo, maomé é meu camarada'
```

**Dicas:**
* Passe como iterador na função `reduce` o método `items()` do dicionário `repls`.
* `reduce` precisa de 2 parâmetros na função anônima, o primeiro receberá a string em si, o segundo será a tupla contendo a chave e o valor obtido pelo método `items()`.
* Você usará o método `replace` da string, você poderá passar os parâmetros através dos índices 0 e 1 da tupla, ou simplesmente usando o `*` como vimos no notebook sobre funções.
* O parâmetro `initial` da função `reduce` deverá ser a string `s`.

In [None]:
def multireplace(s, repls):
    # seu código vem aqui
    return # seu retorno vem aqui

# resultado esperado: 'maomé é meu amigo, maomé é meu camarada'
multireplace('mult é meu amigo, mult é meu colega', {'mult': 'maomé', 'colega': 'camarada'})

In [None]:
assert multireplace('mult é meu amigo, mult é meu colega', {'mult': 'maomé', 'colega': 'camarada'}) == \
    'maomé é meu amigo, maomé é meu camarada', 'Você errroooouuuuu!'

assert multireplace('abracadabra', {'a': 'x', 'b': 'y', 'c': 'z'}) == 'xyrxzxdxyrx', 'Você errroooouuuuu!'

print('Show de bola!')