# Standard Library

Um dos maiores pontos fortes de Python é a sua vasta coleção de módulos padrão, ou seja, incluída na linguagem.  Existem desde módulos para tratamento de texto através de expressões regulares até módulos que implementam um servidor HTTP.  Daremos uma olhada em alguns destes módulos abaixo.

#  Módulo `re`

Este é um módulo de expressões regulares (regex) muito usadas para fazer busca e substituição em textos.  Regex são strings que contém construções que casam com uma ou mais strings, e podem ser bastante poderosas (e confusas).

Uma importante observação a respeito deste módulo é o seu forte uso de strings contendo o caractere "\".  Por causa disso, a maioria das strings usadas em programas que utilizam este módulo são do tipo "raw" (strings com o prefixo "r").

In [None]:
import re

s = """Os seres humanos estão no centro das preocupações com o desenvolvimento sustentável. Têm
direito a uma vida saudável e produtiva, em harmonia com a natureza.

O direito ao desenvolvimento deve ser exercido de modo a permitir que sejam atendidas
equitativamente as necessidades de desenvolvimento e de meio ambiente das gerações presentes
e futuras."""

for m in re.finditer(r"(\w*es\w+)", s):
    print(m.group(0))

# Módulo `random`

O módulo `random` fornece funções que trabalham com números pseudo-aleatórios.  Apesar de útil, não se deve usá-lo para programas em criptografia pois os algoritmos implementados não são apropriados para esta aplicação.

Para várias outras aplicações, entretanto, as funções deste módulo são bastante úteis.  A principal função é a `random()` que retorna um número `float` no intervalo [0, 1).  A maioria das outras funções são construídas a partir dela.

Vários tipos de distribuições aleatórias são disponibilizadas: gaussiana, uniforme, Poisson, exponencial e muitas outras.

In [None]:
import random

# A funçao seed() pode ser usada para garantir a reprodução do
# comportamento do programa
random.seed(1)
lst1 = [random.randrange(10, 41) for _ in range(10)]
print(lst1)

In [None]:
# Outras funções interessantes são a choice(), shuffle() and
# sample()
import random

# choice() retorna um elemento aleatório dentro de uma sequência
# É equivalente a seq[randrange(len(seq))]
lst = list(range(12, 40, 3))
print(random.choice(lst))

# shuffle retorna a sequência original permutada aleátoriamente
random.shuffle(lst)
print(lst)

# sample() retorna uma lista de k elementos escolhidos aleatoriamente
# sem reposição da lista passada como parâmetro.  A lista original
# não é mexida
print(random.sample(lst, 5))
print(lst)

Algumas vezes queremos fazer uma escolha ponderada por pesos.  No final da [documentação](file:///usr/share/doc/python3/html/library/random.html) do módulo `random` você encontra um pequeno programa para implementar essa estratégia.

# Módulo `collections`

Este módulo contém várias classes implementando diferentes containers com diferentes estratégias.  Assim, temos a classe `deque` (dupla fila) que implementa um container parecido com listas exceto que a inserção ou remoção de elementos em ambas as extremidades (índices 0 e -1) ocorrem com igual eficiência.

In [None]:
from collections import deque

s = "Tudo o que um sonho precisa para ser realizado é alguém que acredite que ele possa ser realizado."
fifo = deque(range(10))
fifo.append(-1)
fifo.appendleft(10)
print(fifo)
fifo.rotate(3)
print(fifo)
fifo.extendleft(range(-5, -1))
print(fifo)

Outra classe útil é a `Counter`, que implementa um dicionário onde o valor associado a uma chave é quantas vezes a chave apareceu na inicialização ou atualização do objeto do tipo `Counter`.

In [None]:
from collections import Counter

s = """Consideramos estas verdades como evidentes por si mesmas, que 
todos os homens são criados iguais, dotados pelo Criador de certos 
direitos inalienáveis, que entre estes estão a vida, a liberdade e
a procura da felicidade. Que a fim de assegurar esses direitos,
governos são instituídos entre os homens, derivando seus justos
poderes do consentimento dos governados; que, sempre que qualquer
forma de governo se torne destrutiva de tais fins, cabe ao povo o
direito de alterá-la ou aboli-la e instituir novo governo, baseando-o
em tais princípios e organizando-lhe os poderes pela forma que lhe
pareça mais conveniente para realizar-lhe a segurança e a felicidade.
Na realidade, a prudência recomenda que não se mudem os governos
instituídos há muito tempo por motivos leves e passageiros;
e, assim sendo, toda experiência tem mostrado que os homens estão
mais dispostos a sofrer, enquanto os males são suportáveis, do que
a se desagravar, abolindo as formas a que se acostumaram. Mas quando
uma longa série de abusos e usurpações, perseguindo invariavelmente o
mesmo objecto, indica o desígnio de reduzi-los ao despotismo absoluto,
assistem-lhes o direito, bem como o dever, de abolir tais governos e
instituir novos Guardiães para sua futura segurança. Tal tem sido o
sofrimento paciente destas colónias e tal agora a necessidade que as
força a alterar os sistemas anteriores de governo. A história do
atual Rei da Grã-Bretanha compõe-se de repetidas injúrias e usurpações,
tendo todos por objectivo direto o estabelecimento da tirania absoluta
sobre estes Estados. Para prová-lo, permitam-nos submeter os fatos a
um mundo cândido.""".lower().translate("".maketrans("", "", ",;. "))

s2 = """Nenhuma noite, por mais escura que seja. pode impedir o
amanhecer.""".lower().translate("".maketrans("", "", ",;. "))

c = Counter(s)
print(c.most_common(10))
c.update(Counter(s2))
print(c.most_common(10))

A classe `OrderedDict` guarda a ordem em que as chaves de um dicionário foram inseridas (mas não a ordem em que foram atualizadas).  Isto é algumas vezes útil na vida real.

In [None]:
from collections import OrderedDict

d = OrderedDict([("a", 0), ("c", 2), ("b", 1)])
print(" ".join(d.keys()))
d.move_to_end("a")
print(" ".join(d.keys()))
c = d.popitem()
print("Item obtido foi:", c)
print("Dicionário:", " ".join(d.keys()))

Por último, a classe `defaultdict` pode ser útil para simplificar a lógica de nosso programa nos casos em que, se uma chave não está presente, podemos partir de um valor-padrão.

In [None]:
from collections import defaultdict

s = """Consideramos estas verdades como evidentes por si mesmas, que 
todos os homens são criados iguais, dotados pelo Criador de certos 
direitos inalienáveis, que entre estes estão a vida, a liberdade e
a procura da felicidade. Que a fim de assegurar esses direitos,
governos são instituídos entre os homens, derivando seus justos
poderes do consentimento dos governados; que, sempre que qualquer
forma de governo se torne destrutiva de tais fins, cabe ao povo o
direito de alterá-la ou aboli-la e instituir novo governo, baseando-o
em tais princípios e organizando-lhe os poderes pela forma que lhe
pareça mais conveniente para realizar-lhe a segurança e a felicidade.
Na realidade, a prudência recomenda que não se mudem os governos
instituídos há muito tempo por motivos leves e passageiros;
e, assim sendo, toda experiência tem mostrado que os homens estão
mais dispostos a sofrer, enquanto os males são suportáveis, do que
a se desagravar, abolindo as formas a que se acostumaram. Mas quando
uma longa série de abusos e usurpações, perseguindo invariavelmente o
mesmo objecto, indica o desígnio de reduzi-los ao despotismo absoluto,
assistem-lhes o direito, bem como o dever, de abolir tais governos e
instituir novos Guardiães para sua futura segurança. Tal tem sido o
sofrimento paciente destas colónias e tal agora a necessidade que as
força a alterar os sistemas anteriores de governo. A história do
atual Rei da Grã-Bretanha compõe-se de repetidas injúrias e usurpações,
tendo todos por objectivo direto o estabelecimento da tirania absoluta
sobre estes Estados. Para prová-lo, permitam-nos submeter os fatos a
um mundo cândido.""".lower().translate("".maketrans("", "", ",;."))

d = defaultdict(set)
for word in s.split():
    d[word[0]].update([word])
print("\n".join("{}: {}".format(letter, sorted(list(words))) for letter, words in sorted(d.items())))

# Módulo `pathlib`

Este módulo oferece classes que encapsulam o conceito de *paths*, ou os caminhos de diretório e arquivos dentro de um sistema de arquivos.  Se o caminho apontar para um arquivo, podemos obter suas informações, tais como data de criação e permissão de uso, ou abri-lo para depois lê-lo ou nele escrever.

Se o caminho apontar para um diretório, além de obter informações sobre o diretório, podemos obter a lista de arquivos contidos no diretório.

In [None]:
# Lendo um arquivo
from pathlib import Path
import json

with Path("./standard_library.ipynb").open("rt") as f:
    notebook = json.load(f)
programs = [d["source"] for d in notebook["cells"] if d["cell_type"] == "code"]

print("\n\n=====\n\n".join("".join(lines) for lines in programs[:3]))

In [None]:
# Verificando que um arquivo existe e obtendo suas informações
from pathlib import Path

p = Path("./standard_library.ipynb")
if p.exists():
    print(p.stat())

In [None]:
# Listando os arquivos de um diretório
import pathlib

# Esta não é a melhor maneira de se filtrar nomoes de arquivos
p = pathlib.Path("/usr/share/doc")
if p.is_dir():
    print("\n".join(str(f) for f in p.iterdir() if "python3" in f.name and "doc" in f.name))

### Exercício

Crie e imprima uma lista com os nomes dos arquivos do diretório atual que tem tamanho menor do 1024 bytes.

## Partes de um caminho

Um caminho pode ser dividido em uma ou mais partes, todas opcionais (embora pelo menos uma deve estar presente): a raiz, os ancestrais (ou pais), e a parte final.  A primeira parte pode ser obtida pelo atributo `root`, a segunda através do atributo `parents` e a terceira através do atributo `name`.  Todas as partes podem ser obtidas em uma tupla através do atributo `parts`.

In [None]:
# Trabalhando com as partes de um caminho
import pathlib

p = pathlib.Path.cwd()
print("Diretório atual: ", p)
a = Path(p, "standard_library.ipynb")
print("Partes do caminho: ", a.parts)

In [None]:
# Obtendo os pais de um caminho
from itertools import chain

prefixo = "\n    "
header = "Lista dos pais do caminho:"
print(prefixo.join(str(parent) for parent in chain([header], a.parents)))

# Você pode obter o pai imediato com o atributo parent
print("Pai imediato do caminho:", str(a.parent))

### Outras funcionalidades

In [None]:
# Podemos trabalhar com grupos de arquivos com nomes similares
# usando o método glob() com notação de wildchars
import pathlib

p = Path("/usr/share/doc")
print("\n".join(str(f) for f in p.glob("python*doc")))

In [None]:
# O método glob() pode usar um wildchar recursivo
import pathlib

p = Path("/home/aluno")
print("\n".join(str(f) for f in p.glob("**/*.py")))