# Standard Library

Um dos maiores pontos fortes de Python é a sua vasta coleção de módulos padrão, ou seja, incluída na linguagem.  Existem desde módulos para tratamento de texto através de expressões regulares até módulos que implementam um servidor HTTP.  Daremos uma olhada em alguns destes módulos abaixo.

#  Módulo `re`

Este é um módulo de expressões regulares (regex) muito usadas para fazer busca e substituição em textos.  Regex são strings que contém construções que casam com uma ou mais strings, e podem ser bastante poderosas (e confusas).

Os casamentos achados podem ser acessados através de objetos do tipo Match Objects.

In [41]:
import re

s = """Os seres humanos estão no centro das preocupações com o desenvolvimento sustentável. Têm
direito a uma vida saudável e produtiva, em harmonia com a natureza.

O direito ao desenvolvimento deve ser exercido de modo a permitir que sejam atendidas
equitativamente as necessidades de desenvolvimento e de meio ambiente das gerações presentes
e futuras."""

for m in re.finditer(".en.", s):
    print(m.group(0), end=" ")

cent senv ment tent senv ment tend ment senv ment ient sent 

Expressões regulares definem vários símbolos para representar caracteres ou grupos de caracteres.  Assim, ```\d``` representa um dígito numérico, ```\w``` representa um dígito ou letra unicode e ```\s``` representa um espaço em branco.  Podemos também usar uma notação, ```[]```, para especificar faixas de caracteres.

Uma importante observação a respeito deste módulo é o seu forte uso de strings contendo o caractere "\".  Por causa disso, a maioria das strings usadas em programas que utilizam este módulo são do tipo "raw" (strings com o prefixo "r").

In [47]:
import re

s = """1. CAC - Av. da Arquitetura, s/n - Cidade Universitária - CEP: 50.740-550
2. CE e CAp - Av. da Arquitetura, s/n - Cidade Universitária - CEP: 50.740-550
3. CCB - Av. da Engenharia,s/n - Cidade Universitária - CEP: 50.740-600
4. CCEN - Av. Jornalista Aníbal Fernandes, s/n - Cidade Universitária - CEP: 50.740-560
5. CCS - Av. da Engenharia,s/n - Cidade Universitária - CEP: 50.740-600
6. CCSA - Av. dos Funcionários, s/n - Cidade Universitária - CEP: 50.740-580
7. CFCH - Av. da Arquitetura, s/n - Cidade Universitária - CEP: 50.740-550
8. CIN - Av. Jornalista Aníbal Fernandes, s/n - Cidade Universitária - CEP: 50.740-560
9. CTG - Av. da Arquitetura, s/n - Cidade Universitária - CEP: 50.740-550
10. BC - Av. Reitor Joaquim Amazonas, s/n - Cidade Universitária - CEP: 50.740-570
11. EDITORA - Av. Acadêmico Hélio Ramos, s/n - Cidade Universitária - CEP: 50.740-530
12. HC - Av. Prof. Moraes Rêgo, s/n - Cidade Universitária - CEP: 50.670-420
13. LIKA - Av. da Engenharia,s/n - Cidade Universitária - CEP: 50.740-600
14. NEFD - Av. Jornalista Aníbal Fernandes, s/n - Cidade Universitária - CEP: 50.740-560
15. NTI - Av. dos Reitores, s/n - Cidade Universitária - CEP: 50.670-901
16. NUSP- Av. Prof. Moraes Rêgo, s/n (Prédio do Hospital das Clínicas)-Cidade Universitária-CEP: 50.670-420
17. PCU - Av. Prof. Luiz Freire,s/n - Cidade Universitária - CEP: 50.740-540
18. RU - Av. Reitor Joaquim Amazonas, s/n - Cidade Universitária - CEP: 50.740-570
19. CECINE - Av. Prof. Artur de Sá, s/n - Cidade Universitária - CEP: 50.740-520
20. CENTRO DE CONVENÇÕES - Av. dos Reitores, s/n - Cidade Universitária - CEP: 50.670-901
21. PROGEST e DLC - Av. da Arquitetura, s/n - Cidade Universitária - CEP: 50.740-550
22. REITORIA - Av. Prof. Moraes Rêgo, 1235 - Cidade Universitária - CEP: 50.670-901"""

for m in re.finditer(r"\d{2}.\d{3}-[0-5]\d0", s):
    print(m.group(0), end=" ")

print("\n")
for m in re.finditer(r"\d\d.\d\d\d-[^0-5]\d\d", s):
    print(m.group(0), end=" ")

50.740-550 50.740-550 50.740-560 50.740-580 50.740-550 50.740-560 50.740-550 50.740-570 50.740-530 50.670-420 50.740-560 50.670-420 50.740-540 50.740-570 50.740-520 50.740-550 

50.740-600 50.740-600 50.740-600 50.670-901 50.670-901 50.670-901 

Além disso, podemos designar repetições desses símbolos:
* ```?``` - 0 ou 1 ocorrência do símbolo precedente
* ```*``` - 0 ou mais ocorrências do símbolo precedente
* ```+``` - 1 ou mais ocorrências do símbolo precedente
* ```{n}``` - ```n``` ocorrências do símbolo precedente

Por último, podemos agrupar um conjunto de símbolos com ```()```.

In [28]:
import re

s = """Os seres humanos estão no centro das preocupações com o desenvolvimento sustentável. Têm
direito a uma vida saudável e produtiva, em harmonia com a natureza.

O direito ao desenvolvimento deve ser exercido de modo a permitir que sejam atendidas
equitativamente as necessidades de desenvolvimento e de meio ambiente das gerações presentes
e futuras."""

print("\n".join(" - ".join(g for g in m.groups()) for m in 
    re.finditer(r"\s(n\w+)\s(\w+)", s)))

no - centro
necessidades - de


# Módulo `random`

O módulo `random` fornece funções que trabalham com números pseudo-aleatórios.  Apesar de útil, não se deve usá-lo para programas em criptografia pois os algoritmos implementados não são apropriados para esta aplicação.

Para várias outras aplicações, entretanto, as funções deste módulo são bastante úteis.  A principal função é a `random()` que retorna um número `float` no intervalo [0, 1).  A maioria das outras funções são construídas a partir dela.

Vários tipos de distribuições aleatórias são disponibilizadas: gaussiana, uniforme, Poisson, exponencial e muitas outras.

In [159]:
import random

# A funçao seed() pode ser usada para garantir a reprodução do
# comportamento do programa
random.seed(1)
lst1 = [random.randrange(10, 41) for _ in range(10)]
print(lst1)

[14, 28, 37, 35, 34, 12, 18, 13, 25, 34]


In [176]:
# Outras funções interessantes são a choice(), shuffle() and
# sample()
import random

# choice() retorna um elemento aleatório dentro de uma sequência
# É equivalente a seq[randrange(len(seq))]
lst = [random.randrange(12, 40) for _ in range(12, 40, 3)]
print(lst)
print(random.choice(lst))

# shuffle retorna a sequência original permutada aleátoriamente
random.shuffle(lst)
print(lst)

# sample() retorna uma lista de k elementos escolhidos aleatoriamente
# sem reposição da lista passada como parâmetro.  A lista original
# não é mexida
print(random.sample(lst, 5))
print(lst)

[38, 33, 29, 27, 36, 29, 19, 14, 35, 13]
33
[38, 29, 27, 19, 14, 33, 36, 35, 13, 29]
[33, 29, 13, 38, 27]
[38, 29, 27, 19, 14, 33, 36, 35, 13, 29]


Algumas vezes queremos fazer uma escolha ponderada por pesos.  No final da [documentação](file:///usr/share/doc/python3/html/library/random.html) do módulo `random` você encontra um pequeno programa para implementar essa estratégia.

# Módulo `collections`

Este módulo contém várias classes implementando diferentes containers com diferentes estratégias.  Assim, temos a classe `deque` (dupla fila) que implementa um container parecido com listas exceto que a inserção ou remoção de elementos em ambas as extremidades (índices 0 e -1) ocorrem com igual eficiência.

In [182]:
from collections import deque

s = "Tudo o que um sonho precisa para ser realizado é alguém que acredite que ele possa ser realizado."
fifo = deque(range(10))
fifo.append(-1)
fifo.appendleft(10)
print(fifo)
fifo.rotate(3)
print(fifo)
fifo.extendleft(range(-5, -1))
print(fifo)

deque([10, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, -1])
deque([8, 9, -1, 10, 0, 1, 2, 3, 4, 5, 6, 7])
deque([-2, -3, -4, -5, 8, 9, -1, 10, 0, 1, 2, 3, 4, 5, 6, 7])


Outra classe útil é a `Counter`, que implementa um dicionário onde o valor associado a uma chave é quantas vezes a chave apareceu na inicialização ou atualização do objeto do tipo `Counter`.

In [183]:
from collections import Counter

s = """Consideramos estas verdades como evidentes por si mesmas, que 
todos os homens são criados iguais, dotados pelo Criador de certos 
direitos inalienáveis, que entre estes estão a vida, a liberdade e
a procura da felicidade. Que a fim de assegurar esses direitos,
governos são instituídos entre os homens, derivando seus justos
poderes do consentimento dos governados; que, sempre que qualquer
forma de governo se torne destrutiva de tais fins, cabe ao povo o
direito de alterá-la ou aboli-la e instituir novo governo, baseando-o
em tais princípios e organizando-lhe os poderes pela forma que lhe
pareça mais conveniente para realizar-lhe a segurança e a felicidade.
Na realidade, a prudência recomenda que não se mudem os governos
instituídos há muito tempo por motivos leves e passageiros;
e, assim sendo, toda experiência tem mostrado que os homens estão
mais dispostos a sofrer, enquanto os males são suportáveis, do que
a se desagravar, abolindo as formas a que se acostumaram. Mas quando
uma longa série de abusos e usurpações, perseguindo invariavelmente o
mesmo objecto, indica o desígnio de reduzi-los ao despotismo absoluto,
assistem-lhes o direito, bem como o dever, de abolir tais governos e
instituir novos Guardiães para sua futura segurança. Tal tem sido o
sofrimento paciente destas colónias e tal agora a necessidade que as
força a alterar os sistemas anteriores de governo. A história do
atual Rei da Grã-Bretanha compõe-se de repetidas injúrias e usurpações,
tendo todos por objectivo direto o estabelecimento da tirania absoluta
sobre estes Estados. Para prová-lo, permitam-nos submeter os fatos a
um mundo cândido.""".lower().translate("".maketrans("", "", ",;. "))

s2 = """Nenhuma noite, por mais escura que seja. pode impedir o
amanhecer.""".lower().translate("".maketrans("", "", ",;. "))

c = Counter(s)
print(c.most_common(10))
c.update(Counter(s2))
print(c.most_common(10))

[('e', 175), ('o', 148), ('s', 143), ('a', 137), ('i', 93), ('r', 91), ('d', 78), ('t', 75), ('n', 66), ('u', 51)]
[('e', 184), ('o', 152), ('s', 146), ('a', 143), ('i', 97), ('r', 95), ('d', 80), ('t', 76), ('n', 70), ('u', 54)]


Por último, a classe `defaultdict` pode ser útil para simplificar a lógica de nosso programa nos casos em que, se uma chave não está presente, podemos partir de um valor-padrão.

In [33]:
from collections import defaultdict

s = """Consideramos estas verdades como evidentes por si mesmas, que 
todos os homens são criados iguais, dotados pelo Criador de certos 
direitos inalienáveis, que entre estes estão a vida, a liberdade e
a procura da felicidade. Que a fim de assegurar esses direitos,
governos são instituídos entre os homens, derivando seus justos
poderes do consentimento dos governados; que, sempre que qualquer
forma de governo se torne destrutiva de tais fins, cabe ao povo o
direito de alterá-la ou aboli-la e instituir novo governo, baseando-o
em tais princípios e organizando-lhe os poderes pela forma que lhe
pareça mais conveniente para realizar-lhe a segurança e a felicidade.
Na realidade, a prudência recomenda que não se mudem os governos
instituídos há muito tempo por motivos leves e passageiros;
e, assim sendo, toda experiência tem mostrado que os homens estão
mais dispostos a sofrer, enquanto os males são suportáveis, do que
a se desagravar, abolindo as formas a que se acostumaram. Mas quando
uma longa série de abusos e usurpações, perseguindo invariavelmente o
mesmo objecto, indica o desígnio de reduzi-los ao despotismo absoluto,
assistem-lhes o direito, bem como o dever, de abolir tais governos e
instituir novos Guardiães para sua futura segurança. Tal tem sido o
sofrimento paciente destas colónias e tal agora a necessidade que as
força a alterar os sistemas anteriores de governo. A história do
atual Rei da Grã-Bretanha compõe-se de repetidas injúrias e usurpações,
tendo todos por objectivo direto o estabelecimento da tirania absoluta
sobre estes Estados. Para prová-lo, permitam-nos submeter os fatos a
um mundo cândido.""".lower().translate("".maketrans("", "", ",;."))

d = defaultdict(set)
for word in s.split():
    word = word.lower()
    d[word[0]].update([word])
print("\n".join("{}: {}".format(letter, sorted(list(words))) for letter, words in sorted(d.items())))

a: ['a', 'aboli-la', 'abolindo', 'abolir', 'absoluta', 'absoluto', 'abusos', 'acostumaram', 'agora', 'alterar', 'alterá-la', 'anteriores', 'ao', 'as', 'assegurar', 'assim', 'assistem-lhes', 'atual']
b: ['baseando-o', 'bem']
c: ['cabe', 'certos', 'colónias', 'como', 'compõe-se', 'consentimento', 'consideramos', 'conveniente', 'criador', 'criados', 'cândido']
d: ['da', 'de', 'derivando', 'desagravar', 'despotismo', 'destas', 'destrutiva', 'desígnio', 'dever', 'direito', 'direitos', 'direto', 'dispostos', 'do', 'dos', 'dotados']
e: ['e', 'em', 'enquanto', 'entre', 'esses', 'estabelecimento', 'estados', 'estas', 'estes', 'estão', 'evidentes', 'experiência']
f: ['fatos', 'felicidade', 'fim', 'fins', 'forma', 'formas', 'força', 'futura']
g: ['governados', 'governo', 'governos', 'grã-bretanha', 'guardiães']
h: ['história', 'homens', 'há']
i: ['iguais', 'inalienáveis', 'indica', 'injúrias', 'instituir', 'instituídos', 'invariavelmente']
j: ['justos']
l: ['leves', 'lhe', 'liberdade', 'longa']
m

# Módulo `pathlib`

Este módulo oferece classes que encapsulam o conceito de *paths*, ou os caminhos de diretório e arquivos dentro de um sistema de arquivos.  Se o caminho apontar para um arquivo, podemos obter suas informações, tais como data de criação e permissão de uso, ou abri-lo para depois lê-lo ou nele escrever.

Se o caminho apontar para um diretório, além de obter informações sobre o diretório, podemos obter a lista de arquivos contidos no diretório.

In [34]:
# Lendo um arquivo
from pathlib import Path
import json

with Path("./standard_library.ipynb").open("rt") as f:
    notebook = json.load(f)
programs = [d["source"] for d in notebook["cells"] if d["cell_type"] == "code"]

print("\n\n=====\n\n".join("".join(lines) for lines in programs[:3]))

import re

s = """Os seres humanos estão no centro das preocupações com o desenvolvimento sustentável. Têm
direito a uma vida saudável e produtiva, em harmonia com a natureza.

O direito ao desenvolvimento deve ser exercido de modo a permitir que sejam atendidas
equitativamente as necessidades de desenvolvimento e de meio ambiente das gerações presentes
e futuras."""

for m in re.finditer(".en.", s):
    print(m.group(0), end=" ")

=====

import re

s = """1. CAC - Av. da Arquitetura, s/n - Cidade Universitária - CEP: 50.740-550
2. CE e CAp - Av. da Arquitetura, s/n - Cidade Universitária - CEP: 50.740-550
3. CCB - Av. da Engenharia,s/n - Cidade Universitária - CEP: 50.740-600
4. CCEN - Av. Jornalista Aníbal Fernandes, s/n - Cidade Universitária - CEP: 50.740-560
5. CCS - Av. da Engenharia,s/n - Cidade Universitária - CEP: 50.740-600
6. CCSA - Av. dos Funcionários, s/n - Cidade Universitária - CEP: 50.740-580
7. CFCH - Av. da Arquitetura, s/n - Cidade Universitária - CEP: 50.740-550
8.

In [35]:
# Verificando que um arquivo existe e obtendo suas informações
from pathlib import Path

p = Path("./standard_library.ipynb")
if p.exists():
    print(p.stat())

os.stat_result(st_mode=33204, st_ino=812257, st_dev=2067, st_nlink=1, st_uid=1000, st_gid=1000, st_size=32132, st_atime=1660839458, st_mtime=1660839441, st_ctime=1660839441)


In [189]:
# Listando os arquivos de um diretório
from pathlib import Path

# Esta não é a melhor maneira de se filtrar nomoes de arquivos
p = Path("/usr/share/doc")
if p.is_dir():
    print("\n".join(str(f) for f in p.iterdir() if "python3" in f.name))

/usr/share/doc/python3-problem-report
/usr/share/doc/python3-send2trash
/usr/share/doc/python3-gdbm
/usr/share/doc/python3-backcall
/usr/share/doc/libpython3.8
/usr/share/doc/python3-psutil
/usr/share/doc/python3-defer
/usr/share/doc/python3-jedi
/usr/share/doc/python3-dateutil
/usr/share/doc/python3-ipython-genutils
/usr/share/doc/python3-apt
/usr/share/doc/python3-tdb
/usr/share/doc/python3-apport
/usr/share/doc/python3-xdg
/usr/share/doc/python3-icu
/usr/share/doc/python3-wadllib
/usr/share/doc/python3-reportlab-accel
/usr/share/doc/python3-pip
/usr/share/doc/python3-prompt-toolkit
/usr/share/doc/python3-xlib
/usr/share/doc/python3-chardet
/usr/share/doc/libpython3.8-dev
/usr/share/doc/python3-systemd
/usr/share/doc/python3-markupsafe
/usr/share/doc/python3-requests-unixsocket
/usr/share/doc/python3-louis
/usr/share/doc/python3-mako
/usr/share/doc/python3-httplib2
/usr/share/doc/python3-samba
/usr/share/doc/python3-ipywidgets
/usr/share/doc/python3-dbus
/usr/share/doc/python3
/usr/s

### Exercício

Crie e imprima uma lista com os nomes dos arquivos do diretório atual que tem tamanho menor do 1024 bytes.

## Partes de um caminho

Um caminho pode ser dividido em uma ou mais partes, todas opcionais (embora pelo menos uma deve estar presente): a raiz, os ancestrais (ou pais), e a parte final.  A primeira parte pode ser obtida pelo atributo `root`, a segunda através do atributo `parents` e a terceira através do atributo `name`.  Todas as partes podem ser obtidas em uma tupla através do atributo `parts`.

In [185]:
# Trabalhando com as partes de um caminho
from pathlib import Path

p = Path.cwd()
print("Diretório atual: ", p)
a = p / Path("standard_library.ipynb")
print("Partes do caminho: ", a.parts)

Diretório atual:  /home/einstein/Downloads
Partes do caminho:  ('/', 'home', 'einstein', 'Downloads', 'standard_library.ipynb')


In [186]:
# Obtendo os pais de um caminho
from itertools import chain

prefixo = "\n    "
header = "Lista dos pais do caminho:"
print(prefixo.join(str(parent) for parent in chain([header], a.parents)))

# Você pode obter o pai imediato com o atributo parent
print("Pai imediato do caminho:", str(a.parent))

Lista dos pais do caminho:
    /home/einstein/Downloads
    /home/einstein
    /home
    /
Pai imediato do caminho: /home/einstein/Downloads


### Outras funcionalidades

In [191]:
# Podemos trabalhar com grupos de arquivos com nomes similares
# usando o método glob() com notação de wildchars
import pathlib

p = Path("/usr/share/doc")
print("\n".join(str(f) for f in p.glob("python*")))

/usr/share/doc/python3-problem-report
/usr/share/doc/python3-send2trash
/usr/share/doc/python3-gdbm
/usr/share/doc/python3-backcall
/usr/share/doc/python3-psutil
/usr/share/doc/python3-defer
/usr/share/doc/python3-jedi
/usr/share/doc/python3-dateutil
/usr/share/doc/python3-ipython-genutils
/usr/share/doc/python3-apt
/usr/share/doc/python3-tdb
/usr/share/doc/python3-apport
/usr/share/doc/python-tinycss2-common
/usr/share/doc/python3-xdg
/usr/share/doc/python3-icu
/usr/share/doc/python3-wadllib
/usr/share/doc/python3-reportlab-accel
/usr/share/doc/python3-pip
/usr/share/doc/python3-prompt-toolkit
/usr/share/doc/python3-xlib
/usr/share/doc/python3-chardet
/usr/share/doc/python3-systemd
/usr/share/doc/python3-markupsafe
/usr/share/doc/python3-requests-unixsocket
/usr/share/doc/python3-louis
/usr/share/doc/python3-mako
/usr/share/doc/python3-httplib2
/usr/share/doc/python3-samba
/usr/share/doc/python3-ipywidgets
/usr/share/doc/python3-dbus
/usr/share/doc/python3
/usr/share/doc/python3-defus

In [193]:
# O método glob() pode usar um wildchar recursivo
import pathlib

p = Path("/home/einstein/Downloads")
print("\n".join(str(f) for f in p.glob("**/*.py")))

/home/einstein/Downloads/rockpaperscissors.py
