# Importando bibliotecas

Uma das grandes vantagens de Python é a extensa comunidade presente, que cria e mantém pacotes e bibliotecas para as mais variadas funções. Neste capítulo, aprenderemos como importar bibliotecas e exploraremos algumas bibliotecas embutidas. Para mais detalhes sobre importação, [veja a documentação oficial](https://docs.python.org/3/reference/import.html). Por trás dos panos, a operação de importação é bastante complexa, mas a interface para fazer tarefas simples é simples também.

Primeiro, vamos esclarecer alguns termos:

* módulo: um módulo contém objetos de Python, que é acessada pelo processo de importação. Uma analogia é considerar um módulo como um arquivo.
* pacote: é um módulo que contém submódulos e subpacotes. Serve para organizar os módulos. Uma analogia é considerar um pacote como uma pasta, que pode conter outras pastas (subpacotes) e arquivos (submódulos).
* importar: processo em que um módulo ganha acesso a código em outro módulo
* biblioteca: um termo menos preciso, e significa em essência um conjunto de módulos, como a biblioteca padrão (*standard library* - que chamei de bibliotecas embutidas).

Para importar um pacote, utilize a sintaxe: 

```python
import pacote
```

Como primeiro exemplo, vamos importar e descrever brevemente o pacote `os`.

In [19]:
import os

## Pacote `os`

[Link da documentação](https://docs.python.org/3/library/os.html)

O pacote `os` contém funções para interagir com o sistema operacional de maneira independente da plataforma. Por exemplo, Windows e Linux utilizam comandos diferentes para gerar arquivos, mudar de pastas, mas podemos abstrair isso utilizando as funções em `os`. Primeiro, vamos explorar como gerar algumas pastas.

### O conceito de *current working directory*

Podemos utilizar comandos para manipulação de pastas ou arquivos com caminhos absolutos ou relativos.

Note aqui que estamos presumindo o local em que as pastas serão geradas, que é o *current working directory* ou *CWD*. Essa variável pode ser obtida pelo comando `os.getcwd()`. Geralmente, essa é a pasta onde você executou o comando `python ...` ou, no caso do Jupyter Lab, a pasta onde o arquivo `.ipynb` se localiza. Vamos supor a seguinte estrutura:

```
--- raiz
      |
      +--pasta1
           |
           +--arquivo.py
```


Suponha que você quer rodar o arquivo `arquivo.py`. Se você abrir o terminal na `raiz`, poderá trocar para `pasta1` com `cd pasta1` e depois rodar `python ./arquivo.py` ou executar diretamente `python ./pasta1/arquivo.py`. No primeiro caso, *cwd* será `raiz/pasta1/` e no segundo caso será `raiz/`.

### Manipulação de pastas

`os.mkdir(caminho)` é utilizado para criar uma pasta especificada pelo caminho no argumento. Suponha que você queira criar esta estrutura com uma pasta aninhada na outra, e seu *cwd* é `raiz/`

```
--- raiz
      |
      +--pasta1
           |
           +--pasta2
```

Para isso, precisaremos do comando `os.mkdir('pasta1')` seguido de `os.mkdir('pasta1/pasta2')`. Isso é inconveniente se quisermos fazer estruturas mais complexas, pois muitos caminhos serão repetidos. Podemos então trocar o *cwd* com `os.chdir('pasta1')` e depois criar a segunda pasta com `os.mkdir('pasta2')`. Você pode voltar à pasta original com `os.chdir('..')` ou armazenar o *cwd* original em uma variável e retornar à ela depois de tudo.

Se você tentar criar `pasta2` diretamente, como `pasta1` não existe, `FileNotFoundError` será lançado. Caso você tente rodar novamente o domando, é possível que a pasta já exista e um erro `FileExistsError` será lançado.

Alternativamente, o comando `os.mkdirs(caminho)` é utilizado para criar uma pasta e todas as pastas necessárias para atingir. O argumento opcional `exist_ok`, por padrão `False`, evita que um erro seja lançado se alguma pasta já existir. Logo, o comando anterior se torna `os.mkdir('./pasta1/pasta2', exist_ok=True)`, e não precisamos 

Em paralelo a `os.mkdirs` e `os.mkdir`, temos `os.rmdirs` e `os.rmdir`, que removem pastas. 

Para renomear uma pasta, existe o comando `os.rename(origem, destino)`, que irá falhar se a pasta de destino já existir. Caso queira substituir, pode utiliar `os.replace(origem, destino)`. Estas funções também funcionam com arquivos.

### Manipulações de caminhos

Outra tarefa recorrente é a manipulação de caminhos. Utilizar manipulação de strings pode parecer tentador, mas é uma receita para frustração, especialmente se você deseja que seu programa seja utilizado em mais de um sistema operacional. O submódulo [`os.path`](https://docs.python.org/3/library/os.path.html) possui ferramentas para auxiliar nisso. O mais recomendado hoje em dia é utilizar o pacote `pathlib`, que exploraremos [em breve](sec:pathlib).

Aqui vão algumas funções úteis:

* `os.path.abspath` retorna o caminho absoluto dado um caminho relativo.
* `os.path.relpath` retorna um caminho relativo, referente ao *cwd*, dado um caminho absoluto.
* `os.path.basename` retorna o nome na base do caminho. Se for uma pasta, retorna o nome da pasta, se for um arquivo, retorna o nome do arquivo. Por exemplo, `os.path.basename(os.path.abspath('./Importando bibliotecas.ipynb'))` resulta em `'Importando bibliotecas.ipynb'`.
* `os.path.dirname` retorna o nome de todos os diretórios no caminho até o caminho da pasta ou arquivo fornecido.
* `os.path.exists`, `os.path.isfile` e `os.path.isdir` retornam `True` se o caminho fornecido é uma pasta ou arquivo existente, com diferenças óbvias pelo nome.
* `os.path.join` junta duas ou mais caminhos de maneira "inteligente", obedecendo o separador de pastas do sistema, em ordem. Não checa se o caminho final é válido, e não checa se você tentar "colocar" um arquivo dentro do outro.
* `os.path.split` retorna duas strings, a segunda sendo a última parte do caminho e a primeira sendo o resto, à esquerda. Se o caminho fornecido termina com uma barra, a segunda parte é uma string vazia.

### Percorrendo diretórios e pastas

Iterar sobre o conteúdo de pastas é algo relativamente comum. Por exemplo, você pode querer encontrar todos os arquivos `.csv` de uma pasta para tratá-los. Para isso, as funções `os.walk` e `os.scandir` podem ser utilizadas. `os.walk(caminho)` recebe um caminho e cria um gerador que fornece uma tupla com o caminho até a pasta, o nome das pastas dentro da pasta atual e o nome dos arquivos na pasta atual. `os.scandir` age de maneira um pouco diferente. Ele gera um iterador que retorna objetos `DirEntry`. Esses objetos contém informações sobre se algo é uma pasta ou um arquivo, e o *stats* do arquivo.

Isso ainda é um tanto laborioso. Para métodos melhores de se percorrer diretórios e encontrar arquivos, podemos utilizar o módulo [`glob`](sec:glob).

(sec:glob)=
## `glob`

[Link da documentação](https://docs.python.org/3/library/glob.html)

*glob*, que significa *global*, foi um programa criado há décadas para encontrar arquivos com base num padrão. A especificação desse padrão é bastante simples, e é capaz que você já tenha utilizado algo similar em sua vida. Os padrões são compostos por letras e números, e símbolos. As letras e números serão comparadas exatamente com os caminhos, e os símbolos são utilizados para generalizar um padrão. Os três símbolos são:

* `*`, significa "qualquer caracter, qualquer número de vezes. É de longe o símbolo mais frequentemente utilizado.
* `?`, significa "qualquer caracter, 1 vez.
* `[abc...]` significa qualquer caracter dentro dos colchetes, 1 vez.
* `[a-z]` significa qualquer caracter dentro da faixa de caracteres. `a-z` significa "todos os caracteres entre 'a' e 'z' minúsculos", `0-9` significa "todos os caracteres numéricos.

Além disso, você pode procurar por arquivos recursivamente utilizando o seguinte padrão: `**/`.

Exemplos:

* `*.csv` irá corresponder a todos os arquivos que terminam com '.csv'.
* `exercício*.csv` irá corresponder a todos os arquivos que começam com 'exercício', terminam com '.csv' e possuem qualquer texto no interior. Então 'exercício1.csv' e 'exercício-treinamento-teste.csv' ambos correspondem à esse padrão.
* `.csv` irá corresponder somente ao arquivo cujo nome é '.csv', nada mais e nada menos.

Note que um arquivo pode ter duas extensões, como 'abc.tar.gz'. Se você quiser todos os arquivos 'tar', terá que utilizar `*.tar*`, mas isso poderá corresponder a, por exemplo, 'abc.tart' também.

Dentro do módulo `glob`, temos três funções. `glob`, `iglob` e `escape`. `glob` retorna uma lista com os caminhos dos arquivos, `iglob` retorna um iterador, portanto não avalia tudo de uma vez, e `escape` é utilizado para escapar símbolos que o *glob* utiliza e que podem existir em nomes de arquivos. Podemos utilizar a função `glob` para encontrar todos os arquivos de exercícios do capítulo 5.

In [78]:
import glob
exercícios = glob.glob('../Capítulo05/dados/*.csv')
exercícios

['../Capítulo05/dados\\exercício1.csv', '../Capítulo05/dados\\exercício2.csv']

Porém, é um pouco inconveniente ficar digitando `glob.glob` o tempo todo. Existe uma maneira de importar seletivamente algumas objetos de um módulo, colocando-os no escopo global ao invés do módulo em si. Isso é feito com a seguinte sintaxe:

```python
from (pacote) import (objeto)
```

In [79]:
from glob import glob
exercícios = glob('../Capítulo05/dados/*.csv')
exercícios

['../Capítulo05/dados\\exercício1.csv', '../Capítulo05/dados\\exercício2.csv']

Como um último exemplo, vamos encontrar todos os arquivos `.py` criados neste livro. Para isso, vamos utilizar o padrão `**` e o argumento opcional `recursive=True`.

In [80]:
todos_py = glob('../**/*.py', recursive=True)
todos_py

['..\\Capítulo01\\Soluções dos exercícios\\complex_mod.py',
 '..\\Capítulo01\\Soluções dos exercícios\\pint.py',
 '..\\Capítulo02\\Soluções de exercícios\\prop_sympy.py',
 '..\\Capítulo02\\Soluções de exercícios\\prop_uncertainties.py',
 '..\\Capítulo03\\Soluções de exercícios\\Gerador\\problema_gas_ideal.py',
 '..\\Capítulo03\\Soluções de exercícios\\Gerador\\QuestionGenerator.py',
 '..\\Capítulo03\\Soluções de exercícios\\Gerador\\test_gas_ideal.py',
 '..\\Capítulo04\\Soluções de exercícios\\convert_dict.py',
 '..\\Capítulo04\\Soluções de exercícios\\convert_pint.py',
 '..\\Capítulo05\\dados\\gerar_csv.py',
 '..\\Capítulo05\\Soluções de exercícios\\contagem_palavras.py',
 '..\\Capítulo05\\Soluções de exercícios\\criar_exceções.py',
 '..\\Capítulo05\\Soluções de exercícios\\ler_csv1.py',
 '..\\Capítulo05\\Soluções de exercícios\\ler_csv2.py',
 '..\\Capítulo05\\Soluções de exercícios\\molar_mass_calculator.py',
 '..\\Capítulo05\\Soluções de exercícios\\molar_mass_calculator2.py',
 '..\

(sec:pathlib)=
## `pathlib`

`pathlib` é uma biblioteca que utiliza objetos especiais para representar caminhos, ao invés de strings. Esses objetos `Path` podem ser manipulados com maior facilidade e podem ser utilizados, em muitos casos, no lugar de caminhos de strings. Senão, é possível convertê-los com `str(path)`. Veja a documentação oficial [aqui](https://docs.python.org/3/library/pathlib.html)

Existem basicamente dois tipos de objetos que são utilizados. Primeiro temos `PurePath`, que somente representa caminhos, e `Path`, que faz tudo que `PurePath` faz, e também consegue realizar algumas operações concretas. Por isso, irei focar em `Path` somente.

Primeiro, podemos criar um `Path` com o seguinte comando:

In [83]:
from pathlib import Path
p = Path('.')
p

WindowsPath('.')

Como estou em um ambiente Windows, um objeto `WindowsPath` é criado. Se estivesse em Linux, um `PosixPath` seria criado. Com esse objeto `p`, posso convertê-lo para um caminho absoluto com `p.absolute()`, posso concatenar outros caminhos com


In [94]:
p.write_text

WindowsPath('C:/Users/karl.clinckspoor')

Além disso, posso criar um `Path` no *cwd* com o método `Path.cwd()` e um `Path` no diretório *home* com `Path.home()`. O *home* é a pasta base de um usuário, geralmente localizada em um diretório como `C:/Usuários/<nome>/`.

In [91]:
Path.cwd()

WindowsPath('C:/Users/karl.clinckspoor/Downloads/CursoPython/Capítulos/Capítulo06')

In [90]:
p.

WindowsPath('C:/Users/karl.clinckspoor/Downloads/CursoPython/Capítulos/Capítulo06')

In [23]:
os.system('dir')

0

Aqui, podemos acessar `Importando bibliotecas.ipynb` e verificar se é um arquivo de fato com a função `isfile` contida dentro do submódulo `path` de `os`. ([documentação](https://docs.python.org/3/library/os.path.html))

In [6]:
os.path.isfile('./Importando bibliotecas.ipynb')

True

In [9]:
os.path.isfile(os.getcwd())

False

Podemos expandir um caminho relativo para um caminho absoluto com `os.path.abspath`

In [11]:
os.path.abspath('./Importando bibliotecas.ipynb')

'C:\\Users\\karl.clinckspoor\\Downloads\\CursoPython\\Capítulos\\Capítulo06\\Importando bibliotecas.ipynb'

E voltar a um caminho relativo com `os.path.relpath`.

In [12]:
os.path.relpath(os.path.abspath('./Importando bibliotecas.ipynb'))

'Importando bibliotecas.ipynb'

E ver o tamanho do arquivo com 