# Python Packaging History

> More details about python packaging history

## Ferramentas de distribuição

As primeiras versões de Python (1998-2000) não tinham um gerenciador de pacotes, desenvolvedores documentavam o processo de instalação.

Em 2000 o distutils foi adicionado ao Python 1.6, permitindo a definição de um arquivo `setup.py` que descrevia e definia como o pacote seria instalado.

Em 2003 setuptools foi introduzido como uma melhoria do distutils (utilizada até hoje).

Em 2008 a organização PyPA (Python Packaging Authority) foi fundada e ela é responsável por desenvolver e melhorar várias ferramentas python como `pip`, `twine`, `virtualenv`, `wheel`.

Em 2011 o `pip` se torna o gerenciador de pacote padrão da linguagem.

Em 2013 o formato `wheel` foi introduzido como uma forma mais eficiente de distribuir pacotes python, ao utilizar arquivos binários sem a necessidade de compilação de código no SO do usuário.

Em 2017 o pacote `flit` foi desenvolvido, introduzindo o formato `pyproject.toml` para facilitar a descrição do pacote e suas dependências

Em 2020 a PEP 621 padronizou a utilização do `pyproject.toml`.

### Distutils

A ferramenta pip ainda nem existia quando o distutils era utilizado.

- Não existia gerenciamento de dependencias na ferramenta, elas eram documentadas no pacote
- Não havia consistência nos metadados (linux vs windows)

```python
from distuils.core import setup

setup(name='package', version='0.1.0', pymodules=['core.py'])

! python setup.py sdist
! python setup.py install
```

### Setuptools

Melhora a partir do distutils.

- Gerenciamento de dependencias: durante o processo de instalação do pacote as dependencias já são instaladas
- Introduziu `easy_install` (pip ainda não existia)
- Introduziu o formato `eggs` (legado hoje em dia)
- Introduziu o arquivo de configuração `config.cfg` (discutido a posteriori)

## Formato dos pacotes

Existem dois tipos de pacotes python: source distribution (`sdis`) e `wheels`.

- 'sdis' é um arquivo tar com o nome no formato `{nome}-{versao}.tar.gz` que inclui arquivos de metadados do pacote, além de um setup.py ou pyproject.toml que defina como o build do pacote deve ser feito durante a instalação. É gerado através do comando: `python setup.py sdist`
- 'wheel' é um arquivo com formato próprio com o nome no formato `{nome}-{versao}-{versao-python}-{os}.whl` que  é gerado através do comando: `python setup.py bdist_wheel`. Ele também inclui um diretório de arquivos de metadados no formato `{nome}-{versao}.dist-info`
- 'eggs' é um tipo de pacote legado, introduzido antes do wheel, que era importado em vez de ser instalado (tal qual um arquivo `.jar` do Java)

## Build dos pacotes

Uma vez definida os formatos de pacotes, vamos discutir como o python lê e enetnde esses arquivos.

Historicamente a API Python para build de pacotes era a setuptools (`setup.py`), entretanto essa interface é complicada (principalmente se envolver pacotes python 'impuros', que incluem código C, por exemplo) e requer uma série de conhecimentos específicos da API para realizar o build corretamente. Nos últimos anos foram discutidos e implementados novas formas de buildar pacotes python.

A [PEP-517](https://peps.python.org/pep-0517/) flexibilizou a utilização de outros sistemas de build que não o setuptools (como o poetry, por exemplo), para isso basta criar [um arquivo pyproject.toml](https://peps.python.org/pep-0518/) que especifique qual sistema de build vai ser utilizado pelo projeto. A escolha de um build passa a ser mais por gosto do desenvolvedor do que por funcionalidades.

## Arquivos de configurações

### pyproject.toml

Ele não só define o sistema de build do projeto, como também metadados como nome do pacote, versão, descrição, licença, keywords e etc. Sua maior vantagem é sua flexibilidade e facilidade de leitura humana (graças ao formato `.toml`), esse arquivo permite que desenvolvedores especifiquem exatamente quais dependencias são necessárias para build e test, como serão instaladas e gerenciadas, aumentando a reproducibilidade e confiança do projeto.

### Setup.cfg

Outro arquivo de configuração utilizado especialmente para setuptools. Vem sendo cada vez menos utilizado dado que pyproject.toml são bem mais versáteis e "future-proof".