# Docstrings em Python

# 01 - Introdução ao Docstrings

> Independente de quão espetacular é o seu programa, se não existir uma documentação adequada para o usuário, todo o seu trabalho pode ser em vão.

**Mas o que são as docstrings?**  
Uma **docstring** em python é uma frase ou conjunto de frases que se coloca no início de um **módulo**, **classe**, **método** ou **função**. O objetivo destas frases é explicar o objetivo e como deve ser utilizado o item específico.

> As frases devem ficar entre dois conjuntos de **3 aspas** ("""assim...""").

**NOTE:**  
O texto extraído pode ser convertido em um texto HTML, que por sua vez pode ser visualizado na internet, ou em formato texto puro, adequado para elaboração de manuais ou visualização na tela.

---

# 02 - Atributo `__doc__` vs. método help()
Existem duas maneiras de se verificar documentações de **classes**, **métodos**, **funções**, **módulos** e **pacotes**.

São:

 - Atributo **`__doc__`**
 - Método **help()**

Por exemplo, vamos utilizar essas duas abordagens para verificar a documentação da biblioteca *Scikit-Learn*:

In [1]:
import sklearn

In [2]:
print(sklearn.__doc__)


Machine learning module for Python

sklearn is a Python module integrating classical machine
learning algorithms in the tightly-knit world of scientific Python
packages (numpy, scipy, matplotlib).

It aims to provide simple and efficient solutions to learning problems
that are accessible to everybody and reusable in various contexts:
machine-learning as a versatile tool for science and engineering.

See http://scikit-learn.org for complete documentation.



In [3]:
help(sklearn)

Help on package sklearn:

NAME
    sklearn

DESCRIPTION
    Machine learning module for Python
    
    sklearn is a Python module integrating classical machine
    learning algorithms in the tightly-knit world of scientific Python
    packages (numpy, scipy, matplotlib).
    
    It aims to provide simple and efficient solutions to learning problems
    that are accessible to everybody and reusable in various contexts:
    machine-learning as a versatile tool for science and engineering.
    
    See http://scikit-learn.org for complete documentation.

PACKAGE CONTENTS
    __check_build (package)
    _build_utils (package)
    _config
    _distributor_init
    _isotonic
    _loss (package)
    _min_dependencies
    base
    calibration
    cluster (package)
    compose (package)
    conftest
    covariance (package)
    cross_decomposition (package)
    datasets (package)
    decomposition (package)
    discriminant_analysis
    dummy
    ensemble (package)
    exceptions
    experime

**NOTE:**  
Vejam que o método **help()** nós dá um retorno com mais informações sobre a *biblioteca Scikit-Learn*.

---

# 03 - Docstrings de uma linha (One-Line)

> Docstrings de uma linha são comentários (documentação) que iniciam e terminam na mesma linha.

Por exemplo, vejam a **docstring** de uma linha do método **square()** abaixo:

In [4]:
def square(a):
  '''Returned argument a is squared.'''
  return a**a

In [5]:
print(square.__doc__)

Returned argument a is squared.


In [6]:
help(square)

Help on function square in module __main__:

square(a)
    Returned argument a is squared.



---

# 04 - Docstrings de várias linhas (Multi-Line)

> Docstrings de várias linhas na sua maior parte são utilizados para fazer uma descrição mais ampla do item (classe, método, pacote) específico.

Vejam o exemplo abaixo:

In [7]:
def some_function(argument1):
  """Summary or Description of the Function

  Parameters:
  argument1 (int): Description of arg1

  Returns:
  int:Returning value
  """
  return argument1

In [8]:
print(some_function.__doc__)

Summary or Description of the Function

  Parameters:
  argument1 (int): Description of arg1

  Returns:
  int:Returning value
  


In [9]:
help(some_function)

Help on function some_function in module __main__:

some_function(argument1)
    Summary or Description of the Function
    
    Parameters:
    argument1 (int): Description of arg1
    
    Returns:
    int:Returning value



---

# 05 - Formatos (padrões) de Docstrings

Existem muitos formatos de **docstrings** disponíveis, mas é sempre melhor usar os formatos que são facilmente reconhecidos pelo analisador de Docstrings e também por colegas *Cientistas de Dados/programadores*.

**NOTE:**  
Não há regras ou regulamentos para selecionar um formato Docstring, mas é necessária a consistência de escolher o mesmo formato sobre o projeto.

> Além disso, é preferível que você use o tipo de formatação, que é suportado principalmente pelo **Sphinx**.

Abaixo segue uma lista de formatos (padrões) de docstrings:

| Tipo de formatação   |      Descrição      |
|----------------------|:-------------------:|
| [Scikit-Learn](https://scikit-learn.org/stable/developers/contributing.html#documentation) |    Scikit-Learn approach   |
| [docstrings NumPy/SciPy](https://numpydoc.readthedocs.io/en/latest/format.html) |  Combinação de reStructured e GoogleDocstrings e suportada pelo Sphinx |
| [PyDocName](https://docs.python.org/2/library/pydoc.html) |    Módulo de documentação padrão para Python e suportado pelo Sphinx   |
| [EpyDocName](http://epydoc.sourceforge.net/) |    Renderize Epytext como uma série de documentos HTML e uma ferramenta para gerar documentação de API para módulos Python com base em suas Docstrings   |
| [Sequências de documentos do Google](https://sphinxcontrib-napoleon.readthedocs.io/en/latest/example_google.html) |    Estilo do Google   |

---

---

# 06 - Introdução ao Pydoc

> O **Pydoc** é um aplicativo de linha de comando que recebe como argumento o nome do módulo a partir do qual se deseja extrair a documentação e gera um arquivo html (próprio para apresentação em páginas da internet) ou um arquivo texto.

Vamos explorar o recurso mais interessante do módulo **Pydoc**.

## 06.1 - Pydoc Meta Dados

As variáveis entre **“underscores”** são denominadas de *meta dados*. Os *meta dados* reconhecidos pelo **Pydoc** são os seguintes:

```python
 __author__ = "seu nome"
 __copyright__ = "Copyright 2017, Por mim"
 __credits__ = ["equipe que desenvolve linux", "equipe que desenvolve Python", "equipe opensource"]
 __license__ = "GPL"
 __version__ = "1.0.1"
 __maintainer__ = "eu também"
 __email__ = "xyz@zkls.com"
 __status__ = "Production"
```

O *estado (status)* pode ser:

 - Prototype;
 - Development;
 - Production.

**NOTE:**  
Bem, o uso de meta dados é assunto de muita polêmica no mundo do software livre, não havendo um consenso se a melhor posição é dentro dos arquivos ou em um arquivo (ou arquivos) separado. Fica com você a decisão de utilizá-los ou não no seu código.

---

## 06.2 - Servidor Web do Pydoc
O **Pydoc** tem um **Servidor Web**, onde, nós podemos verificar alguns módulos/pacotes que utilizam **Pydoc**. Para abrir o mesmo basta digitar o código de linha de comando abaixo:

In [10]:
# Running Pydoc Web service.
!python -m pydoc -b

^C


No momento em que você executar a célula acima, uma nova janela será aberta em um número de porta arbitrário e o navegador da Web será semelhante ao mostrado abaixo:

![img](images/pydoc-01.webp)  

Aberto o **Servidor Web do Pydoc** vamos dar uma olhadinha no módulo **h5py**, que é um formato de arquivo usado para armazenar pesos da arquitetura de rede neural:

![img](images/pydoc-02.webp)  

---

# Resumos

 - **Docstrings boas práticas & Regras:**
   - O início de uma docstrings sempre inicia com letra maiúscula;
   - O fim de uma docstrings sempre precisa de um ponto final (.).
 - **Docstring (One-Line) vs. Docstring (Multi-Line):**
   - Docstring (One-Line):
     - Aspas de fechamento estão na mesma linha das aspas de abertura.
   - Docstring (Multi-Line):
     - Não tem linhas em branco antes ou depois da Docstring.
 - **docstrings vs. Comentários:**
   - docstrings:
     - Fica **entre três aspas (“””)** e podem se estender por várias linhas;
     - São utilizados para documentar **classe**, **métodos**, **funções**, **módulo** e **pacotes**.
     - É reconhecida por ferramentas de extração de documentação, tal como o pydoc;
     - É utilizada para dar detalhes de **o que o código realiza (faz)**;
     - São lidos por **quem** quer **utilizar o código**.
   - Comentários:
     - Inicia com o símbolo “#” e se estende até o final da linha;
     - São usados principalmente para **explicar partes não óbvias do código**;
     - Podem ser úteis para comentários sobre como corrigir bugs e tarefas que precisam ser feitas.
     - São ignorados tanto pelo interpretador Python como por ferramentas como o pydoc;
     - São utilizados para se explicar detalhes de **como** o código é **implementado**;
     - São lidos por **quem** precisa **dar manutenção no código**.

---

**REFERÊNCIAS:**  
[Documentando um programa Python com docstrings e Pydoc](https://cadernodelaboratorio.com.br/documentando-um-programa-python-com-docstrings-e-pydoc/)  
[Docstrings in Python Tutorial](https://www.datacamp.com/community/tutorials/docstrings-python?utm_source=adwords_ppc&utm_medium=cpc&utm_campaignid=1455363063&utm_adgroupid=65083631748&utm_device=c&utm_keyword=&utm_matchtype=&utm_network=g&utm_adpostion=&utm_creative=278443377095&utm_targetid=aud-299261629574:dsa-429603003980&utm_loc_interest_ms=&utm_loc_physical_ms=1001621&gclid=Cj0KCQiAubmPBhCyARIsAJWNpiPdVoWEdMA1meAxznTTCpSx7LmZm-JdS_QEBtvIcvl0S4DAFgyJNMMaArNBEALw_wcB)