<a href="https://colab.research.google.com/github/institutohumai/cursos-python/blob/master/PracticasDeDesarrollo/3_Desarrollo_III/4_Documentacion/clase_03_documentation.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab" data-canonical-src="https://colab.research.google.com/assets/colab-badge.svg"></a>

# 4. Documentación en Python

<img src="./images/doc_portada.jpg" alt="drawing" width="800"/>


En esta sección veremos la importancia de documentar tu código, qué metodología usar y qué herramientas tenemos a disposición para asistirnos en esta tarea. Comencemos!

__Temario__:
* La importancia de documentar tu código.
* Documentar versus Comentar.
* Docstrings para documentar tus módulos.
* Documentando tu proyecto en Python.



## 4.1 La importancia de documentar tu código

<img src="./images/document_computer.avif" alt="drawing" width="800"/>  


Esperamos que para esta instancia del curso hayan comprobado lo conveniente que resulta hayar un código bien prolijo y documentado. solo para reforzar esta idea, utilizaré una cita proveniente de un *speaker* y desarrollador llamado Guido van Rossum el cuál participó en una *PyCon* (conferencia muy importante de Python)

“Code is more often read than written.”

— Guido van Rossum

(Traducción: El código comunmente es más leido que escrito)

Hay que tener en cuenta que por lo general hay 2 tipos de personas que van a leer nuestro código:
* Usuarios
* Desarrolladores (incluídos nosotros!)

Personalmente, me suele ocurrir que leo un código que escribí hace un par de semanas y pienso "qué quize hacer acá?". Si esta es mi reacción ante mi propio código, imaginense lo que le puede ocurrir a otra persona intentando interpretarlo. Esto, amigos, es un síntoma de que no hemos documentado correctamente nuestro código.

También les puede ocurrir que intenten colaborar con el proyecto de otra persona, pero al no entender cómo funciona el código (debido a la falta de documentación), no sólo les será difícil realizar la contribución sino que también corren el riesgo de estropear el código existente.

En las siguientes secciones veremos cómo documentar nuestro código, desde pequeños módulos o scripts hasta un proyecto entero.


## 4.2 Documentar versus Comentar

Antes que nada, vamos a hacer una distinción entre dos conceptos que nos pueden generar confusión: **Documentar** y **Comentar**.

* **Documentar**: Consiste en explicarle a los **usuarios** cómo utilizar nuestro código.
* **Comentar**: Consiste en describir nuestro código a los **desarrolladores** para facilitar las tareas de desarrollo y mantenimiento.

Como vimos, estos conceptos tienen un objetivo y audiencias diferentes. Vamos a profundizar en cada uno.


### 4.2.1 Comentar

Los comentarios en Python se realizan con el caracter "#"

In [1]:
def hola_humai():
    # Esto es una línea de comentario
    print("Hola Humai!")

Según PEP 8, la línea de comentarios no debería superar los 72 caracteres. En caso de tener que elaborar comentarios largos, se sugiere emplear varias líneas.

In [None]:
def hola_humai():
    # Este es un ejemplo de un comentario muuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuy largo
    # que debería continuar en la línea siguiente.
    print("Hola Humai!")

Entonces, cuándo debemos **comentar** nuestro código? Como regla general, debemos escribir nuestro código de manera que **no necesitemos comentarios**. 


![image](./images/mas_despacio_cerebrito.jpeg)  


Oye más despacio cerebrito! No me acababamos de hablar sobre la importancia de documentar nuestro código? 

Exacto, **documentar**, no **comentar**.

La idea es que nuestro código esté lo suficientemente documentado como para no tener que sumar comentarios adicionales. Es decir, nuestro código debería poder ser interpretado sin ayuda de comentarios. Aquí van algunos consejos para que nuestro código sea fácilmente interpretado:

* Nombrar **variables** como **sustantivos** que sean representativos del contenido. Ej  ```nombre_usuario = "Juan"```  
* Nombrar **funciones** como verbos que describan la acción que realiza dicha función. Ej  ```def crear_usuario (nombre, apellido, email):```
* Nombrar **clases** como **sustantivos** que sean representativos de los objetos que se instanciarán a partir de ellas. Ej  ```class Usuario```  

Más allá del corolario anterior, **SI** está bien usar comentarios para:

* Explicar lo que hace una porción del código si la misma realiza una operación muy compleja. Ej  ```# Aquí se implementa un algoritmo para hallar la distancia mínima entre dos vectores. ```  

* Trabajos pendientes (TODOs). Ej  ```# TODO: Sumar validación de parámetros ```

* Notas para otros desarrolladores. Ej  ```# En caso de cambiar el bucket de s3, recordar actualizar el endpoint en el archivo config.py ```

Solo para que quede claro el concepto, veamos algunos ejemplos del tipo de comentarios que NO queremos en nuestro código:
*  ~~```# Esta función imprime el resultado ```~~ -> Podría entenderse si la función se llamase  ```imprimir_resultado()``` 
* ~~```# Este módulo recibe como entrada un entero y devuelve un string. ```~~ -> Podría entenderse si usamos correctamente el tipado (Clase de buenas prácticas II)
* ~~```# Aquí subimos el archivo resultante a un bucket de s3 ```~~ Podría entenderse si la función se llamase  ```subir_s3()``` 

### 4.1.3 Documentar

<img src="./images/documents.jpg" alt="drawing" width="800"/>  

Como dijimos anteriormente, la documentación tiene como audiencia a los **usuarios** de nuestro código. Veamos un ejemplo de documentación.

In [3]:
help(print)

Help on built-in function print in module builtins:

print(...)
    print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False)
    
    Prints the values to a stream, or to sys.stdout by default.
    Optional keyword arguments:
    file:  a file-like object (stream); defaults to the current sys.stdout.
    sep:   string inserted between values, default a space.
    end:   string appended after the last value, default a newline.
    flush: whether to forcibly flush the stream.



Aquí vemos la documentación de la función **print**. La misma nos explica para qué sirve la función, qué parámetros requiere y la explicación de cada parámetro.

Este texto que aparece cuando ejecutamos la función *help* recibe el nombre **Docstring**. Los docstrings son el mecanismo que emplearemos para documentar nuestros módulos en python. Veremos cómo usarlos en la próxima sección.

## 4.3 Docstrings para documentar tus módulos
### 4.3.1 Cómo usar docstrings

Como vimos, los docstrings nos ayudan a documentar funciones en Python. Dado que en Python todo es un objeto, veamos qué ocurre si inspeccionamos el objeto **print**.

In [4]:
dir(print)

['__call__',
 '__class__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__name__',
 '__ne__',
 '__new__',
 '__qualname__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__self__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__text_signature__']

Tenemos una propiedad que es  ```__doc__ ```. Veamos qué contiene.

In [5]:
print.__doc__

"print(value, ..., sep=' ', end='\\n', file=sys.stdout, flush=False)\n\nPrints the values to a stream, or to sys.stdout by default.\nOptional keyword arguments:\nfile:  a file-like object (stream); defaults to the current sys.stdout.\nsep:   string inserted between values, default a space.\nend:   string appended after the last value, default a newline.\nflush: whether to forcibly flush the stream."

Les resulta familiar? Exacto, la propiedad  ```__doc__ ``` no es nada más ni nada menos que el docstring. Editando esta propiedad podemos modificar el texto de ayuda que se muestra cuando ejecutamos la función **help**.

In [6]:
print.__doc__ = "Mi docstring personalizado"

AttributeError: attribute '__doc__' of 'builtin_function_or_method' objects is not writable

Ups! Esta propiedad no se puede editar en funciones que vienen predefinidas en Python. Sin embargo, sí podemos hacerlo cuando se trata de funciones que hayamos creado nosotros.

In [9]:
def hola_humai():
    print("Hola Humai!")

In [11]:
hola_humai.__doc__ = "Esto es una función que saluda a los estudiantes de Humai."

help(hola_humai)

Help on function hola_humai in module __main__:

hola_humai()
    Esto es una función que saluda a los estudiantes de Humai.



Adicionalmente, python nos permite ahorrarnos el paso de editar la propiedad ```__doc__``` si directamente escribimos esta descripción dentro de la función, como se muestra a continuación.

In [14]:
def hola_buenas_pracicas():
    '''"Esto es una función que saluda a los estudiantes del curso de Buenas Prácticas de Humai.'''
    print("Hola Buenas Prácticas!")

help(hola_buenas_pracicas)

Help on function hola_buenas_pracicas in module __main__:

hola_buenas_pracicas()
    "Esto es una función que saluda a los estudiantes del curso de Buenas Prácticas de Humai.



### 4.3.2 Docstrings multi línea

En muchos casos podemos resumir el funcionamiento de un módulo en una sola línea, como hicimos en el ejemplo anterior. Sin embargo, para módulos más complejos necesitaremos proveer mucha información a los usuarios, como ocurrió cuando inspeccionamos el docstring de la función **print**.

En estos casos, sería conveniente respetar un formato o convención para que nuestro docstring quede prolijo y fácil de leer. Como norma general, el dosctring debería tener este formato:

* Resúmen en 1 línea
* 1 línea en blanco
* Descripción más detallada del módulo
* 1 línea en blanco
* Aquí empieza el código

Veamos un ejemplo.

In [15]:
def hola_buenas_pracicas():
    '''"Función para saludar a los estudiantes de Buenas Prácticas.
    
    Este módulo se ejecuta automáticamente al iniciar la clase y saluda a todos
    los estudiantes del curso Buenas Prácticas de Humai. Debe ejecutarse inmediatamente
    después del módulo iniciar_clase_humai.
    '''
    
    print("Hola Buenas Prácticas!")


In [16]:
help(hola_buenas_pracicas)

Help on function hola_buenas_pracicas in module __main__:

hola_buenas_pracicas()
    "Función para saludar a los estudiantes de Buenas Prácticas.
    
    Este módulo se ejecuta automáticamente al iniciar la clase y saluda a todos
    los estudiantes del curso Buenas Prácticas de Humai. Debe ejecutarse inmediatamente
    después del módulo iniciar_clase_humai.



### 4.3.3 Tipos de docstrings

Hasta ahora venimos trabajando con ejemplos de docstring para funciones. Se estarán preguntando ¿La estructura del docstring es la misma para todos los tipos de objetos? Como se imaginarán, la respuesta es **no**. 

Tenemos un docstring adecuado para cada tipo de objeto. Veamos cuáles son!

**Clases** 

Cuando se trata de clases, nuestro docstring debe contener la siguiente información:
* Un breve resúmen de la utilidad que tiene esta función.
* Listado con los métodos y breve descripción de cada uno. 
* Listado de las propiedades (atributos) y breve descripción de cada una.

Veamos un ejemplo:


In [17]:
class Animal:
    """
    Esta clase representa a un Animal en la vida real.

    Atributos
    ----------
    nombre : str
        nombre del animal
    sonido : str
        el sonido que hace el animal
    num_patas : int
        el número de patas que tiene el animal (default 4)

    Métodos
    -------
    presentarse(sonido=None)
        Imprime el sonido que hace el animal.
    """


**Métodos** 

Los docstring de métodos deberían contener la siguiente información:
* Breve descripción de lo que hace el método y para qué se usa.
* Todos los argumentos que necesita.
* Identificar los argumentos que son opcionales.
* Valores por defecto que tienen los argumentos.
* Excepciones (Raises) cuando ocurre un error.
* Cualquier efecto secundario que surga de ejecutar este método.
* Cualquier restricción que debamos considerar a la hora de ejecutar el método.

Veamos un ejemplo siguiendo con la clase que creamos recién.

In [20]:
def presentarse(self, sonido=None):
        """Imprime el sonido que hace el animal.

        Si no se recibe el argumento 'sonido' entonces se utilizará el valor 
        por defecto que tenga este atributo.

        Parámetros
        ----------
        sonido : str, opcional
            El sonido que hace el animal (default:  None)

        Raises
        ------
        NotImplementedError
            Si el animal no tiene asignado un sonido por defecto y el método 
            no recibió este atributo como parámetro.
        """

        if self.sonido is None and sonido is None:
            raise NotImplementedError("Este animal no tiene sonido!")

        sonido_animal = self.sonido if sonido is None else sonido
        print(self.presentarse(sonido=sonido_animal))

**Paquetes**

El docstring se ubica en la parte superior del archivo ```__init__.py ``` (el mismo que vieron en el notebook de creación de paquetes) y debería tener la siguiente información:
* Breve descripción del módulo y cómo usarlo.
* Una lista de clases, ecepciones, funciones y cualquier otro objeto que contenga el módulo.

Veamos un ejemplo con un paquete conocido.

In [24]:
import requests

help(requests)

Help on package requests:

NAME
    requests

DESCRIPTION
    Requests HTTP Library
    ~~~~~~~~~~~~~~~~~~~~~
    
    Requests is an HTTP library, written in Python, for human beings.
    Basic GET usage:
    
       >>> import requests
       >>> r = requests.get('https://www.python.org')
       >>> r.status_code
       200
       >>> b'Python is a programming language' in r.content
       True
    
    ... or POST:
    
       >>> payload = dict(key1='value1', key2='value2')
       >>> r = requests.post('https://httpbin.org/post', data=payload)
       >>> print(r.text)
       {
         ...
         "form": {
           "key1": "value1",
           "key2": "value2"
         },
         ...
       }
    
    The other HTTP methods are supported - see `requests.api`. Full documentation
    is at <https://requests.readthedocs.io>.
    
    :copyright: (c) 2017 by Kenneth Reitz.
    :license: Apache 2.0, see LICENSE for more details.

PACKAGE CONTENTS
    __version__
    _internal_utils

**Scripts**

Cuando hablamos de *script* nos referimos a un archivo con código pensado para ser ejecutado directamente desde la consola. Es por ello que el docstring del script debe ser colocado al inicio del archivo y debe contener la información suficiente como para que el usuario pueda ejecutarlo sin problemas.

A continuación tenemos un ejemplo de docstring para scripts.

In [32]:
"""Inventario de animales del EcoParque

Este script permite al usuario imprimir en la consola todas las columnas 
de la planilla con el detalle de animales que se encuentran en el 
EcoParque. Asumimos que la primer fila de la planilla contiene el 
nombre de las columnas.

Esta herramienta solo acepta archivos en formato .csv y .xlsx.

Se requiere tener instalada la librería 'pandas' en el ambiente en que 
se ejecute el script.

Este archivo también puede ser importado como módulo y contiene las 
siguientes funciones:
    * obtener_columnas - devuelve el listado de columnas del archivo
    * imprimir_planilla - imprime el contenido del archivo
"""

import argparse

import pandas as pd

# Aquí continúa el script ....


### 4.3.4 Formatos de dosctrings

Como habrán imaginado, no existe una única forma de redactar estos docstrings. Existen formatos muy específicos sobre cómo definir los métodos, atributos, argumentos y demás. A continuación se muestran algunos de los formatos más frecuentes.

**Google docstring**

Como su nombre lo indica, es el formato recomendado por google. A continuación un ejemplo del docstring para el método *obtener_columnas* que acabamos de inventar en el script anterior.

```
"""Devuelve el nombre de las columnas de la planilla.

Args:
    archivo (str): Ubicación del archivo de la planilla.
    imprimir_cols (bool): Flag para imprimir las columnas en la consola
        (default es False)

Returns:
    list: una lista que contiene los nombres de las columnas.
"""
```

**reStructuredText**

Es el formato sugerido por la documentación oficial de Python. Siguiendo el ejemplo anterior...
```
"""Devuelve el nombre de las columnas de la planilla

:param archivo: Ubicación del archivo de la planilla
:type archivo: str
:param imprimir_cols:Flag para imprimir las columnas en la consola
    (default es False)
:type imprimir_cols: bool
:returns: una lista que contiene los nombres de las columnas
:rtype: list
"""
```

**NumPy/SciPy**

Es un formato sugerido por NumPy y es el resultando de una combinación de los formatos de Google y reStructuredTect.
```
"""Devuelve el nombre de las columnas de la planilla

Parameters
----------
archivo : str
    Ubicación del archivo de la planilla
imprimir_cols : bool, opcional
    Flag para imprimir las columnas en la consola (default es False)

Returns
-------
list
    una lista que contiene los nombres de las columnas
"""
```

## 4.4 Documentando tu proyecto en Python

<img src="./images/proyecto.jpg" alt="drawing" width="800"/>  

Ya casi lo tenemos! Hasta ahora vimos cómo documentar funciones, clases e incluso módulos enteros. Ahora llegó la hora de documentar tu proyecto. Recordemos que si bien se puede tratar de un proyecto personal que solo nosotros leamos, no olvidemos ponernos en la piel del usuario, el cual debe ser capaz de sentarse y entender nuestro proyecto de principio a fin.

Por lo general, los proyectos en Python se estructuran de la siguiente manera:

```
"""
project_root/
│
├── project/  # Código fuente del proyecto
├── docs/   # Documentación adicional
├── README
├── examples.py
"""
```


Veamos qué representa cada elemento:
* **project/**: Directorio que contiene todo el código del proyecto.
* **docs/:** Directorio que contiene documentación adicional tales como tutoriales, guías paso a paso, explicaciones, etc.
* **README:** Un breve resumen del proyecto y su finalidad. Se recomienda incluir cualquier requisito para poder ejecutar el proyecto.
* **examples.py:** Un script de python que muestra a modo de ejemplo cómo ejecutar el proyecto.

Naturalmente, cada proyecto es un mundo y cada desarrollador lo organiza de acuerdo a sus necesidades. Este simplemente es un resúmen de algunos puntos importantes que debería tener para que sea fácil de interpretar por terceros :)


Les propongo navegar por github y revisar repositorios de herramientas/librerías que conozcan para ver cómo están organizados y documentados. Ya que hemos estado trabajando con la librería *requests* les comparto el [**README**](https://github.com/psf/requests) para que lo chusmeen!


## 4.5 Conclusiones

Felicitaciones por haber llegado hasta aquí! Esperamos que haber reforzado la importancia de documentar el código a través de estos consejos y buenas prácticas. A continuación un breve resúmen de lo que vimos:
* Por qué debemos documentar el código
* Diferencias entre comentar y documentar
* Cuándo comentar y cuándo no
* docstrings como mecanismo de documentación
* tipos y formatos de docstrings
* Cómo documentar tu proyecto de python
