<img src="images/usm.png" width="480" height="240" align="left"/>

# MAT281 - 2° Semestre 2019
## Aplicaciones de la Matemática en la Ingeniería

## Objetivos de la clase

* Aprender buenas prácticas de codificación.
* Aprender test unitario con pytest.

## Contenidos

* [Estandarización de código](#c1)
* [Test unitario](#c2)

<a id='c1'></a>
## I.- Estandarización de código
Además de una correcta y ordenada estructura general que deben tener los programa, es conveniente mantener ciertas **buenas prácticas de codificación y el estilo de codificación recomendado**. Estas normas no son obligatorias, como lo es la propia sintaxis del lenguaje, pero conviene seguir las recomendaciones de los desarrolladores de Python para facilitar la lectura del programa y ayudar a encontrar posibles errores.

<img src="images/zen_python.png" width="360" height="240" align="center"/>


### Zen de python

El de python, creado por [Tim Peters](https://en.wikipedia.org/wiki/Tim_Peters_(software_engineer)) hace referencia a los "mandamientos" que todo usuario de python debe seguir en la programación de sus códigos.

In [1]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


### PEP8

Basado en el zen de python, se define una guiá de estilo única descrita íntegramente en el **Python Enhancement Proposal número 8**, abreviado como **PEP 8**. EL **PEP 8** dicta las normas que deben seguir la codificación de un código en python.

EL **PEP 8** y el **PEP 257** (convenciones para la documentación del código) fueron adaptados del originario texto de convenciones para el código Python, por [Guido van Rossum](https://es.wikipedia.org/wiki/Guido_van_Rossum), con algunas adiciones de la guía de [Barry Warsaw](https://wiki.ubuntu.com/BarryWarsaw).

Para ver más detalle consulte la siguiente páguina: [PEP 8](https://www.python.org/dev/peps/pep-0008/).


### Puntos mas importantes del PEP8

<img src="images/pep08.webp" width="480" height="240" align="center"/>


#### Basicos
* Siempre preferir espacios en ves de tabs.
* Usar 4 espacios en la indentación.
* Las lineas deben tener menos de 80 caracteres.
* Las lineas que pasen de esta longitud deben ser divididas en dos lineas, y la linea resultante de la división debe estar indentada.
* En una fila, las funciones y las clases deben estar separadas por dos lineas en blanco.
* No colocar espacios alrededor de indices de lista, llamadas de funciones o argumentos.

#### Nombres
* Las funciones deben estar declaradas en minúscula y las palabras separadas por guiones bajos `def funcion_cool()`.
* Los metodos privados de una clase deben comenzar con doble guion bajo `def __private_method()`.
* Los métodos protegidos de una clase deben comenzar con guion bajo `def _protected_method()`.
* Las clases y excepciones deben ser capitalizadas por palabra `class SuperClass`.
* Constantes del module deben estar en mayusculas separadas por guiones bajos `NUMERO_MAXIMO = 10`.
* Los métodos de instancia de una clase deben usar el parametro `self` como primer parámetro.
* Los métodos de clase deben usar `cls` como primer parámetro, para referirse a la misma clase.

#### Expresiones
* Usar negación en linea (`if a is not b`) en vez de negar una expresion positiva (`if not a is b`).
* No validar valores vacíos usando len if `(len(lista) == 0)`, usar if not lista.
* Siempre coloca los imports al inicio del archivo.
* Siempre importa funciones y clases usando from my_module import `MyClass` en ves de importar el modulo completo `import my_module`.
* Si aun debes usar imports relativos, usa la sintaxis `from . import my_module`
* Las importaciones siempre deben estar en el orden:
    * Módulos de la librería standar.
    * Módulos externos.
    * Módulos del proyecto.
* Y cada sección debe estar en orden alfabético.

### Buenas prácticas durante el curso

<img src="https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcSTBGhzXXDgeLJ9dUgfE7Vhn2R-96gOzWLEZtpsEnogfyLlymR4" width="240" height="240" align="center"/>

### a) Ser explicito con las variables

En lo posible, tanto el nombre de variables y funciones debe ser lo más explcíta posible

### Incorrecto

In [2]:
a = 10.  # altura
b = 3.5  # base

def funcion_01(a,b):
    return a*b
print("El volumen es %.1f" % (funcion_01(a,b)))

El volumen es 35.0


### Correcto

In [3]:
# variables
altura = 10.
base = 3.5

# funcion
def volumen(base, 
            altura):
    
    return base*altura

# calcular funcion para los parametros dados
volumen_calculado = volumen(base, 
                            altura)

# imprimir por pantall resultado
print("El volumen es %.1f" % (volumen_calculado))

El volumen es 35.0


### b) Identación funciones

Debe haber un orden en la identación de las funciones, para distinguir correctamente los parámetros que influyen.

### Incorrecto

In [4]:
def funcion_01(x1,x2,x3,x4):
    print(x1,x2,x3,x4)
    
def funcion_02(
    x1,x2,x3,x4):
    print(x1,x2,x3,x4)

### Correcto

In [5]:
def funcion_01(x1,x2,
               x3,x4):
    
    print(x1,x2,x3,x4)
    
def funcion_02(
        x1,x2,
        x3,x4):
    
    print(x1,x2,x3,x4)

### c) Identación paréntesis / corchete / llave
Al igual que los parámetros de las funciones, la identación en objetos iterables es necesario que tnega un orden.

### Incorrecto

In [6]:
lista_01 = [1, 2, 3,4, 5, 6,7, 8, 9,]

### Correcto

In [7]:
lista_01 = [
    1, 2, 3,
    4, 5, 6,
    7, 8, 9, 
]

### Documentación de código

Casi tan importante como la escritura de código, es su correcta documentación, una parte fundamental de cualquier programa que a menudo se infravalora o simplemente se ignora. Aparte de los comentarios entre el código explicando cómo funciona, el elemento básico de documentación de Python es el **Docstring** o cadena de documentación, que ya hemos visto. 

Simplemente es una cadena de texto con triple comillas que se coloca justo después de la definición de función o clase que sirve de documentación a ese elemento.

Todos los objetos documentables (módulos, clases, métodos y funciones) cuentan con un atributo `__doc__` el cual contiene su respectivo comentario de documentación. 

### Ejemplo básico

In [8]:
# crear funcion promedio
def promedio(a, b):
    'Calcula el promedio de dos números.'
    return (a + b) / 2

# comentarios de la funcion promedio
promedio.__doc__

'Calcula el promedio de dos números.'

### Ejemplo más elaborado

In [9]:
from cmath import sqrt

# crear funcion formula cuadratica

def formula_cuadratica(a, b, c):
    """Resuelve una ecuación cuadrática.

    Devuelve en una tupla las dos raíces que resuelven la
    ecuación cuadrática:
    
        ax^2 + bx + c = 0.

    Utiliza la fórmula general (también conocida
    coloquialmente como el "chicharronero").

    Parámetros:
    a -- coeficiente cuadrático (debe ser distinto de 0)
    b -- coeficiente lineal
    c -- término independiente

    Excepciones:
    ValueError -- Si (a == 0)
    
    """
    if a == 0:
        raise ValueError(
            'Coeficiente cuadrático no debe ser 0.')
    
    discriminante = b ** 2 - 4 * a * c
    x1 = (-b + sqrt(discriminante)) / (2 * a)
    x2 = (-b - sqrt(discriminante)) / (2 * a)
    return (x1, x2)


# comentarios de la funcion formula cuadratica
formula_cuadratica.__doc__

'Resuelve una ecuación cuadrática.\n\n    Devuelve en una tupla las dos raíces que resuelven la\n    ecuación cuadrática:\n    \n        ax^2 + bx + c = 0.\n\n    Utiliza la fórmula general (también conocida\n    coloquialmente como el "chicharronero").\n\n    Parámetros:\n    a -- coeficiente cuadrático (debe ser distinto de 0)\n    b -- coeficiente lineal\n    c -- término independiente\n\n    Excepciones:\n    ValueError -- Si (a == 0)\n    \n    '

### Tipos de Docstring

Existen varias formas de documentar tus funciones, las principales encontradas en la literatura son:
* [Google docstrings](https://github.com/google/styleguide/blob/gh-pages/pyguide.md#38-comments-and-docstrings):	Google’s recommended form of documentation.
* [reStructured Text](http://docutils.sourceforge.net/rst.html):	Official Python documentation standard; Not beginner friendly but feature rich.
* [NumPy/SciPy docstrings](https://numpydoc.readthedocs.io/en/latest/format.html):	NumPy’s combination of reStructured and Google Docstrings.
* [Epytext](http://epydoc.sourceforge.net/epytext.html)	A Python adaptation of Epydoc; Great for Java developer.

<a id='c2'></a>
## II.-  Test Driven Development (TDD)

<img src="images/tdd_mensaje.jpeg" width="480" height="240" align="center"/>

### ¿Qué es el Test Driven Development?

El   **Test-Driven Development** o **TDD** es una técnica de diseño e implementación de software incluida dentro de la metodología ágil.

El**TDD** es una técnica para diseñar software que se centra en tres pilares fundamentales:

* La implementación de las funciones justas que el cliente necesita y no más.
* La minimización del número de defectos que llegan al software en fase de producción.
* La producción de software modular, altamente reutilizable y preparado para el cambio.

### ¿ En qué consiste el  *Test Driven Development*?
En palabras simples, el desarrollo guiado por pruebas pone las pruebas en el corazón de nuestro trabajo. En su forma más simple consiste en un proceso iterativo de 3 fases:


<img src="images/tdd_imagen_01.png" width="480" height="240" align="center"/>

- **Red**: Escribe un test que ponga a prueba una nueva funcionalidad y asegurate de que el test falla
- **Green**: Escribe el código mínimo necesario para pasar ese test
- **Refactor**: Refactoriza de ser necesario


### ¿Porqué debería usarlo?

Existen varias razones por las que uno debería usar TDD. Entre ellas podemos encontrar:
- Formular bien nuestros pensamientos vía la escritura de un test significativo antes de ponernos a solucionar el problema nos ayuda a clarificar los límites del problema y cómo podemos resolverlo. Con el tiempo esto ayuda a obtener un diseño modular y reusable del código.
- Escribir tests influencia la forma en que escribimos código, haciéndolo más legible a otros y a tu futuro yo.
- Verifica que el código funciona de la manera que se espera, y lo hace de forma automática.
- Te permite realizar *refactoring* con la certeza de que no has roto nada.
- Los tests escritos sirven como documentación para otros desarrolladores.
- Es una práctica requerida en metodologías de desarrollo de software *agile*.

### Evidencia empírica
El 2008, Nagappan, Maximilien, Bhat y Williams publicaron el paper llamado *[Realizing Quality Improvement Through Test Driven Development - Results and Experiences of Four Industrial Teams](/.attachments/Realizing%20Quality%20Improvement%20Through%20Test%20Driven%20Development%20-%20Results%20and%20Experiences%20of%20Four%20Industrial%20Teams%20(nagappan_tdd)-8514b668-2c79-4567-a57d-f682b44dd3d9.pdf)*, en donde estudiaron 4 equipos de trabajo (3 de Microsoft y 1 de IBM), con proyectos que variaban entre las 6000 lineas de código hasta las 155k. Estas son parte de sus conclusiones:

> Todos los equipos demostraron una baja considerable en la densidad de defectos: 40% para el equipo de IBM, y entre 60-90% para los equipos de Microsoft.

Como todo en la vida, nada es gratis:

> Incremento del tiempo de desarrollo varía entre un 15% a 35%.

Sin embargo

> Desde un punto de vista de eficacia este incremento en tiempo de desarrollo se compensa por los costos de mantención reducidos debido al incremento en calidad.

Además es importante escribir tests junto con la implementación en pequeñas iteraciones. [George y Williams](https://collaboration.csc.ncsu.edu/laurie/Papers/TDDpaperv8.pdf) encontraron que escribir tests después de que la aplicación está mas o menos lista hace que se testee menos porque los desarrolladores piensan en menos casos, y además la aplicación se vuelve menos testeable. Otra conclusión interesante del estudio de George y Williams es que un 79% de los desarrolladores experimentaron que el uso de TDD conlleva a un diseño más simple.

### ¿Puedo usar TDD siempre?
No, pero puedes usarlo casi siempre. El análisis exploratorio es un caso en que el uso de TDD no hace sentido. Una vez que tenemos definido el problema a solucionar y un mejor entendimiento del problema podemos aterrizar nuestras ideas a la implementación vía testing.

### Librerías disponibles en python

- [unittest](https://docs.python.org/3/library/unittest.html): Módulo dentro de la librería estándar de Python. Permite realizar tests unitarios, de integración y end to end.
- [doctest](https://docs.python.org/3/library/doctest.html): Permite realizar test de la documentación del código, cuando éste trae ejemplos de uso (Como en la documentacion de [Numpy](http://www.numpy.org/) o [Pandas](https://pandas.pydata.org/)).
- [pytest](https://docs.pytest.org/en/latest/): Librería de testing ampliamente usada en proyectos nuevos de Python.
- [nose](https://nose.readthedocs.io/en/latest/): Librería que extiende unittest para hacerlo más simple.
- [coverage](https://coverage.readthedocs.io/en/v4.5.x/): Herramienta para medir la [cobertura de código](https://es.wikipedia.org/wiki/Cobertura_de_c%C3%B3digo) de los proyectos.
- [tox](https://tox.readthedocs.io/en/latest/): Herramienta para facilitar el test de una librería en diferentes versiones e intérpretes de Python.
- [hypothesis](https://hypothesis.readthedocs.io/en/latest/): Librería para escribir tests vía reglas que ayuda a encontrar casos borde.
- [behave](https://behave.readthedocs.io/en/latest/): Permite utilizar [Behavior Driven Development](https://es.wikipedia.org/wiki/Desarrollo_guiado_por_comportamiento), un proceso de desarrollo derivado del TDD.

### TDD con pytest

<img src="images/pytest.png" width="360" height="240" align="center"/>


La librería **pytest** es un librería de python que facilita la escritura de pruebas pequeñas, pero se escala para admitir pruebas funcionales complejas para aplicaciones y bibliotecas.

Pytest tiene algunas otras características excelentes:

* Soporte para la declaración de aserción incorporada en lugar de usar métodos especiales self.assert * ()
* Soporte para el filtrado de casos de prueba.
* Capacidad para volver a ejecutar desde la última prueba fallida
* Un ecosistema de cientos de complementos para ampliar la funcionalidad.

### Pytest en jupyter notebook

**Observación.-** Para ejecutar los siguientes comenados es necesario tener instalada  las librerías de `pytest` y `ipytest`.

### Cómo aplicar pytest corectamente

Lo primero es crear un instancia para realizar los test sobre el arcrchivo **.ipynb**.

In [3]:
import pytest
import ipytest

# set the filename
__file__ = '04_buenas_practicas.ipynb'

# enable pytest's assertions and ipytest's magics
ipytest.config(rewrite_asserts=True, magics=True)

<ConfigContext rewrite_asserts=True, magics=True, tempfile_fallback=False, clean='[Tt]est*', addopts=(), raise_on_error=False, run_in_thread=False>

### Ejemplo básico
Veamos como incorporar un test básico en pytest. EL ejemplo consistirá en crear una función que calcule el área del circulo.

#### Paso 1: crear el test

Lo primero es crear el test, en donde le pedimos que nos de el área del circulo cuando el radio $r$ es igual a 1.

Para eso uno ocupa la aserción `assert` que sirve para ver si dos variables son idénticas. Por supuesto, existen varias aserciones, por ejemplo:

| Método                  | Equivalente a |
|-------------------------|------------------|
| .assertEqual(a, b)    | a == b           |
| .assertTrue(x)          | bool(x) is True  |
| .assertFalse(x)         | bool(x) is False |
| .assertIs(a, b)         | a is b           |
| .assertIsNone(x)        | x is None        |
| .assertIn(a, b)         | a in b           |
| .assertIsInstance(a, b) | isinstance(a, b) |

In [4]:
# crear test
def test_area_circulo():
    assert area_circulo(1) == pi
    
# correr test
ipytest.run('-qq')

.                                                                                                                  [100%]


Como es de esperar el test falla, ahora pasemos al paso 2 que es crear la función.

#### Paso 2: crear la función a testear

In [5]:
# crear funcion

from math import pi

def area_circulo(r):
    
    return pi*r**2

In [6]:
# correr el test
ipytest.run('-qq')

.                                                                                                                  [100%]


El test paso la prueba!. Ahora veamos más ejemplos:

### i) Correr varios test al mismo tiempo

Realicemos una test para todas las operaciones básicas (sumar, restar, multiplicar y dividir). 

In [7]:
# funciones a testear
def add(x, y):
    return x + y

def subtract(x, y):
    return x - y +1

def multiplicate(x, y):
    return x*y


def divide(x, y):
    return x/y-1


# test
def test_add():
    assert add(4, 5) == 9
    
def test_subtract():
    assert subtract(4, 5) == -1
    
def test_multiplicate():
    assert multiplicate(4, 5) == 20
    
def test_divide():
    assert divide(4, 5) == 0.8
    
# correr test
ipytest.run('-qq')

..F.F                                                                                                              [100%]
_____________________________________________________ test_subtract ______________________________________________________

    def test_subtract():
>       assert subtract(4, 5) == -1
E       assert 0 == -1
E        +  where 0 = subtract(4, 5)

<ipython-input-7-1ded26cbb3eb>:21: AssertionError
______________________________________________________ test_divide _______________________________________________________

    def test_divide():
>       assert divide(4, 5) == 0.8
E       assert -0.19999999999999996 == 0.8
E        +  where -0.19999999999999996 = divide(4, 5)

<ipython-input-7-1ded26cbb3eb>:27: AssertionError


Suce que cuando 

### ii) Varias asserciones al mismo tiempo

Con el comando `%%run_pytest[clean] -qq`  se ejecuta solo el test de la celda en la cuala estemos trabajando.


In [40]:
%%run_pytest[clean] -qq
def area_circulo_mod(r):
    if r>=0:
        result = pi*r**2
        return result
    else:
        raise ValueError('Valor negativo')
    
def test_area_circulo():
    assert area_circulo_mod(0) == 0
    assert area_circulo_mod(1) == pi
    assert area_circulo_mod(2) == 4*pi

.                                                                                                                  [100%]


iii) Funciones *Fixtures*

Los *fixtures*  son funciones que se ejecutarán antes de cada función de prueba a la que se aplique. Los accesorios se utilizan para alimentar algunos datos a las pruebas, como conexiones de bases de datos, URL para probar y algún tipo de datos de entrada. 

Veamos un ejemplo:

In [42]:
%%run_pytest[clean] -qq

@pytest.fixture
def input_value():
    input = 39
    return input

def test_divisible_by_3(input_value):
    assert input_value % 3 == 0

def test_divisible_by_6(input_value):
    assert input_value % 6 == 0

.F                                                                                                                 [100%]
__________________________________________________ test_divisible_by_6 ___________________________________________________

input_value = 39

    def test_divisible_by_6(input_value):
>       assert input_value % 6 == 0
E       assert (39 % 6) == 0

<ipython-input-42-a74ac012e540>:10: AssertionError


#### iv) Asserciones con *pandas*

Cuando se quiere realizar test unitarios sobre objetos *pandas.series* o *pandas.DataFrame*, es necesario ocupar aserciones especiales de *pandas*.

In [51]:
%%run_pytest[clean] -qq

from pandas.util.testing import assert_frame_equal # aserciones de pandas
import pandas as pd

# crear input
@pytest.fixture(name='dataset_01')
def dataframe_01():
    df1 = pd.DataFrame({'a': [1, 2], 'b': [3, 4]})
    return df1

# crear ouput
@pytest.fixture(name='dataset_02')
def dataframe_02():
    df2 = pd.DataFrame({'a': [1, 2], 'b': [3.0, 4.0]})
    return df2

# juntar informacion input y output
def test_pandas(dataset_01,dataset_02):
    assert_frame_equal(dataset_01, dataset_02) 

F                                                                                                                  [100%]
______________________________________________________ test_pandas _______________________________________________________

dataset_01 =    a  b
0  1  3
1  2  4, dataset_02 =    a    b
0  1  3.0
1  2  4.0

    def test_pandas(dataset_01,dataset_02):
>       assert_frame_equal(dataset_01, dataset_02)

<ipython-input-51-470b2930b323>:18: 
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 
/home/falfaro/.local/share/virtualenvs/messi-l92U7xSO/lib/python3.6/site-packages/pandas/util/testing.py:1348: in assert_frame_equal
    obj='DataFrame.iloc[:, {idx}]'.format(idx=i))
/home/falfaro/.local/share/virtualenvs/messi-l92U7xSO/lib/python3.6/site-packages/pandas/util/testing.py:1193: in assert_series_equal
    assert_attr_equal('dtype', left, right)
/home/falfaro/.local/share/virtualenvs/messi-l92U7xSO/l

## Referencia

1. [Realizing Quality Improvement Through Test Driven Development - Results and Experiences of Four Industrial Teams](/.attachments/Realizing%20Quality%20Improvement%20Through%20Test%20Driven%20Development%20-%20Results%20and%20Experiences%20of%20Four%20Industrial%20Teams%20(nagappan_tdd)-8514b668-2c79-4567-a57d-f682b44dd3d9.pdf)*, es una buena lectura, sobretodo los consejos que dan en las conclusiones.
2. [Google Testing Blog](https://testing.googleblog.com/): Poseen varios artículos sobre cómo abordar problemas tipo, buenas prácticas de diseño para generar código testeable, entre otros. En particular destaca la serie *Testing on the Toilet*.
3. [Cualquier artículo de Martin Fowler sobre testing](https://martinfowler.com/tags/testing.html), empezando por [éste](https://martinfowler.com/articles/practical-test-pyramid.html)
4. [Design Patterns](https://sourcemaking.com/design_patterns): Los patrones de diseño de software tienen en consideración que el código sea *testeable*.