# TDD ‚úÖ Una introduci√≥n al Test Driven development.

## Introducci√≥n
El objetivo de este blog es hacerles una introduccion al desarrollo basado en pruebas aplicado a Data Science usando *Test Driven Development*, esta t√©cnica es muy usada en otras ar√©as de programacion.

### ¬øQu√© es el *Test Driven Development*?
En palabras simples, el desarrollo guiado por pruebas pone las pruebas en el coraz√≥n de nuestro trabajo. En su forma m√°s simple consiste en un proceso iterativo de 3 fases:

![](https://github.com/ricardobrein/ricardobrein.github.io/blob/d87d1085d789d9cbfa4ece23a5379e68c66c319c/docs/images/tdd.png)



- **Red**: Escribe un test que ponga a prueba una nueva funcionalidad y asegurate de que el test falla
- **Green**: Escribe el c√≥digo m√≠nimo necesario para pasar ese test
- **Refactor**: Refactoriza de ser necesario

### Ejemplo sencillo

A modo de ejemplo, vamos a testear la funci√≥n `paridad`, que determina si un n√∫mero natural es par o no.

Lo primero que se debe hacer es crear el test, para ello utilizaremos la librer√≠a [pytest](https://docs.pytest.org/en/6.2.x/). 

> **Nota**: No es necesario conocer previamente la librer√≠a `pytest` para entender el ejemplo.

```python
@pytest.mark.parametrize(
    "number, expected",
    [
        (2, 'par'),
])
def test_paridad(number, expected):
    assert paridad(number) == expected
```

Ahora, se escribe la funci√≥n `paridad` (**fase green**):

```python
def paridad(n:int)->str:
    """
    Determina si un numero natural es par o no.
    
    :param n: numero entero
    :return: 'par' si es el numero es par; 'impar' en otro caso
    """
    return 'par' if n%2==0 else 'impar'
```


Hemos cometido un descuido a proposito, no hemos testeado el caso si el n√∫mero fuese impar, por lo cual reescribimos el test (**fase refactor**)

```python
@pytest.mark.parametrize(
    "number, expected",
    [
        (2, 'par'),
        (3, 'impar'),
])
def test_paridad(number, expected):
    assert paridad(number) == expected
```

## ¬øPorqu√© deber√≠a usarlo?

Existen varias razones por las que uno deber√≠a usar TDD. Entre ellas podemos encontrar:
- Formular bien nuestros pensamientos mediante la escritura de un test significativo antes de ponernos a solucionar el problema nos ayuda a clarificar los l√≠mites del problema y c√≥mo podemos resolverlo. Con el tiempo esto ayuda a obtener un dise√±o modular y reusable del c√≥digo.
- Escribir tests ayuda la forma en que escribimos c√≥digo, haci√©ndolo m√°s legible a otros. Sin embargo, no es un acto de altruismo, la mayor√≠a de las veces ese otro es tu futuro yo.
- Verifica que el c√≥digo funciona de la manera que se espera, y lo hace de forma autom√°tica.
- Te permite realizar *refactoring* con la certeza de que no has roto nada.
- Los tests escritos sirven como documentaci√≥n para otros desarrolladores.
- Es una pr√°ctica **requerida** en metodolog√≠as de desarrollo de software *agile*.

## Evidencia emp√≠rica
El 2008, Nagappan, Maximilien, Bhat y Williams publicaron el paper llamado [Realizing Quality Improvement Through Test Driven Development - Results and Experiences of Four Industrial Teams](https://www.microsoft.com/en-us/research/wp-content/uploads/2009/10/Realizing-Quality-Improvement-Through-Test-Driven-Development-Results-and-Experiences-of-Four-Industrial-Teams-nagappan_tdd.pdf), en donde estudiaron 4 equipos de trabajo (3 de Microsoft y 1 de IBM), con proyectos que variaban entre las 6000 lineas de c√≥digo hasta las 155k. Estas son parte de sus conclusiones:

> Todos los equipos demostraron una baja considerable en la densidad de defectos: 40% para el equipo de IBM, y entre 60-90% para los equipos de Microsoft.

Como todo en la vida, nada es gratis:

> ‚è±Ô∏èIncremento del tiempo de desarrollo var√≠a entre un 15% a 35%.

**Sin embargo...**

> Desde un punto de vista de eficacia este incremento en tiempo de desarrollo se compensa por los costos de mantenci√≥n reducidos debido al incremento en calidad.

## ¬øPuedo usar TDD siempre?
No, pero puedes usarlo casi siempre. El an√°lisis exploratorio es un caso en que el uso de TDD no hace sentido. Una vez que tenemos definido el problema a solucionar y un mejor entendimiento del problema podemos aterrizar nuestras ideas a la implementaci√≥n v√≠a testing.

## Librer√≠as disponibles
Ac√° listamos algunas librer√≠as de TDD en Python:
- [unittest](https://docs.python.org/3/library/unittest.html): M√≥dulo dentro de la librer√≠a est√°ndar de Python. Permite realizar tests unitarios, de integraci√≥n y ent-to-end.
- [doctest](https://docs.python.org/3/library/doctest.html): Permite realizar test de la documentaci√≥n del c√≥digo (ejemplos: [Numpy](http://www.numpy.org/) o [Pandas](https://pandas.pydata.org/)).
- [pytest](https://docs.pytest.org/en/latest/): Librer√≠a de testing ampliamente usada en proyectos nuevos de Python.
- [nose](https://nose.readthedocs.io/en/latest/): Librer√≠a que extiende unittest para hacerlo m√°s simple.
- [coverage](https://coverage.readthedocs.io/en/v4.5.x/): Herramienta para medir la [cobertura de c√≥digo](https://es.wikipedia.org/wiki/Cobertura_de_c%C3%B3digo) de los proyectos.
- [üåü highly recommended: tox](https://tox.readthedocs.io/en/latest/): Herramienta para facilitar el test de una librer√≠a en diferentes versiones e int√©rpretes de Python.
- [hypothesis](https://hypothesis.readthedocs.io/en/latest/): Librer√≠a para escribir tests v√≠a reglas que ayuda a encontrar casos borde.
- [Behavior Driven Development](https://es.wikipedia.org/wiki/Desarrollo_guiado_por_comportamiento), un proceso de desarrollo derivado del TDD.