# Unit Testing

Apuntes del curso *Unit Testing for Data Science in Python* de Datacamp (https://learn.datacamp.com/courses/unit-testing-for-data-science-in-python)

Al momento de definir una función es necesario testear si funciona de la manera en que se espera. La forma habitual es entregar parametros a la función de manera manual, ejecutarla y reconocer si el resultado es correcto o no.

Lamentablemente, ese proceso es largo y por cada modificación que se hace a la función debiesemos volver a verificar que el resultado es lo que esperamos

La idea detrás de los test unitarios es automatizar aquel proceso

* En este Jupyter notebook usaré una funcionalidad que me permite importar el código desde un archivo .py (%load filename.py)

* Para ejecutar comandos de terminal en jupyter notebook basta anteponer un ! al comando, por ende todas las celdas que lleven un ! antes son comandos de terminal

## 1- Conceptos básicos

Hay mas de una libreria en Python que permite realizar tests:
        - pytest
        - unittest
        - nosetest
        - doctest

La más popular es pytest.

1 -Para que pytest funcione, debemos crear un archivo .py que inicie con la palabra test_

2- En ese archivo, importamos la libreria e importamos la función que necesitamos testear.

3- La función que se encarga de realizar el testeo tambien debe empezar con el nombre test_

4- La verificación de que se cumple lo esperado se realiza mediante el statement assert

Por ende el test_module.py queda de la siguiente forma:

In [None]:
# %load test_module.py
import pytest
from utils_module import function_1

def test_first_function():
    assert function_1 == 1
    
def test_first_function_bad():
    assert function_1 == 0

Mientras que la función se encuentra en *utils_module.py* y lo unico que retorna es 1

In [None]:
# %load utils_module.py
def function_1():
    return 1

Para ejecutar los test debemos ingresar en la consola *pytest nombrearchivo.py*

In [20]:
!pytest test_module.py

platform win32 -- Python 3.8.3, pytest-5.4.3, py-1.9.0, pluggy-0.13.1
rootdir: C:\Users\pamel\Documents\git\Python-Study\Unit testing
collected 2 items

test_module.py .F                                                        [100%]

___________________________ test_first_function_bad ___________________________

    def test_first_function_bad():
>       assert function_1() == 0
E       assert 1 == 0
E        +  where 1 = function_1()

test_module.py:8: AssertionError
FAILED test_module.py::test_first_function_bad - assert 1 == 0


Lo que obtenemos es el reporte de resultados del testeo

La primera parte describe información del sistema, la vesión de Python, entre otros

La segunda parte dice: *collected 2 items* esto quiere decir que hay 2 pruebas por hacer

Luego, tenemos el nombre del modulo de testeo seguido por un *.F*

La F inidica que hubo un fallo, es decir, que no se cumplió lo que se esperaba. de igual fomar, si la ejecución falla por cualquier otra razon, tambien devolverá que el test falló.

El punto indica que la prueba fue existosa, por eso recibimos un *.F* pues la primera prueba fue exitosa y la segunda no.

En la sección de FAILURES tenemos una vista más detallada de lo que no funcionó

Finalmente la ultima sección nos entrega un sumario de la ejecución, incluyendo el tiempo que tomó y las pruebas que no pasaron

### 1.1 Test como documentación

Al tener pruebas programadas, tambien ayudamos a mejorar la documentación del sistema

Para verificar los test asociados a un proyecto basta con usar el comando *cat nombrearchivo.py*

En nuestro caso: (como es windows uso type en lugar de cat)

In [3]:
!type test_module.py

import pytest
from utils_module import function_1

def test_first_function():
    assert function_1() == 1
    
def test_first_function_bad():
    assert function_1() == 0


### 1.2 Reducir el downtime

Al hacer test podemos disminuir significativamente los errores en productivo

Antes de enviar el codigo a los sistemas en producción podemos verificar si cumple los test y de no ser así rechazar los cambio y no cambiar los sistemas productivos, e incluso informar a los responsables que el codigo necesita modificaciones

### 1.3 Tipos de test

Unit test: verifican que una unidad este funcionando correctamente. Se conoce como una unidad a pequenas e independientes partes del codigo (puede ser una función o una clase)

Integration test: chequean si múltiples unidades funcionan bien cuando estan conectadas

End to End test: verifican que todo el software en su conjunto funcione de la manera esperada

## 2- Agregar mensajes opcionales

Cuando se usa el statement de assert podemos agregar un mensaje en el caso de que la prueba no haya sido exitosa

Se usa el siguiente formato:

    assert function_result == expected_result, fail_message
    assert a == b, "a is not equal to b" 

Creamos una función para calcular el área que contiene errores pues no convierte en float antes de hacer el calculo *compute_area_with_bug*

In [None]:
# %load utils_module.py
def function_1():
    return 1


def compute_area_with_bug(a, b) -> float:
    """
    calculate the area of a rectangle
    """
    return a * b

Al test le agregamos el mensaje en el formato indicado

In [None]:
# %load test_module.py
import pytest
from utils_module import \
    (function_1, compute_area_with_bug)


def test_first_function():
    """
    this test should be successful
    """
    assert function_1() == 1

    
def test_first_function_bad():
    """
    this test should fail
    """
    assert function_1() == 0
    
    
def test_compute_area_bug():
    """
    this test should fail if we pass a string it
    won't transform it to float
    """
    actual_value = compute_area_with_bug(2, "3")
    expected_value = 6
    msg = (f"expected value is {expected_value},"
           f" actual value is {actual_value}")
    assert actual_value == expected_value, msg

Finalmente corremos el test, al igual que la vez anterior debiese fallar el segundo test, pero tambien el tercero

In [9]:
!pytest test_module.py

platform win32 -- Python 3.8.3, pytest-5.4.3, py-1.9.0, pluggy-0.13.1
rootdir: C:\Users\pamel\Documents\git\Python-Study\Unit testing
collected 3 items

test_module.py .FF                                                       [100%]

___________________________ test_first_function_bad ___________________________

    def test_first_function_bad():
>       assert function_1() == 0
E       assert 1 == 0
E        +  where 1 = function_1()

test_module.py:8: AssertionError
____________________________ test_compute_area_bug ____________________________

    def test_compute_area_bug():
        actual_value = compute_area_with_bug(2, "3")
        expected_value = 6
        msg = (f"expected value is {expected_value},"
               f" actual value is {actual_value}")
>       assert actual_value == expected_value, msg
E       AssertionError: expected value is 6, actual value is 33
E       assert '33' == 6

test_module.py:15: AssertionError
FAILED test_module.py::test_first_function_bad - ass

Es recomendado incluir un mensake en statement de assert porque es más fácil de entender que el output automatico que entrega

## 3- Preacaución con las comparaciones de float

Por la forma que trabaja python algunos calculos con float funcionan distinto a lo esperado, por ejemplo:

In [13]:
0.2 + 0.1

0.30000000000000004

Por ende obtendriamos un error si hiciesemos la comparación:

    assert 0.2 + 0.1 == 0.3

Para solucionar este problema debemos usar la función pytest.approx(), donde el ejemplo anterior quedaría como:

    assert 0.1 + 0.2 == pytest.approx(0.3)

WARNING, se necesita hacer lo mismo con los numpy array

    assert np.array([0.1, 0.1 + 0.2]) == pytest.approx(np.array([0.1, 0.3]))

## 4- Múltiples assertments por unit test

Tambien es posible realizar más de una prueba por cada unit test

Supongamos queremos saber si el resultado de la función es de un tipo en particular y agregamos el test test_compute_area

Las funciones quedan:

In [None]:
# %load utils_module.py
def function_1():
    return 1


def compute_area_with_bug(a, b) -> float:
    """
    calculate the area of a rectangle
    """
    return a * b


def compute_area(a, b) -> float:
    """
    calculate the area of a rectangle
    """
    return float(a) * float(b)

Los test quedan como:

In [None]:
# %load test_module.py
import pytest
from utils_module import \
    (function_1, compute_area_with_bug, compute_area)


def test_first_function():
    """
    this test should be successful
    """
    assert function_1() == 1

    
def test_first_function_bad():
    """
    this test should fail
    """
    assert function_1() == 0
    
    
def test_compute_area_bug():
    """
    this test should fail if we pass a string it
    won't transform it to float
    """
    actual_value = compute_area_with_bug(2, "3")
    expected_value = 6
    msg = (f"expected value is {expected_value},"
           f" actual value is {actual_value}")
    assert actual_value == expected_value, msg

    
def test_compute_area():
    """
    this test should be successful
    """
    actual_value = compute_area(2, "3")
    expected_value = 6
    msg = (f"expected value is {expected_value},"
           f" actual value is {actual_value}")
    assert isinstance(actual_value, float)
    assert actual_value == expected_value, msg

La única forma de que el test sea éxitoso es que ambos asstements de assert este correctos

In [20]:
!pytest test_module.py

platform win32 -- Python 3.8.3, pytest-5.4.3, py-1.9.0, pluggy-0.13.1
rootdir: C:\Users\pamel\Documents\git\Python-Study\Unit testing
collected 4 items

test_module.py .FF.                                                      [100%]

___________________________ test_first_function_bad ___________________________

    def test_first_function_bad():
        """
        this test should fail
        """
>       assert function_1() == 0
E       assert 1 == 0
E        +  where 1 = function_1()

test_module.py:17: AssertionError
____________________________ test_compute_area_bug ____________________________

    def test_compute_area_bug():
        """
        this test should fail if we pass a string it
        won't transform it to float
        """
        actual_value = compute_area_with_bug(2, "3")
        expected_value = 6
        msg = (f"expected value is {expected_value},"
               f" actual value is {actual_value}")
>       assert actual_value == expected_value, msg
E       

Como era de esperar el último test fue éxitoso

## 5-Testeando excepciones en lugar de valores

Algunas funciones no retornan nada y en su lugar levantan una execepción cuando se le entregan argumentos especificos

La idea es probar que bajo ciertas condiciones esperamos que la función falle, pues lo que se le entrega como argumento no nos sirve

A diferencia de lo anterior en este caso el test será éxitoso si la función efectivamente falla

In [None]:
# %load utils_module_p2.py
def full_name(user_info: dict) -> str:
    '''
    Join the first and last names of a specific
    user to create the full name of this user
    '''
    return user_info['name'] + user_info['last_name']

La función busca concatenar un nombre y apellido

In [None]:
# %load test_module_p2.py
import pytest
from utils_module_p2 import full_name


def test_full_name_without_key():
    '''
    We want our full user name to have a first
    and last name, so if it does not have it,
    we expect the function to fail.
    The test will succeed if the function
    actually fails
    '''
    user = {'last_name': 'Munoz'}
    with pytest.raises(KeyError) as exception_info:
        full_name(user)
    assert exception_info.match('name')
        

def test_full_name_with_list():
    '''
    we want our full name to be a string and not
    a list, so if it ends up being a list,
    we expect the function to fail.
    The test will succeed if the function
    actually fails
    '''
    user = {'last_name': ['Munoz'], 'name': ['Pamela']}
    with pytest.raises(TypeError):
        full_name(user)

El primer test debiese pasar pues la función es incapaz de crear el nombre completo si no tiene la llave adecuada para ello. Además, incluir el statement de assert al final nos permite conocer si el mensaje de error era efectivamente el que esperabamos

Por otra parte el segundo test fracasará pues en lugar de devolvernos un error de tipo (en el diccionario los valores son listas y no str) la función terminará su ejecución sin problemas entregando como resultado final una lista

In [12]:
!pytest test_module_p2.py

platform win32 -- Python 3.8.3, pytest-5.4.3, py-1.9.0, pluggy-0.13.1
rootdir: C:\Users\pamel\Documents\git\Python-Study\Unit testing
collected 2 items

test_module_p2.py .F                                                     [100%]

__________________________ test_full_name_with_list ___________________________

    def test_full_name_with_list():
        '''
        we want our full name to be a string and not
        a list, so if it ends up being a list,
        we expect the function to fail.
        The test will succeed if the function
        actually fails
        '''
        user = {'last_name': ['Munoz'], 'name': ['Pamela']}
        with pytest.raises(TypeError):
>           full_name(user)
E           Failed: DID NOT RAISE <class 'TypeError'>

test_module_p2.py:29: Failed
FAILED test_module_p2.py::test_full_name_with_list - Failed: DID NOT RAISE <c...


## 6- ¿Cuanto tests son suficientes?

Dado que no podemos probar todas las combinaciones de argumentos que recibiría una función necesitamos enfocarnos en cuestiones especificas

Lo ideal es testear por:
    
    - Malos argumentos
    - Argumentos especiales
    - Argumentos normales

Los argumentos malos son aquellos en los que la función levanta una excepción cuando los recibe

Los argumentos especiales se pueden dividir en dos grupos, los valores límites y los que la función usa una lógica especial para ellos

Los valores límites son todos aquellos en los que una vez alcanzados la función comienza a demostrar un comportamiento diferente

Todo lo que no sea un argumento malo o describa un comportamiento especial de la función se considera un argumento normal

* No todas las funciones tienen argumentos malos o especiales

## 7- Test Driven Development

Si asumimos que los test unitarios no son realmente necesarios en un principio, llegaremos al final del proyecto sin ningun test escrito y por ende ninguna forma de prevenir errores

La idea tras TDD es asegurar que los test efectivamente se escriban

El ciclo usual de creación de funciones es que en un principio la función se crea y luego se testea, si hay un fallo, este se arregla y en caso contrario la función se acepta

Con TDD antes de que la función se cree, se escribe un test indicando lo que esta debe hacer y luego el mismo proceso usual

De esta forma no se posterga la creación de los test, el proceso de testeo se hace en conjunto con el desarrollo y ayuda a identificar argumentos especiales

## 8- ¿Como organizar un set de tests?

A medida que el código crece, tambien lo hace el número de test y por ende necesitamos una forma ordenada de organizarlos

Lo recomendado es crear un directorio para los test en el mismo nivel que la carpeta *src*

Dentro de la carpeta tests, simplemente duplicamos la estructura de carpetas dentro de src

La regla general indica que por cada modulo dentro de src debiese existir un modulo dentro de test

Si tenemos el modulo utils/module.py en la carpeta src, debiesemos tener el modulo utils/test_module.py en el directorio tests

### 8.1- Test class

En el caso de que el tengamos muchos test asociados a múltiples funciones en el mismo archivo y necesitemos saber donde empiezan los test de una función y termian los de otra podemos usar clases

El nombre de la clase siempre debe estar en CamelCase y debe contener la palabra Test

Vease el ejemplo a continuación

In [None]:
# %load test_module_p3.py
import pytest
from utils_module import \
    (function_1, compute_area_with_bug)

class TestFunction1(object):

    def test_first_function(self):
        """
        this test should be successful
        """
        assert function_1() == 1


    def test_first_function_bad(self):
        """
        this test should fail
        """
        assert function_1(self) == 0

class TestComputeAreaWithBug(object):

    def test_compute_area_bug(self):
        """
        this test should fail if we pass a string it
        won't transform it to float
        """
        actual_value = compute_area_with_bug(2, "3")
        expected_value = 6
        msg = (f"expected value is {expected_value},"
               f" actual value is {actual_value}")
        assert actual_value == expected_value, msg

In [8]:
!pytest test_module_p3.py

platform win32 -- Python 3.8.3, pytest-5.4.3, py-1.9.0, pluggy-0.13.1
rootdir: C:\Users\pamel\Documents\git\Python-Study\Unit testing
collected 3 items

test_module_p3.py .FF                                                    [100%]

____________________ TestFunction1.test_first_function_bad ____________________

self = <test_module_p3.TestFunction1 object at 0x0000028F7574AA30>

    def test_first_function_bad(self):
        """
        this test should fail
        """
>       assert function_1(self) == 0
E       TypeError: function_1() takes 0 positional arguments but 1 was given

test_module_p3.py:18: TypeError
________________ TestComputeAreaWithBug.test_compute_area_bug _________________

self = <test_module_p3.TestComputeAreaWithBug object at 0x0000028F75771A00>

    def test_compute_area_bug(self):
        """
        this test should fail if we pass a string it
        won't transform it to float
        """
        actual_value = compute_area_with_bug(2, "3")
        expected

### 8.2 - Hacer pruebas a todo el proyecto

Para poder hacer pruebas a todo el proyecto en su conjunto  basta con ubicarse en el directorio test/ y escribir pytest en la terminal

Automaticamente se reconocerán todos los archivos que comiencen con la palabra *test_*, se identificaran las clases que comiencen con la palabra *Test* y las funciones dentro que comiencen con *test_*

Si agregamos -x al comando pytest, es decir *pytest -x* la ejecución de los test se detandrá si es alguno falla

### 8.3- Hacer pruebas usando un patron

Si solo queremos hacer pruebas a una funcionalidad especifica podemos incluir el argumento -k y luego el nombre de la clase que queremos testear. Podriamos escribir parte del nombre siempre y cuando esa parte sea única para la clase.

## 9- Fallos esperados

En el caso de que efectivamente usemos TDD y por ende escribamos el test de la función, antes que la función propiamente tal, al hacer correr el test, este fallará y por ende todo el testeo será negativo

Para evitar que el resultado del test total sea negativo cuando sabemos que uno de los test va a fracas podemos usar el decorador @pytest.mark.xfail

Usando como práactica TDD, en primer lugar creamos una función que nos permita testear una futura función para calcular el área de un triangulo (ultima función)

In [None]:
# %load test_module_p4.py
import pytest
from utils_module import \
    (function_1, compute_area_with_bug, compute_area_triangle)

class TestFunction1(object):

    def test_first_function(self):
        """
        this test should be successful
        """
        assert function_1() == 1


    def test_first_function_bad(self):
        """
        this test should fail
        """
        assert function_1(self) == 0

class TestComputeAreaWithBug(object):

    def test_compute_area_bug(self):
        """
        this test should fail if we pass a string it
        won't transform it to float
        """
        actual_value = compute_area_with_bug(2, "3")
        expected_value = 6
        msg = (f"expected value is {expected_value},"
               f" actual value is {actual_value}")
        assert actual_value == expected_value, msg

    @pytest.mark.xfail
    def test_compute_area_triangle(self):

        actual_value = compute_area_triangle(2, 3)
        expected_value = 3
        msg = (f"expected value is {expected_value},"
               f" actual value is {actual_value}")
        assert actual_value == expected_value, msg        

Luego incluimos tan solo el nombre de la función en el archivo a testear

In [None]:
# %load utils_module.py
def function_1():
    return 1


def compute_area_with_bug(a, b) -> float:
    """
    calculate the area of a rectangle
    """
    return a * b


def compute_area(a, b) -> float:
    """
    calculate the area of a rectangle
    """
    return float(a) * float(b)


def compute_area_triangle(a, b) -> float:
    """
    calculate the area of a triangle
    """
    pass

Obviamente el test va a fallar porque no hemos siquiera definido la función, pero como somos conscientes de aquello, no necesitamos que todo el modulo de pruebas fracase

In [8]:
!pytest test_module_p4.py

platform win32 -- Python 3.8.3, pytest-5.4.3, py-1.9.0, pluggy-0.13.1
rootdir: C:\Users\pamel\Documents\git\Python-Study\Unit testing
collected 4 items

test_module_p4.py .FFx                                                   [100%]

____________________ TestFunction1.test_first_function_bad ____________________

self = <test_module_p4.TestFunction1 object at 0x000001686B57AC10>

    def test_first_function_bad(self):
        """
        this test should fail
        """
>       assert function_1(self) == 0
E       TypeError: function_1() takes 0 positional arguments but 1 was given

test_module_p4.py:18: TypeError
________________ TestComputeAreaWithBug.test_compute_area_bug _________________

self = <test_module_p4.TestComputeAreaWithBug object at 0x000001686B5AB640>

    def test_compute_area_bug(self):
        """
        this test should fail if we pass a string it
        won't transform it to float
        """
        actual_value = compute_area_with_bug(2, "3")
        expected

La X nos indica que el test saltó es función y no probó su funcionamiento

## 10- Más allá del assertion

Algunas funciones necesitan de una precondición para funcionar, digase un archivo, una conexión a una base de datos, entre otras

Mientras que el output de la función puede ser dejar un archivo u otro en el ambiente, como no queremos que afecte nuestros futuros test al terminar el test devolvemos el ambiente a su estado incial.

Por ende, para probar la función debemos setear el ambiente, probarla y luego resetear el ambiente

Supongamos queremos testear la función:

In [None]:
# %load Project/src/readmodule/read.py

def read_count(filename, character):
    """
    Read a txt file and count letter
    """
    # Open file
    with open(filename, "r") as file:
        text = file.read()
    # Count the number occurrences of a character
    number = text.count(character)
    # Store the output in a file
    with open(f"character {character}.txt", 'w') as f:
        f.write(f"{number}")

La función primero lle un archivo (necesitamos que ese archivo exista), lo procesa y guarda otro archivo (debemos borrar una vez finalizado el test)

Para poder preparar el ambiente y luego borrar los archivos generados una vez hecho el test usamos la función *setup_data* que lleva como decorador *@pytest.fixture*

In [None]:
# %load Project/tests/readmodule/test_read.py
import pytest
import os
from src.readmodule.read import read_count


@pytest.fixture
def setup_data():
    path = 'file.txt'
    character = 'a'
    with open(path, 'w') as f:
        f.write("Hello my name is Pamela")
    yield path, character
    os.remove(path)
    os.remove(f"character {character}.txt")
    

    
class TestReading(object):
    
    def test_read(self, setup_data):
        path, character = setup_data
        # Call the function
        read_count(path, character)
        # Check the result
        with open(f"character {character}.txt", 'r') as f:
            number = f.read()
        assert int(float(number)) == 3, f'value is {int(number)}'

Luego de invocar la funcion de test, que se invoca con un yield en vez de return, eliminamos los archivos generados del ambiente

In [17]:
!cd Project && python -m pytest tests/

platform win32 -- Python 3.8.3, pytest-5.4.3, py-1.9.0, pluggy-0.13.1
rootdir: C:\Users\pamel\Documents\git\Python-Study\Unit testing\Project
collected 1 item

tests\readmodule\test_read.py .                                          [100%]



### 10.1- tmpdir

tmpdir es una herramienta, incluida en pytest, que es útil para manejar archivos temporales

tmpdir crea un directorio temporal en la fase de setup para luego eliminarlo en la fase de teardown

La diferencia con el archivo de test anterior seria la siguiente:

In [None]:
import pytest
from src.readmodule.read import read_count


@pytest.fixture
def setup_data(tmpdir):
    path = tmpdir.join('file.txt')
    character = 'a'
    with open(path, 'w') as f:
        f.write("Hello my name is Pamela")
    yield path, character

    
class TestReading(object):
    
    def test_read(self, setup_data):
        path, character = setup_data
        # Call the function
        read_count(path, character)
        # Check the result
        with open(f"character {character}.txt", 'r') as f:
            number = f.read()
        assert int(float(number)) == 3, f'value is {int(number)}'

Deja de ser necesario eliminar los archivos luego del yield