# Лекция №5. Автоматизация тестирования

*П.Н. Советов, РТУ МИРЭА*

## Программные ошибки и верификация

В процессе обучения программированию типична ситуация, когда ученик свою программу, которая "вроде бы работает", отдает на проверку преподавателю. Преподаватель оценивает выполнение требований, заданных в условии задачи и выявляет возможные ошибки.

В общем же, недостаточно написать программу, которая "вроде бы работает". Программист должен иметь уверенность в том, что cозданная программа соответствует требованиям и в ней нет серьезных ошибок. Это особенно важно, когда речь идет не об ученике, который полагается на мнение преподавателя, а о профессиональном разработчике ПО.

Насколько опасными могут быть программные ошибки? В литературе часто приводятся следующие классические примеры:

* Середина 80-х годов, ошибки в ПО медицинского аппарата для лучевой терапии "Therac-25" привели к смерти как минимум двух пациентов.
* 1991 год, Ирак, ЗРК "Пэтриот" из-за программной ошибки, связанной с потерей точности вычислений, не сумел перехватить советскую ракету Р-17, в результате чего погибло 28 американских солдат.
* 1994 год, ошибка в реализации команды деления процессора Pentium компании Intel привела к значительным затратам на бесплатную замену микросхем.
* 1996 год, из-за ошибки преобразования данных в бортовом ПО взорвалась европейская ракета-носитель "Ариан 5".

Можно вспомнить и более современные случаи последствий программных ошибок: крушение Боинга 737 MAX 8, приостановка работы марсохода Curiosity и многие другие [примеры](https://www5.in.tum.de/~huckle/bugse.html).

Что считать ошибкой в программе? Понятно, что недопустимыми являются ситуации, когда программа "зависает" или "падает" с выводом сообщения от интерпретатора. Важнейшим классом ошибок являются ошибки несоответствия решения заданным требованиям, то есть спецификации:

> "Без спецификации нет ошибок — есть только сюрпризы" (Б. Керниган)

Спецификация может быть задана неформальным образом, в виде некоторого документа на естественном языке. Менее популярным на практике, но имеющим большие перспективы является использование формальной спецификации, когда требования к ПО описываются в строгой форме, с помощью некоторого математического формализма.

В спецификации различают функциональные и нефункциональные требования. К последним относят такие требования, как производительность системы, ее безопасность и эргономика.

Проверка соответствия программы предъявляемым ей требованиям, то есть спецификации, называется верификацией.

## Формальная верификация

Верификацию программной системы легче проводить, абстрагируясь, отвлекаясь от несущественных для анализа деталей. При этом проверке на отсутствие ошибок подвергается не сама система, а ее модель.

Заслуживающим внимания является подход модельно-ориентированного проектирования (Model-driven development). В этом подходе строго формулируется модель системы, построенная по спецификации. Существуют специализированные инструменты, такие, как [Simulink](https://www.mathworks.com/help/simulink/gs/model-based-design.html), которые позволяют оценить характеристики высокоуровневой исполняемой модели, а также автоматически получить из модели реализацию, то есть программный код.

При использовании методов формальной верификации программная система и ее спецификация описываются математическими моделями и далее осуществляется строгое доказательство того, что система работает корректно. Специалист в области формальной верификации должен обладать специфическими знаниями и навыками, далекими от того, что умеет обычный разработчик. Сами методы формальной верификации плохо масштабируются: обычно удается доказать корректность только для сравнительно небольших программ. В этой связи рассматриваемые методы применяются только в самых ответственных областях: бортовом ПО, медицинской аппаратуре, ядрах ОС и так далее.

Важно помнить, что при использовании формальных методов речь, фактически, идет о доказательстве корректности для идеализированного описания системы, а не самой системы. Здесь можно вспомнить известную фразу Д. Кнута:

> "Остерегайтесь ошибок в вышеуказанном коде, я только доказал его правильность, но не пробовал выполнить его"

## Тестирование

Еще одним способом верификации ПО являются методы тестирования, которые проверяют поведение реализации программной системы на некотором наборе тестовых сценариев. Задача тестирования значительно скромнее задачи формальной верификации:

> "Тестирование программ можно использовать для того, чтобы показать наличие ошибок и никогда — для того чтобы показать их отсутствие!" (Э. Дейкстра)

Тестирование может быть произведено вручную, но значительно более продуктивно использовать методы автоматизации тестирования, которые подразумевают создание специальных тестирующих программ. 

Тестирование может производиться в различных масштабах:

1. Модульные тесты (unit tests). Тесты отдельных функцией, классов или модулей. К модульным относят также регрессионные тесты (проверка на появление уже исправленных ранее ошибок после очередной модификации кода) и макетные тесты (замена реальных входов и выходов тестируемого модуля макетами).
1. Интеграционные тесты. Тесты на интеграцию модулей. Недостаточно проверить каждый модуль отдельно, новое поведение возникает, когда эти модули друг с другом взаимодействуют.
1. Системные (приемочные) тесты. Тестирование всей программной системы с использованием входов и выходов, доступных пользователю этой системы.

Различают тестирование черного и белого ящиков:

1. В тестировании черного ящика при порождения тестовых сценариев используется только информация о спецификации системы.
1. В случае тестирования белого ящика для организации тестов и оценки качества тестирования анализируется внутренняя структура программы.

С точки зрения вопросов организации тестовых сценариев программные системы можно разделить на следующие классы:

1. Трансформирующая система. Это система, не имеющая состояния и осуществляющая однократное преобразование входных данных в выходные. Тестовым сценарием здесь будет пара, состоящая из примера входных и выходных данных.
2. Реактивная (реагирующая) система. Это система, взаимодействующая с внешней средой путем обмена сообщениями в темпе, задаваемом средой. В таких системах имеется состояние, то есть поведение зависит не только от входных данных, но и от истории предыдущих обменов сообщениями. Тестовым сценарием здесь является последовательность (или даже граф — в случае наличия недетерминизма в работе системы) входных и выходных сообщений. 


## Разработка с учетом тестирования

Упростить тестирование (и в целом верификацию) программной системы можно, используя известные приемы проектирования ПО:

1. Разбить систему на набор независимых модулей, каждый из которых выполняет только одну функцию.
1. Уменьшить число связей между взаимодействующими модулями.
1. Четко разделить интерфейсную и вычислительную части системы.

Универсальным средством является написание краткого, простого, легко читаемого кода:

> "Есть два способа разработки проекта приложения: сделать его настолько простым, чтобы было очевидно, что в нем нет
недостатков, или сделать его таким сложным, чтобы в нем не было очевидных недостатков" (Ч. Хоар)

Подход разработки через тестирование (TDD, Test-driven development) предполагает написание тестов еще до реализации проверяемого свойства системы. Основные шаги итерационного процесса TDD включают в себя:

1. Написание модульных тестов, отражающих требования к очередному программному компоненту.
1. Запуск тестов, с ожиданием неуспеха, поскольку требования еще не были реализованы в программном коде.
1. Написание кода программного компонента в достаточной степении для успешного прохождения тестов.

При использовании TDD упрощаются модификации программного кода (рефакторинг), поскольку для проверки корректности очередных изменений можно использовать заранее реализованные тесты.

Важно отметить, что затраты на тестирование не должны превышать затраты на само конструирование программной системы. В противном случае тестирование, скорее всего, окажется слишком дорогостоящим для большинства проектов. Впрочем, если возвратиться к методам формальной верификации, то там значительно (иной раз, на несколько порядков!) более высокая сложность доказательства корректности ПО, чем построение самого ПО, оправдана, поскольку позволяет сохранить жизни людей и избежать затрат на устранение последствий катастроф.

## Оператор assert

Этот оператор используется для вставки отладочных утверждений в код и, зачастую, оказывается предпочтительнее привычной многим программистам отладочной печати:

In [1]:
# Реализация факториала с ошибкой
def wrong_fact(n):
    assert n >= 0, f'ошибочный аргумент {n}'
    return n * wrong_fact(n - 1)

# Раскомментируйте, чтобы получить исключение AssertionError
# wrong_fact(1)

Оператор assert имеет следующий вид:

```Python
assert утверждение
```

или

```Python
assert утверждение, выражение
```

Здесь утверждение возвращает булево значение. Если утверждение истинно, то выполнение программы продолжится, в противном случае будет вызвано исключение AssertionError. Выражение может быть добавлено через запятую к утверждению, чтобы указать дополнительную информацию (в нашем случае это значение аргумента wrong_fact) при вызове исключения.

Оператор assert используется во многих системах тестирования, реализованных на Питоне.

## Тестирование вместе с документированием

Модуль doctest совмещает в себе функции легковесного документирования и тестирования. Строка docstring в теле функции анализируется на предмет фрагментов REPL-диалога с интерпретатором и получаемые результаты сравниваются с ожидаемыми:

In [2]:
def fact(n):
    '''
    Реализация вычисления факториала.
    >>> fact(5)
    120
    >>> fact(0)
    1
    >>> fact(-1)
    Traceback (most recent call last):
        ...
    RecursionError: maximum recursion depth exceeded in comparison
    '''
    if n in range(0, 1):
        return 1       
    return n * fact(n - 1)

В примере выше используется три тестовых сценария. В случае f(-1) излишняя информация о возникшем исключении пропускается с помощью `...`. Запустить тесты можно с помощью командной строки:

```
python -m doctest -v fact.py
```

Будет получен следующий результат:

```
Trying:
    fact(5)
Expecting:
    120
ok
Trying:
    fact(0)
Expecting:
    1
ok
Trying:
    fact(-1)
Expecting:
    Traceback (most recent call last):
        ...
    RecursionError: maximum recursion depth exceeded in comparison
ok
1 items had no tests:
    fact
1 items passed all tests:
   3 tests in fact.fact
3 tests in 2 items.
3 passed and 0 failed.
Test passed.
```

При необходимости тесты можно вынести в отдельный файл, с расширением, отличным от '.py'. Это может быть файл с документацией по проекту в форматах `.rst` или `.md`. В нашем примере может использоваться отдельный файл fact.doctest:

```
# Документация

Пример вычисления факториала.

>>> from fact import fact
>>> fact(5)
120
```

```
python -m doctest fact.doctest 
```

При вызове модуля doctest без ключа `-v` сообщение будет выдано только если при прогоне тестов была обнаружена ошибка.

Остается добавить, что существуют генераторы документации, которые автоматически извлекают docstring-фрагменты из исходного кода и формируют результат в виде справочного руководства по функциям программного проекта.

## Универсальный инструмент для задач тестирования

Модуль [pytest](https://docs.pytest.org/en/stable/contents.html) является сторонним и требует установки:

```
pip install pytest
```

Предыдущий пример с факториалом в случае pytest будет выглядеть так:

In [3]:
import pytest


def test_fact():
    assert fact(5) == 120
    assert fact(0) == 1
    with pytest.raises(RecursionError): # Ожидается исключение RecursionError
        fact(-1)


def fact(n):
    '''
    Реализация вычисления факториала.
    '''
    if n in range(0, 1):
        return 1
    return n * fact(n - 1)

Для запуска процесса тестирования необходимо указать в командной строке:

```
pytest fact.py
```

Тесты можно вынести в отдельный файл test_fact.py:

```Python
# test_fact.py
import pytest
from fact import fact


def test_fact():
    assert fact(5) == 120
    assert fact(0) == 1
    with pytest.raises(RecursionError):
        fact(-1)
```

В этом случае для запуска тестирования достаточно набрать:

```
pytest
```

В результате будет выведено:

```
plugins: hypothesis-5.41.4
collected 1 item

test_fact.py .                                                           [100%]
```

Если же исправить одно из утверждений на `assert fact(6) == 120`, будет получен следующий результат:

```
plugins: hypothesis-5.41.4
collected 1 item

test_fact.py F                                                           [100%]

================================== FAILURES ===================================
__________________________________ test_fact __________________________________

    def test_fact():
>       assert fact(6) == 120
E       assert 720 == 120
E        +  where 720 = fact(6)

test_fact.py:6: AssertionError
=========================== short test summary info ===========================
FAILED test_fact.py::test_fact - assert 720 == 120
```

Обратите внимание, что в модуле pytest результат выполнения оператора `assert` является более информативным, чем в стандартном варианте Питона.

При использовании pytest важно правильно именовать функции тестирования. Такие функции должны иметь префикс `test_`. Кроме того, если речь идет об отдельном файле с тестами, то его имя также должно содержать префикс `test_`. Благодаря этому соглашению вызов `pytest` позволяет автоматически найти и запустить все тесты из соответствующих файлов текущего каталога.

Рассмотрим следующую реализацию класса стека:

In [4]:
class Stack:
    def __init__(self):
        self.data = []
    
    def push(self, x):
        self.data.append(x)

    def dup(self):
        self.data.append(self.data[-1])

    def pop(self):
        if self.data:
            return self.data.pop()
        raise RuntimeError("Stack underflow")
    
    def swap(self):
        self.data[-1], self.data[-2] = self.data[-2], self.data[-1] 

Тестирование стека может быть вынесено в отдельный файл:

In [5]:
import pytest


def test_stack1():     
    s = Stack()
    s.push(1)
    s.push(2)
    assert len(s.data) == 2


def test_stack2():     
    s = Stack()
    s.push(1)
    s.push(2)
    s.pop()
    s.pop()
    assert len(s.data) == 0


def test_stack3():     
    s = Stack()
    s.push(1)
    s.push(2)
    s.swap()
    assert s.data[-2:] == [2, 1]


def test_stack4():
    s = Stack()
    with pytest.raises(RuntimeError):
        s.pop()

Здесь имеет место дублирование кода, от которого в процедурах тестирования лучше избавляться. В противном случае автоматические тесты будет тяжело поддерживать и в них легко можно будет допустить ошибку. В нашем случае создание стека полезно выделить в отдельную настроечную функцию с помощью декоратора `@pytest.fixture`.

In [6]:
@pytest.fixture
def stack():
    s = Stack()
    s.push(1)
    s.push(2)
    return s    


@pytest.fixture
def empty_stack():
    return Stack()


def test_stack1(stack):
    assert len(stack.data) == 2


def test_stack2(stack):     
    stack.pop()
    stack.pop()
    assert len(stack.data) == 0


def test_stack3(stack):
    stack.swap()
    assert stack.data[-2:] == [2, 1]


def test_stack4(empty_stack):
    with pytest.raises(RuntimeError):
        empty_stack.pop()

В коде выше аргументом у функций тестирования должно быть имя fixture-функции. Каждый раз при вызове функции тестирования будет вызвана функция `stack` или `empty_stack`, при этом создается новый экземпляр тестового стека.

Еще большего сокращения кода тестирования можно достичь с помощью параметризации:

In [7]:
@pytest.mark.parametrize('op1,op2,data', [
    ('dup', 'pop', [1, 2]),
    ('dup', 'dup', [1, 2, 2, 2]),
    ('pop', 'pop', []),
    ('swap', 'dup', [2, 1, 1]),
])
def test_stack5(stack, op1, op2, data):
    getattr(stack, op1)()
    getattr(stack, op2)()
    assert stack.data == data

Здесь используется декоратор `@pytest.mark.parametrize` для указания наборов значений аргументов функции тестирования.

Для реализации макетного тестирования может использоваться предопределенная fixture-функция monkeypatch. В примере ниже с ее помощью имитируется работа системной функции `input`:

In [8]:
def func():
    x = input('Введите x:')
    y = input('Введите y:')
    return x + y


def test_func(monkeypatch):
    inputs = [1, 2]

    def my_input(x):
        return inputs.pop()

    # До завершения работы test_func() функция input() будет переопределена
    monkeypatch.setattr('builtins.input', my_input)
    assert func() == 3

## Метрики покрытия кода

Покрытие кода (Code coverage) используется при тестировании белого ящика и отражает ту часть программного кода, которая была выполнена в процессе работы набора тестовых сценариев. Информация о покрытии кода образуется в результате исполнения программного кода в режиме со сбором статистики о выполняемых командах.

Различают следующие основные метрики покрытия кода:

1. Покрытие операторов программы.
1. Покрытие ветвей программы (переходов между парой операторов).

Покрытие кода выражается в процентах и вычисляется, как отношение числа выполненнных операторов (пройденных ветвей) к общему количеству операторов (ветвей) в программе.

Для оценки покрытия кода может быть использован сторонний модуль [coverage](https://coverage.readthedocs.io/en/coverage-5.5/):

```
pip install coverage
```

Рассмотрим следующий пример:

In [9]:
def incr(x):
    if x != 10:
        x += 1
    return x


def test_incr():
    assert incr(0) == 1

Получить результат тестового покрытия можно следующей командой:

```
coverage run -m pytest inc.py
```

Результат (используя `coverage report`) может обескуражить:

```
Name    Stmts   Miss  Cover
---------------------------
my.py       6      0   100%
---------------------------
TOTAL       6      0   100%
```

Очевидно, что наш тест не покрывает все возможные варианты выполнения incr. Здесь более полезна метрика покрытия ветвей программы:

```
coverage run --branch -m pytest inc.py
```

Теперь видно, что покрытие неполное:

```
Name    Stmts   Miss Branch BrPart  Cover
-----------------------------------------
my.py       6      0      2      1    88%
-----------------------------------------
TOTAL       6      0      2      1    88%
```

100% покрытия легко добиться с помощью еще одного assert.

## Мутационное тестирование

Результат 100% покрытия кода не гарантирует отсутствия ошибок в программе. Один и тот же оператор программы может быть выполнен с разными наборами данных и в одном из непроверенных случаев может, к примеру, произойти деление на нуль.

В этой связи полезно применять мутационное тестирование (Mutation testing, еще один вариант тестирования белого ящика), суть которого в привнесении ошибок ("мутаций") в исходную программу (тем самым создаются "программы-мутанты"), с тем, чтобы оценить, сможет ли существующий набор тестов эти ошибки определить. Если набор тестов успешно выполняется на программе-мутанте, то это означает, что используемые тесты нуждаются в развитии.

Ниже представлен код вычисления евклидова расстояния и функция тестирования:

```Python
# Файл dist.py

import math

def dist(x1, y1, x2, y2):
    return math.sqrt((x1 - x2) ** 2 + (y1 - y2) ** 2)
```

```Python
# Файл test_dist.py

from dist import dist

def test_dist():
    assert dist(4, 4, 4, 4) == 0
```

Вызов coverage сообщает о 100% покрытии:

```
Name           Stmts   Miss Branch BrPart  Cover
------------------------------------------------
dist.py            3      0      0      0   100%
test_dist.py       3      0      0      0   100%
------------------------------------------------
TOTAL              6      0      0      0   100%
```

Попробуем теперь использовать библиотеку [mutmut](https://mutmut.readthedocs.io/en/latest/) для мутационного тестирования `dist.py`. Устанавливается библиотека следующей командой:

```
pip install mutmut
```

После настройки конфигурационного файла `setup.cfg` запуск мутационного тестирования осуществляется командой `mutmut run`. Оказывается, "выжило" 5 программ-мутантов. Их текст можно вывести командой `mutmut show all`:

```
# mutant 22
--- .\dist.py
+++ .\dist.py
@@ -1,5 +1,5 @@
 import math

 def dist(x1, y1, x2, y2):
-    return math.sqrt((x1 - x2) ** 2 + (y1 - y2) ** 2)
+    return math.sqrt((x1 - x2) * 2 + (y1 - y2) ** 2)


# mutant 23
--- .\dist.py
+++ .\dist.py
@@ -1,5 +1,5 @@
 import math

 def dist(x1, y1, x2, y2):
-    return math.sqrt((x1 - x2) ** 2 + (y1 - y2) ** 2)
+    return math.sqrt((x1 - x2) ** 3 + (y1 - y2) ** 2)


# mutant 24
--- .\dist.py
+++ .\dist.py
@@ -1,5 +1,5 @@
 import math

 def dist(x1, y1, x2, y2):
-    return math.sqrt((x1 - x2) ** 2 + (y1 - y2) ** 2)
+    return math.sqrt((x1 - x2) ** 2 - (y1 - y2) ** 2)


# mutant 26
--- .\dist.py
+++ .\dist.py
@@ -1,5 +1,5 @@
 import math

 def dist(x1, y1, x2, y2):
-    return math.sqrt((x1 - x2) ** 2 + (y1 - y2) ** 2)
+    return math.sqrt((x1 - x2) ** 2 + (y1 - y2) * 2)


# mutant 27
--- .\dist.py
+++ .\dist.py
@@ -1,5 +1,5 @@
 import math

 def dist(x1, y1, x2, y2):
-    return math.sqrt((x1 - x2) ** 2 + (y1 - y2) ** 2)
+    return math.sqrt((x1 - x2) ** 2 + (y1 - y2) ** 3)
```

Для этих программ-мутантов pytest сигнализирует об успешном прохождении тестирования. Очевидно, что следующим шагом ожидается доработка набора тестов, чтобы избавиться от мутантов.

## Контрактное программирование

В контрактном программировании (Design by contract) интерфейсы программных компонентов (таких, например, как функции или методы) получают формальные спецификации. Эти спецификации или, иначе, контракты включают в себя:

1. Предусловия. Предикаты, которые должны быть истинными на входе в программный компонент. 
2. Постусловия.  Предикаты, которые должны быть истинными при выходе из программного компонента.
3. Инварианты. Предикаты, которые должны быть истинными в пределах программного компонента.
4. Указание побочного эффекта. Различные типы побочного эффекта включают в себя ввод/вывод и модификацию глобальных данных.

Контракты проверяются, в основном, во время выполнения программы и по этой причине являются более выразительными, чем статические системы типов.

В Питоне для реализации контрактного программирования имеется сторонняя библиотека [deal](https://deal.readthedocs.io/), которую можно установить следующим образом:

```
pip install deal
```

Для изучения контрактного программирования с deal используем следующую функцию:

In [10]:
def divrem(q, p):
    '''
    Функция divrem возвращает частное и остаток от деления.
    '''
    d = 0
    if p == 0:
        raise ZeroDivisionError
    while q >= p:
        q -= p
        d += 1
    return d, q

divrem(10, 3)

(3, 1)

Добавим теперь пред- (декоратор `@deal.pre`) и постуловия (декоратор `@deal.post`):

In [11]:
import pytest
import deal


@deal.pre(lambda q, p: q >= 0 and p >= 0)
@deal.post(lambda result: result[0] >= 0 and result[1] >= 0)
def divrem(q, p):
    '''
    Функция divrem возвращает частное и остаток от деления.
    '''
    d = 0
    if p == 0:
        raise ZeroDivisionError
    while q >= p:
        q -= p
        d += 1
    return d, q


def test_divrem():
    divrem(10, 5)
    with pytest.raises(ZeroDivisionError):
        divrem(0, 0)
    divrem(0, 1)

Здесь `lambda` обозначает создание безымянной функции (к таким функциям мы еще вернемся в следующей лекции).

Запуск тестирования с помощью `pytest` сигнализирует об успехе. Теперь добавим еще один вариант постусловия (@deal.ensure), в котором используются как аргументы, так и результат:

In [12]:
@deal.pre(lambda q, p: q >= 0 and p >= 0)
@deal.post(lambda result: result[0] >= 0 and result[1] >= 0)
@deal.ensure(lambda q, p, result: result == (q // p, q % p))
def divrem(q, p):
    '''
    Функция divrem возвращает частное и остаток от деления.
    '''
    d = 0
    if p == 0:
        raise ZeroDivisionError
    while q >= p:
        q -= p
        d += 1
    return d, q

Наконец, мы можем добавить для функции `divrem` контракты, указывающие на вызываемое исключение (`@deal.raises`), его причину (`@deal.reason`), а также информацию о побочном эффекте (`@deal.has`):

In [13]:
@deal.pre(lambda q, p: q >= 0 and p >= 0)
@deal.post(lambda result: result[0] >= 0 and result[1] >= 0)
@deal.ensure(lambda q, p, result: result == (q // p, q % p))
@deal.reason(ZeroDivisionError, lambda q, p: p == 0)
@deal.raises(ZeroDivisionError)
@deal.has()
def divrem(q, p):
    '''
    Функция divrem возвращает частное и остаток от деления.
    '''
    d = 0
    if p == 0:
        raise ZeroDivisionError
    while q >= p:
        q -= p
        d += 1
    return d, q

Обратите внимание, что при вызове не указанного в контракте исключения будет выдана специальная ошибка.

В нашем случае у функции отсутствует побочный эффект. Если бы внутри `divrem` содержался вызов `print`, то побочный эффект можно было бы указать явно: `@deal.has('stdout')`. Когда некоторая функция вызывает функцию с заданным побочным эффектом, то для вызывающей функции необходимо также сделать пометку о наличии этого побочного эффекта.

В deal существует инвариант класса (`@deal.inv`), который проверяется при входе и выходе из методов, а также при изменении атрибутов объекта:

In [14]:
@deal.inv(lambda account: account.money >= 0)
class Account:
    def __init__(self):
        self.money = 0

    def get(self, amount):
        self.money -= amount

    def put(self, amount):
        self.money += amount


a = Account()

a.put(10)
a.get(10)
# Раскомментируйте следующую строку, чтобы получить ошибку контракта
# a.money -= 20
a.money

0

## Тестирование на основе свойств

Тестирование на основе свойств (Property-based testing) основно на использовании нескольких мощных техник:

1. Тестирование на случайных структурированных входных данных или "фаззинг" ([fuzzing](https://www.fuzzingbook.org/)).
2. Сокращение контрпримера с помощью [дельта-отладки](https://www.debuggingbook.org/beta/html/DeltaDebugger.html#General-Delta-Debugging) и подобных подходов.
3. Тестирование на основе модели (Model-based testing) для тестирования систем с состоянием.

Процесс тестирования на основе свойств включает в себя описание типов случайных входных данных и определение ключевых свойств-предикатов, которые характеризуют тестируемый программный компонент. Тестирующая система автоматически находит контрпримеры в виде случайно сгенерированных входных данных, на которых заданные свойства не выполняются, после чего пользователю выдается наиболее краткий вариант контрпримера.

Для дальнейшей работы понадобится сторонняя библиотека hypothesis, которую можно установить следующей командой:

```
pip install hypothesis
```

В примере ниже тестируется функция сложения. Декоратор `@given` служит для описания случайных тестовых входов. Типы случайных данных определяются стратегиями. В данном случае используется стратегия `integers`, которая позволяет генерировать случайные целые значения. В примере проверяются свойства коммутативности и ассоциативности сложения:

In [15]:
from hypothesis import given, strategies as st


def add(x, y):
    return x + y


@given(x=st.integers(), y=st.integers(), z=st.integers())
def test_add(x, y, z):
    assert add(x, y) == add(y, x)
    assert add(x, add(y, z)) == add(add(x, y), z)

    
test_add()

В следующем примере используется параметризованная стратегия `lists` для порождения случайных списков:

In [16]:
# Вернуть наиболее часто встречающийся элемент
def mode(data):
    return max(data, key=data.count)


@given(data=st.lists(st.integers()))
def test_mode(data):
    assert mode(data) in data

    
# test_mode()

Если раскомментировать последнюю строку, то будет выдан контрпример в виде пустого списка:
    
```
Falsifying example: test_mode(
    data=[],
)
```

Изменим генерацию случайных списков и добавим еще одно свойство (количество вхождений результата должно быть больше или равно количеству вхождений любого из элементов списка). В этом примере используется функция `all` которая возвращает True, если все элементы последовательности интерпретируются, как True:

In [17]:
# Вернуть наиболее часто встречающийся элемент
def mode(data):
    return max(data, key=data.count)


@given(data=st.lists(st.integers(), min_size=1))
def test_mode(data):
    res = mode(data)
    assert res in data
    assert all(data.count(res) >= data.count(x) for x in data)
    

test_mode()

При желании, с помощью добавления `print`, можно посмотреть на то, какие именно данные поступают на вход `test_mode`:

```
...
[25963, -1, -18826]
[129, -1, -18826]
[-384, -386, -18826]
[-384, -386, -18826]
[-12350, -13880, -1741946127877086248, 27900318018340847272440741409395352381, 1640638466, -29885, 16118, 83, -30, 7112358378030895761, 76]
[0, -25099, 115, 0, -3325696608601645481337506961643569664, -25099, 115, 3, 1640638466, -29885, 16118, 83, -30, 7112358378030895761, 76]
[-13150, -30569]
[51, 1]
...
```

Ниже показан пример с использованием стратегии `recursive` в которой первый аргумент указывает на базовый случай-стратегию, а вторым аргументом является функция, принимающая и возвращающая стратегию:

In [18]:
class List:
    def __init__(self, x, right=None):
        self.x = x
        self.right = right
    
    def __repr__(self):
        return f'[{self.x}] -> {self.right}'
    
    def __len__(self):
        size = 1
        while self.right:
            size += 1
            self = self.right
        return size
    
    def get_last(self):
        while self.right:
            self = self.right
        return self
    
    def add(self, x):
        self.get_last().right = List(x)
           

@given(lst=st.recursive(st.builds(List, st.integers()),
                        lambda r: st.builds(List, st.integers(), r)),
                       x=st.integers())
def test_list(lst, x):
    size = len(lst)
    lst.add(x)
    assert len(lst) == size + 1
    assert lst.get_last().x == x


test_list()

Вот как выглядят примеры случайно формируемых списков:

```
...
[0] -> [0] -> None
[25275] -> [-37] -> [22] -> None
[0] -> [384] -> [-1] -> None
[25181955] -> [3597652295274685506] -> [51] -> None
[0] -> [-28743] -> [-51] -> [2] -> [1] -> None
[31214] -> [-21250] -> [126] -> [15226] -> None
[0] -> [0] -> None
[-17840] -> [114] -> None
[68] -> None
[30564] -> [69258178314550572426917407876740709799] -> [-1670540173] -> None
...
```

Тестирование на основе свойств можно комбинировать с контрактным программированием. Далее показан вариант программы из предыдущего раздела с использованием библиотек `deal` и `hypothesis`:

In [19]:
@deal.pre(lambda q, p: q >= 0 and p >= 0)
@deal.post(lambda result: result[0] >= 0 and result[1] >= 0)
@deal.ensure(lambda q, p, result: result == (q // p, q % p))
@deal.reason(ZeroDivisionError, lambda q, p: p == 0)
@deal.raises(ZeroDivisionError)
@deal.has()
def divrem(q, p):
    d = 0
    if p == 0:
        raise ZeroDivisionError
    while q >= p:
        q -= p
        d += 1
    return d, q


@given(x=st.integers(min_value=0, max_value=100), y=st.integers(min_value=1, max_value=100))
def test_divrem(x, y):
    divrem(x, y)


test_divrem()

Важно использовать такие свойства, которые позволят как можно полнее верифицировать тестируемую систему. Были [предложены](https://fsharpforfunandprofit.com/posts/property-based-testing-2/) следующие основные категории свойств:

1. **Разные пути, одна цель**. Различный порядок действий приводит к одному и тому же результату. Пример: проверка коммутативности и ассоциатиновности.
1. **Туда и обратно**. После совершения операции, за которой следует обратная операция, должен быть получен исходный результат. Пример: сжатие и расжатие данных.
1. **Некоторые вещи не меняются**. Элементы, которых не затрагивает преобразование, должны остаться на своих местах. Пример: после сортировки не должен измениться размер списка и из списка не должны пропасть какие-то элементы.
1. **Чем больше вещи меняются, тем больше они остаются прежними**. Повторное применение некоторых операций уже не должно влиять на результат. Пример: последовательность GET-запросов к HTTP-серверу (если данные не изменились) должна соответствовать единственному такому запросу.
1. **Сначала решить меньшую проблему** или **Разделяй и властвуй**. Сначала проверить некоторое свойство для простого режима системы. Пример: проверка работы операции для пустого списка или пустого дерева.
1. **Трудно доказать, легко проверить**. Здесь имеется отсылка к NP-полным задачам, найти решение для которых значительно сложнее, чем проверить корректность полученного решения. Пример: найти выход из лабиринта может быть сложно, а проверить, что путь приводит к выходу значительно легче.
1. **Тестовый оракул**. Во многих случаях уже существует эталонная система, поведение которой можно сравнить с тестируемой системой. Пример: в функции `divrem` для проверки контракта использовались встроенные операции деления и взятия остатка.


В заключение рассмотрим тестирование на основе модели, которое представляет собой вариант "тестового оракула". В следующем примере мы рассматриваем тестируемую систему, как реактивную. Тестируются последовательности операций над низкоуровневой реализацией стека и ее моделью, с использованием формализма конечного автомата:

In [20]:
import hypothesis.strategies as st
from hypothesis.stateful import RuleBasedStateMachine, rule, precondition, invariant


class Stack:
    def __init__(self, size):
        self.data = [0] * size
        self.sp = 0
   
    def push(self, x):
        self.data[self.sp] = x
        self.sp += 1

    def get_top(self):
        return self.data[self.sp - 1]

    def dup(self):
        self.push(self.get_top())
        
    def pop(self):
        x = self.get_top()
        self.sp -= 1
        return x
    
    def swap(self):
        y, x = self.pop(), self.pop()
        self.push(x)
        self.push(y)


class ModelStack(RuleBasedStateMachine):
    def __init__(self):
        super().__init__()
        self.data = []
        self.stack = Stack(100)

    @rule(x=st.integers())
    def push(self, x):
        self.stack.push(x)
        self.data.append(x)

    @rule()
    @precondition(lambda self: len(self.data))
    def dup(self):
        self.stack.dup()
        self.data.append(self.data[-1])

    @rule()
    @precondition(lambda self: len(self.data))
    def pop(self):
        self.stack.pop()        
        self.data.pop()
          
    @rule()
    @precondition(lambda self: len(self.data) > 1)
    def swap(self):
        self.stack.swap()
        self.data[-1], self.data[-2] = self.data[-2], self.data[-1]

    @rule()
    def check_stacks(self):
        assert self.stack.data[:self.stack.sp] == self.data


test_stack = ModelStack.TestCase

Здесь `@rule` определяет состояние конечного автомата, а `@precondition` определяет условие выполнения перехода в заданное состояние.

Запуск `pytest` выдает следующий контрпример:

```Python
state = ModelStack()
state.push(x=0)
state.push(x=1)
state.swap()
state.check_stacks()
state.teardown()
```

Очевидно, что в реализации операции swap имеется ошибка. После ее исправления тесты на основе модели проходят успешно.