# Лабораторная работа по теме "Metamorphic testing"

Ссылка на материалы занятия https://drive.google.com/drive/folders/1dbq1scqU22XPFCrVmz75gpRsb49QjtcM?usp=drive_link

Литература

1) Barr E.T., Harman M., McMinn P., Shahbaz M., Yoo S. The oracle problem in software testing: A survey. IEEE transactions on software engineering. 41(5). 2014. P. 507-525. https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6963470

2) Tsong Yueh Chen, Fei-Ching Kuo, Huai Liu, Pak-Lok Poon, Dave Towey, T. H.
Tse, and Zhi Quan Zhou. 2018. Metamorphic Testing: A Review of Challenges
and Opportunities. 51, 1, Article 4 (Jan. 2018), 27 pages. https://doi.org/10.1145/3143561

3) M. Srinivasan, M. P. Shahri, I. Kahanda and U. Kanewala, "Quality Assurance of Bioinformatics Software: A Case Study of Testing a Biomedical Text Processing Tool Using Metamorphic Testing", 2018 IEEE/ACM 3rd International Workshop on Metamorphic Testing (MET), Gothenburg, 2018, pp. 26-33. https://arxiv.org/pdf/1802.07354.pdf


**Критерии оценки.**

Условная оценка - 10 баллов за лабораторную. Для получения зачёта достаточно набрать 6.



- Задание 1. (4 вопроса, 1 балл)
- Задание 2. (9 баллов)

## Задание 1. Теоретическая часть

Ответьте на следующие вопросы (*1 балл*).
1. Опишите суть проблемы тестового оракула.
2. Приведите примеры задач, для которых обычное тестирование с оракулом не подходит.
3. Перечислите методы, которые применяются для решения этой проблемы.
4. Дайте определение тестового инварианта (metamorphic relation).





Приведите свои ответы здесь:

1. Тестовый оракул - частичная функция из множества последовательности тестовых действий во множество $\{true, false\}$. Не для всех задач тестовый оракул может быть вычислен за разумное время.


2. Примеры задач:

* Вычисление количества сложных комбинаторных объектов
* Определение мутаций для больших геномов
* Тестирование модели ML на неразмеченной выборке без возможности доразметки
* Проверка веб-сервисов социальных сетейПроверка киберфизических систем (лифты)

3. Методы для решения проблемы:

* Сравнение версий
* Неявные оракулы

4. $R(x_1, x_2, x_3,... , x_n, f(x_1), f(x_2), …, f(x_n)) -> \{true, false\}$

## Задание 2. Разработка тестовых инвариантов

Дана модель для распознавания сущностей в тексте.
- Придумайте и реализуйте 2 теста с тестовым оракулом (обычные тесты с правильными ответами) (*1 балл*)
- Придумайте и реализуйте не менее 3 тестовых инвариантов (metamorphic relations) для её проверки - (*суммарно 6 баллов, теоретическое описание - по 1 баллу, реализация - по 1 баллу*)
- Сравните полученные тесты. В чем преимущества каждого из методов? В чём недостатки? (*2 балла*)

*Указание*. Можете воспользоваться идеями со слайда "Bio-entity recognition" или из статьи "Quality Assurance of Bioinformatics Software: A Case Study of Testing a Biomedical Text Processing Tool Using Metamorphic Testing" из списка литературы.

**Правила оформления.**

Для каждого инварианта необходимо описать
 - из каких предположений о модели он вытекает,
 - формальное описание (желательно с формулой),
 - запуск на 1-2 примерах тестовых данных.
 
Теоретическую часть можно оформить в ячейке markdown.

### Тестируемая система

Модель позволяет искать сущности в тексте. Ниже приведены примеры того, как можно с ней работать. 

In [2]:
#!pip3 install spacy==2.2.4

In [8]:
!python3 -m spacy download en_core_web_sm

Collecting en-core-web-sm==3.7.0
  Using cached https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-3.7.0/en_core_web_sm-3.7.0-py3-none-any.whl (12.8 MB)
[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('en_core_web_sm')


In [9]:
import spacy
from spacy import displacy

In [10]:
# example of model usage
def render(text):
  
    nlp = spacy.load('en_core_web_sm') # model
  
    doc = nlp(text) # data processing

    # FYI all the properties
    props = [p for p in dir(doc.ents[0]) if p[0] != '_']
    print(props)

    # custom processing of the answer

    # get counts of entities
    ent_labels = [e.label_ for e in doc.ents]
    freq = dict()
    for l in ent_labels:
        freq[l] = ent_labels.count(l)
    print(freq)

    # get coordinates of entities
    coordinates = [e.start_char for e in doc.ents]
    print(coordinates)

    # render the answer
    displacy.render(doc, style='ent', jupyter=True)

Модель позволяет искать сущности в тексте. В ячейке ниже приведены примеры того, как можно с ней работать. 

In [11]:
text = """But Google is starting from behind. The company made a late push
into hardware, and Apple’s Siri, available on iPhones, and Amazon’s Alexa
software, which runs on its Echo and Dot devices, have clear leads in
consumer adoption."""

render(text)

['as_doc', 'char_span', 'conjuncts', 'doc', 'end', 'end_char', 'ent_id', 'ent_id_', 'ents', 'get_extension', 'get_lca_matrix', 'has_extension', 'has_vector', 'id', 'id_', 'kb_id', 'kb_id_', 'label', 'label_', 'lefts', 'lemma_', 'n_lefts', 'n_rights', 'noun_chunks', 'orth_', 'remove_extension', 'rights', 'root', 'sent', 'sentiment', 'sents', 'set_extension', 'similarity', 'start', 'start_char', 'subtree', 'tensor', 'text', 'text_with_ws', 'to_array', 'vector', 'vector_norm', 'vocab']
{'ORG': 5, 'PERSON': 1, 'LOC': 1}
[4, 84, 92, 111, 124, 133, 167]



### Пример оформления инварианта

Рассмотрим задачу поиска подстроки в строке. 

Предполагаем, что алгоритм должен находить все вхождения подстроки.

> **MR1.** Если в строке S найдёна некоторая подстрока s ровно k раз, то в строке SS она будет найдена не менее 2k раз (возможны нахождения на месте склейки строк).

Формально. Пусть S - строка, s - её подстрока, f(S,s) - определённое программой число вхождений s в S. Тогда f(SS,s) >= 2*f(S,s).


In [12]:
import re
import unittest

# function for testing
def func_to_test(substr, string):
    return re.finditer(pattern=substr, string=string)


class TestStringMethods(unittest.TestCase):

    def test_with_oracle1(self):
        # input data
        big_string = 'abacaba'
        substr = 'aba'

        # correct answer
        right_answer = [0, 4]

        indices = func_to_test(substr, big_string)
        answer = [index.start() for index in indices]
        
        self.assertTrue(answer == right_answer)

    def test_metamorphic1(self):
        # input data
        big_string1 = 'abacab'
        big_string2 = big_string1 + big_string1
        substr = 'aba'

        # first answer
        indices = func_to_test(substr, big_string1)
        indices1 = [index.start() for index in indices]

        # second answer
        indices = func_to_test(substr, big_string2)
        indices2 = [index.start() for index in indices]

        # metamorphic relation
        self.assertTrue(2*len(indices1) <= len(indices2))

Ниже мы запускаем все объявленные тестовые случаи

In [13]:
unittest.main(argv=['first-arg-is-ignored'], exit=False)

..
----------------------------------------------------------------------
Ran 2 tests in 0.005s

OK


<unittest.main.TestProgram at 0x7f46dc44b520>

### Реализуйте собственные тестовые инварианты ниже

In [81]:
# input data
text = """Apple Inc. is an American multinational technology company headquartered in Cupertino, 
California. As of March 2023, Apple is the world's biggest company by market capitalization,
and with US$394.3 billion the largest technology company by 2022 revenue. 
As of June 2022, Apple is the fourth-largest personal computer vendor by unit sales; 
the largest manufacturing company by revenue; and the second-largest mobile phone 
manufacturer in the world. It is considered one of the Big Five American information 
technology companies, alongside Alphabet (parent company of Google), Amazon, Meta Platforms, and Microsoft. 
Apple was founded as Apple Computer Company on April 1, 1976, by Steve Wozniak, Steve Jobs (1955–2011) 
and Ronald Wayne to develop and sell Wozniak's Apple I personal computer. It was incorporated by 
Jobs and Wozniak as Apple Computer, Inc. in 1977. The company's second computer, the Apple II, 
became a best seller and one of the first mass-produced microcomputers. Apple went public in 
1980 to instant financial success. The company developed computers featuring innovative 
graphical user interfaces, including the 1984 original Macintosh, announced that year in a 
critically acclaimed advertisement called "1984". By 1985, the high cost of its products, 
and power struggles between executives, caused problems. Wozniak stepped back from Apple and 
pursued other ventures, while Jobs resigned and founded NeXT, taking some Apple employees with him."""

In [90]:
render(text)

['as_doc', 'char_span', 'conjuncts', 'doc', 'end', 'end_char', 'ent_id', 'ent_id_', 'ents', 'get_extension', 'get_lca_matrix', 'has_extension', 'has_vector', 'id', 'id_', 'kb_id', 'kb_id_', 'label', 'label_', 'lefts', 'lemma_', 'n_lefts', 'n_rights', 'noun_chunks', 'orth_', 'remove_extension', 'rights', 'root', 'sent', 'sentiment', 'sents', 'set_extension', 'similarity', 'start', 'start_char', 'subtree', 'tensor', 'text', 'text_with_ws', 'to_array', 'vector', 'vector_norm', 'vocab']
{'ORG': 17, 'NORP': 2, 'GPE': 3, 'DATE': 9, 'MONEY': 1, 'ORDINAL': 4, 'CARDINAL': 2, 'PERSON': 7, 'PRODUCT': 1, 'WORK_OF_ART': 1}
[0, 17, 76, 88, 106, 118, 190, 241, 262, 273, 286, 396, 484, 489, 543, 571, 580, 588, 608, 620, 641, 667, 685, 700, 728, 761, 771, 822, 831, 842, 866, 886, 903, 943, 954, 990, 1012, 1142, 1156, 1177, 1236, 1246, 1341, 1367, 1408, 1434, 1452]


### Инвариант 1

Если в строке $S$ найдёно ровно $k$ сущностей, то в строке $S S$ будет найдено ровно $2k$ сущностей. 
Формально. Пусть $S$ - строка, $f(S)$ - количество сущностей в $S$. Тогда $f(S  S) = 2*f(S)$.

In [84]:
import unittest
import timeout_decorator

# function for testing
def func_to_test(text):
    nlp = spacy.load('en_core_web_sm') # model
  
    doc = nlp(text) # data processing
    return len(doc.ents)


class TestStringMethods(unittest.TestCase):
  
    @timeout_decorator.timeout(10)
    def test_with_oracle(self):

        answer = func_to_test(text)
        self.assertEqual(answer, 47)

    @timeout_decorator.timeout(10)
    def test_metamorphic(self):
     
        new_text = text + ' ' + text
        count1 = func_to_test(text)
        count2 = func_to_test(new_text)
        self.assertEqual(2 * count1, count2)

In [85]:
suite_list = []
suite_list.append(unittest.TestLoader().loadTestsFromTestCase(TestStringMethods))
runner = unittest.TextTestRunner(verbosity=2).run(unittest.TestSuite(suite_list))

test_metamorphic (__main__.TestStringMethods) ... ok
test_with_oracle (__main__.TestStringMethods) ... ok

----------------------------------------------------------------------
Ran 2 tests in 2.323s

OK


### Инвариант 2

При перестановке предложений в строке $S$ количество различных сущностей не изменится.
Пусть $S$ строка, $S_1$ - строка полученная из $S$ перестановкой предложений и $f(S)$ - словарь различных сущностей в строке $S$. Тогда $f(S) = f(S_1).$

In [95]:
import unittest

# function for testing
def func_to_test(text):
    nlp = spacy.load('en_core_web_sm') # model
  
    doc = nlp(text) # data processing
    ent_labels = [e.label_ for e in doc.ents]
    freq = dict()
    for l in ent_labels:
        freq[l] = ent_labels.count(l)
    return freq


class TestStringMethods(unittest.TestCase):
  
    @timeout_decorator.timeout(10)
    def test_with_oracle(self):

        answer = func_to_test(text)
        self.assertEqual(
            answer, 
            {
                'CARDINAL': 2, 
                'DATE': 9, 
                'GPE': 3, 
                'MONEY': 1, 
                'NORP': 2,
                'ORDINAL': 4,
                'ORG': 17,
                'PERSON': 7,
                'PRODUCT': 1,
                'WORK_OF_ART': 1
            }
        )

    @timeout_decorator.timeout(10)
    def test_metamorphic(self):
        
        new_text = '. '.join(text[:-1].split('. ')[::-1])

        freq1 = func_to_test(text)
        freq2 = func_to_test(new_text)

        self.assertEqual(freq1, freq2)
  

In [96]:
suite_list = []
suite_list.append(unittest.TestLoader().loadTestsFromTestCase(TestStringMethods))
runner = unittest.TextTestRunner(verbosity=2).run(unittest.TestSuite(suite_list))

test_metamorphic (__main__.TestStringMethods) ... ok
test_with_oracle (__main__.TestStringMethods) ... ok

----------------------------------------------------------------------
Ran 2 tests in 1.896s

OK


### Инвариант 3

Утверждается, что в отличие от `PERSON` или `ORG`, теги `DATE` не должны зависеть от регистра

Если в строке $S$ количество тегов `DATE` - $n$, то в строке $S.lower()$ количество тегов `DATE` тоже $n.$

In [99]:
import unittest

# function for testing
def func_to_test(text):
    nlp = spacy.load('en_core_web_sm') # model
  
    doc = nlp(text) # data processing
    ent_labels = [e.label_ for e in doc.ents]
    freq = dict()
    for l in ent_labels:
        freq[l] = ent_labels.count(l)
    return freq['DATE']


class TestStringMethods(unittest.TestCase):
  
    @timeout_decorator.timeout(10)
    def test_with_oracle(self):

        answer = func_to_test(text)
        self.assertEqual(answer, 9)

    @timeout_decorator.timeout(10)
    def test_metamorphic(self):

        freq1 = func_to_test(text)
        freq2 = func_to_test(text.lower())

        self.assertEqual(freq1, freq2)
  

In [100]:
suite_list = []
suite_list.append(unittest.TestLoader().loadTestsFromTestCase(TestStringMethods))
runner = unittest.TextTestRunner(verbosity=2).run(unittest.TestSuite(suite_list))

test_metamorphic (__main__.TestStringMethods) ... ok
test_with_oracle (__main__.TestStringMethods) ... ok

----------------------------------------------------------------------
Ran 2 tests in 2.177s

OK
