<a href="https://colab.research.google.com/github/marcusRB/uoc-ub-bioinformatics-programming-language/blob/master/05_testing_and_quality.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Programación para la Bioinformática

## Unidad 5: *Testing* y calidad del software

## Etiquetas

Bienvenidos a la PEC de la unidad 5. Bajo estas lineas encontrareis Ejercicios y preguntas cada uno de ellos tendrá una etiqueta que indica los recursos necesarios para resolverlos. Hay tres posibles etiquetas:


* **<font color="green" size="+2">MU</font>** **Materiales unidad**: las herramientas necesarias para realizar la actividad se pueden encontrar en los materiales de la asignatura.

* **<font color="blue" size="+2">EG</font>** **Consulta externa guiada**: la actividad puede requerir utilizar herramientas que no se encuentran en los materiales de la asignatura, pero el enunciado contiene indicaciones de como encontrar la información adicional necesaria.

* **<font color="gold" size="+2">CI</font>** **Consulta externa independiente**: la actividad puede requerir utilizar herramientas que no se encuentran en los materiales de la asignatura, y el enunciado no incluye las indicaciones de como encontrar la información adicional. El estudiante deberá buscar esta información independientemente.)


In [11]:
!pip install ipytest
import ipytest
ipytest.autoconfig()



Ejercicios y preguntas teóricas
-------------------------------

A continuación, encontraréis la parte que tenéis que completar en este módulo y las preguntas teóricas a contestar dentro de la sección **ejercicios evaluables**.

Además de estos ejercicios, teneís otros dentro de la sección **ejercicios de entrenamiento**. Estos ejercicios no cuentan para la nota de la PEC pero su realización es obligatoria. Si entregáis los evaluables completados pero estos en blanco, tendréis una penalización en la nota final. La finalidad de estos ejercicios es que practiquéis. A diferencia de los evaluables, los ejercicios ejemplo podéis discutirlos en el foro entre vosotros pegando código, etc. Sin limitaciones. Sobre los evaluables también podéis preguntar pero sin compartir código ni dar "pistas" sobre como resolverlos a los compañeros.


### **Ejercicios Entrenamiento**


### Ejercicio entrenamiento 1 ###
Dada la siguiente función que calcula la suma de cuadrados, escribe el código necesario para realizar pruebas de código usando doctest.

La suma de cuadrados se refiere a dado un numero n sumar todos los cuadrados hasta llegar a él, es decir, si n=3 la suma de cuadros sera $1^{2} + 2^{2} + 3^{2}$, $1+4+9$, =14`




In [12]:
def sum_of_squares(n):
    """Calcula la suma de los cuadrados hasta n.

        Respuesta
        >>> [sum_of_squares(n) for n in range(5)]
        [0, 1, 5, 14, 30]

        >>> sum_of_squares(3)
        14
    """

    if not n >= 0:
        raise ValueError("n debe ser >= 0")

    result = 0
    for i in range(n + 1):
        result += i ** 2

    return result

if __name__ == "__main__":
    import doctest
    doctest.run_docstring_examples(sum_of_squares, globals(), verbose=True)

Finding tests in NoName
Trying:
    [sum_of_squares(n) for n in range(5)]
Expecting:
    [0, 1, 5, 14, 30]
ok
Trying:
    sum_of_squares(3)
Expecting:
    14
ok


Ademas tambien podemos capturar errores, escribe el codigo necesario para ello

In [13]:
def sum_of_squares(n):
    """Calcula la suma de los cuadrados hasta n.

        Respuesta
        >>> [sum_of_squares(n) for n in range(5)]
        [0, 1, 5, 14, 30]

        >>> sum_of_squares(3)
        14

        >>> sum_of_squares(-1)
        Traceback (most recent call last):
        ...
        ValueError: n debe ser >= 0
    """

    if not n >= 0:
        raise ValueError("n debe ser >= 0")

    result = 0
    for i in range(n + 1):
        result += i ** 2

    return result

if __name__ == "__main__":
    import doctest
    doctest.run_docstring_examples(sum_of_squares, globals(), verbose=True)

Finding tests in NoName
Trying:
    [sum_of_squares(n) for n in range(5)]
Expecting:
    [0, 1, 5, 14, 30]
ok
Trying:
    sum_of_squares(3)
Expecting:
    14
ok
Trying:
    sum_of_squares(-1)
Expecting:
    Traceback (most recent call last):
    ...
    ValueError: n debe ser >= 0
ok


### Ejercicio entrenamiento 2:

Dada la función complementaria_inversa (dna_secuencia) que devuelve la complementaria inversa de una secuencia de ADN dada, escribe tests unitarios utilizando unittest. Los test deben verificar si la función produce los resultados esperados para diferentes secuencias de ADN.

Recuerda tener en cuenta casos especiales y asegurarte de que la función maneje correctamente cualquier secuencia de ADN proporcionada.

La función debe seguir los pasos adecuados para encontrar el complemento inverso de la secuencia de ADN, teniendo en cuenta las bases complementarias (A-T, C-G) y el orden inverso de la secuencia.

Referencia:

    - Complementary DNA Strands:
    
    https://www.wikihow.life/Find-the-Reverse-Complement-of-a-DNA-Sequence#:~:text=Trace%20through%20the%20sequence%20backwards,last%20nucleotide%20in%20the%20sequence.&text=As%20you%20pass%20over%20each,hand%20side%20of%20the%20page.
    

In [14]:
# Importar librerias requeridas
import unittest
import sys

def complementaria_inversa(dna_seq):
    """
    Encuentra la complementaria inversa de una secuencia DNA.

    Parametros:
    - dna_seq (str): Entrada DNA.

    Return:
    - str: Complementaria inversa del DNA.

    Referencia:
    - Complementary DNA Strands:https://www.wikihow.life/Find-the-Reverse-Complement-of-a-DNA-Sequence#:~:text=Trace%20through%20the%20sequence%20backwards,last%20nucleotide%20in%20the%20sequence.&text=As%20you%20pass%20over%20each,hand%20side%20of%20the%20page.
    """
    complement = {"A": "T", "T": "A", "C": "G", "G": "C"}
    reverse_dna = dna_seq[::-1]
    complementaria_inversa = "".join(complement[base] for base in reverse_dna)
    return complementaria_inversa


#Tests
class TestEjercicio2(unittest.TestCase):
    def test_reverse_complement(self):
        #Respuesta
        # We should use assertEqual to check if arguments are equal or not
        # It's important to receive an input in uppercase
        sequence = 'CGACAATGCAC'
        result_reverse_complement = "GTGCATTGTCG"
        base_pairs = ['ATGC']
        self.assertIsInstance(sequence, str)
        self.assertEqual(complementaria_inversa(sequence), result_reverse_complement)


    # Agrega los tests necesarios
    # Test para probar como pasar un string a mayúsculas:
    def test_upper(self):
        # assertEqual es una función especial que comprueba si ambos
        # argumentos son iguales o no:
        self.assertEqual('foo'.upper(), 'FOO')

    # Test para probar si un string contiene solo mayúsculas:
    def test_isupper(self):
        # assertTrue comprueba si el valor que se devuelve es TRUE
        self.assertTrue('FOO'.isupper())

        # assertFalse hace lo propio para FALSE
        self.assertFalse('Foo'.isupper())

if __name__ == '__main__':
    suite = unittest.TestLoader().loadTestsFromTestCase( TestEjercicio2 )
    unittest.TextTestRunner(verbosity=1,stream=sys.stderr).run( suite )

...
----------------------------------------------------------------------
Ran 3 tests in 0.004s

OK


### Ejercicio entrenamiento 3
**Hablamos de tests en verde cuando todos nuestros tests se ejecutan correctamente y dan el resultado esperado y tests en rojo en caso contrario.**

En el siguiente ejercicio, escribe el código necesario que haga cumplir todos los tests, es decir, que los tests estén *en verde* **sin modificar en ningún momento la parte correspondiente al código de los tests** (`class TestMonster`).

In [15]:
import unittest
import sys


class Monster:
    """A cute monster"""

    def __init__(self, name, size, basic_type='fire'):
        """Creates a new monster"""
        self.name = name
        self.size = size
        self.basic_type = basic_type.lower()

    def fight(self, monster2):
        """Two monsters fight each other. Returns the name of the monster winning
        or 'draw' otherwise.

        Monster battles have very specific rules:
        - Water wins over Fire
        - Electrical wins over Water
        - Plant wins over Electrical
        - Fire wins over Plant

        if both monsters fighting have the same type, bigger monster wins!
        if both monsters fighting have the same type and size, it's a draw

        Any other combination, it's a draw
        """
        #Respuesta
        # Creating the winning rules
        win_rules = {
            "water": "fire",
            "electrical": "water",
            "plant": "electrical",
            "fire": "plant"
        }
        # Create the logics for same type and size
        if self.basic_type == monster2.basic_type:
            if self.size > monster2.size:
                return self.name
            elif self.size < monster2.size:
                return monster2.name
            else:
                return "draw"

        # Other combinations
        if win_rules.get(self.basic_type) == monster2.basic_type:
            return self.name
        if win_rules.get(monster2.basic_type) == self.basic_type:
            return monster2.name

        # Any other case
        return "draw"



class TestMonster(unittest.TestCase):

    def test_create_a_new_monster(self):
        # Create a monster
        pika = Monster("Pika", 10, "electrical")

        # Test if it is not none
        self.assertIsNotNone(pika)

        # Test if attributes have been set properly
        self.assertEqual("Pika", pika.name)
        self.assertEqual(10, pika.size)
        self.assertEqual("electrical", pika.basic_type)

    def test_fight_water_fire(self):
        """Test which monsters wins in a water vs fire fight"""
        squirtle = Monster("Squirtle", 10, "water")
        char = Monster("Char", 10, "fire")

        self.assertEqual("Squirtle", squirtle.fight(char))

    def test_fight_fire_plant(self):
        """Test which monsters wins in a plant vs fire fight"""
        char = Monster("Char", 10, "fire")
        bulb = Monster("Bulb", 15, "plant")

        self.assertEqual("Char", char.fight(bulb))

    def test_electrical_electrical_same_size(self):
        """Test which monsters wins if both have same type and size"""
        pika = Monster("Pika", 10, "electrical")
        pichu = Monster("Pichu", 10, "electrical")

        self.assertEqual("draw", pika.fight(pichu))

    def test_electrical_electrical_different_size(self):
        """Test which monsters wins if both have same type but different size"""
        pika = Monster("Pika", 10, "electrical")
        pichu = Monster("Pichu", 9, "electrical")

        self.assertEqual("Pika", pika.fight(pichu))


if __name__ == '__main__':
    suite = unittest.TestLoader().loadTestsFromTestCase(TestMonster)
    unittest.TextTestRunner(verbosity=1,stream=sys.stderr).run(suite)

.....
----------------------------------------------------------------------
Ran 5 tests in 0.005s

OK


### **Ejercicios evaluables**

### Pregunta teórica 1 **<font color="green" size="+2">MU</font>**

En los materiales de la unidad se presenta la importancia del *testing* para garantizar la calidad del software científico y se introducen dos herramientas: `doctest` y `unittest`. Basándote en lo estudiado, explica con tus propias palabras:

a) ¿Qué ventaja principal ofrece `doctest` frente a otras formas de testing? ¿En qué situaciones sería más apropiado utilizarlo según lo visto en los materiales?

b) En `unittest`, ¿cuál es la estructura básica que debe seguir una clase de tests? Menciona: cómo debe heredar la clase, cómo deben nombrarse los métodos de prueba, y qué funciones de aserción se utilizan para verificar resultados (cita al menos tres ejemplos vistos en los materiales).

#### <font color="purple">Respuesta Pregunta teórica 1</font>

a) `Doctest` combine documentation and testing in one format, docstring. There are very useful to show the test on the interactive manner. Honestly I don't see any kind of testing except for educational purpose or very basic example to show something, like the behaviour of the particular function. Maybe, in bioinformatics will be very helpful to understand how a specific function or methods really works.

b) `Unittest` is a framework, and is very different from the previous tool because it is a inheritance from `TestCase` and tests expected in the methods with prefix test_ . In the real world are most common useful and important to validate certain process, specially in the CICD pipeline. The call the methods it might necessary use `assert` methods, like `assertEqual`,  `assertFalse`, `assertRaiseRegex` and so on.

Those information are available in the official Python documentation:
- https://docs.python.org/es/3.13/library/doctest.html
- https://docs.python.org/3/library/unittest.html


---

### Pregunta teórica 2 **<font color="green" size="+2">MU</font>**

En los materiales de la unidad se explica el concepto de **sobrecarga de métodos** (*operator overloading*) como una característica importante de la Programación Orientada a Objetos en Python. Basándote en los ejemplos presentados:

a) ¿Qué significa que "en Python todo se considera un objeto, incluso las funciones"? ¿Cómo se relaciona esto con la sobrecarga de operadores?

b) Describe el propósito de *al menos tres* métodos especiales de los presentados en los materiales (por ejemplo: `__add__`, `__eq__`, `__str__`, `__lt__`). Para cada uno, indica qué operador o función de Python se asocia con él.

c) Utilizando como base la clase `Persona` de los materiales, escribe un ejemplo sencillo de código donde se sobrecargue el operador `+` (`__add__`) para sumar las edades de dos personas y devolver la suma total.

#### <font color="purple">Respuesta Pregunta teórica 2</font>

a) This means that all elements in Python (numbers, strings, functions, classes) are instances of some class and have associated methods. For example, when we type in the cell `3 + 5`, Python behind the scene executes (3).__add__(5).

b) To continue with some examples:
- `__add__(self, other)`, overload the operator + which allows define one object, self declarated before,  with other which has the same constructor adding the elements.
- `__eq__(self, other)`, like the previous, but compare two elements given the boolean result, True or False.
- `__str__(self)`, overload the methods print() and str() theirself, with some control over the object.
- `__lt__(self, other)`, overlad the operator < , which means "less then", compare two objects given the result True or False.

All those methods are normally used in Java, C, and so on, typical in oriented programming languages.

c) Using `Person` as class, we create an example

```
class Persona:
    def __init__(self, name, age):
        self.name = name
        self.age = age
    
    def __add__(self, other):
        return self.age + other.age
    
    def __str__(self):
        return f"{self.name} ({self.age} years)"

# Using example
pilot = Persona("Jeff", 45)
copilot = Persona("Bezos", 50)

mean_age = (pilot + copilot) / 2
print(f"Mean age is: {mean_age}")

# result expected 47.5
```


---

### Pregunta teórica 3 **<font color="blue" size="+2">EG</font>**

Los materiales de la unidad introducen el uso de `setUp()` y `tearDown()` en `unittest` para preparar y limpiar el entorno de los tests. Sin embargo, existen alternativas más modernas para este propósito.

Investiga sobre los **fixtures** en la librería `pytest` (puedes consultar la documentación oficial en https://docs.pytest.org/en/stable/explanation/fixtures.html) y explica:

a) ¿Qué son los *fixtures* en `pytest` y cómo se definen?

b) ¿Qué ventajas ofrecen los *fixtures* de `pytest` respecto al patrón `setUp()`/`tearDown()` de `unittest`?

c) Proporciona un ejemplo sencillo de un fixture que prepare una lista de secuencias de DNA para ser utilizada en varios tests.

No olvides citar tus fuentes.

#### <font color="purple">Respuesta Pregunta teórica 3</font>

a) The `fixtures` used in pytest are special decorators which define the steps and how the arrange the test. To define a fixture like @pytest.fixture followed by a definition of method of function.

b) The explanation from pytest, https://docs.pytest.org/en/stable/explanation/types.html compare with unittest we see difference like:
- naming, the fixtures are more direct to assign it and the activation is based by declaration in the function, method or class.
- modularity, more fixture combined each others trigger other function which call other fixture.
- teardown management, the logic of teardown by tearDown(), for example, could manage in simple manner, because is safe and control the errors itself.
- cyclic, once a fixter has been declarated, the use in cycle, more times and every test get the own result avoiding collides.

c) Regarding the fixture I prepare an example:

```
import pytest

@pytest.fixture
def dna_sequences():
    """Fixture which manage different DNA sequence"""
    return [
        "ATGCGATCGATCG",
        "CCGGTTAAGGCC",
        "ATATATATAT",
        "GCGCGCGC"
    ]

# Uso en tests
def test_sequence_length(dna_sequences):
    """Test que verifica longitudes de las secuencias."""
    for seq in dna_sequences:
        assert len(seq) > 0
        
def test_valid_nucleotides(dna_sequences):
    """Test que verifica que solo contienen nucleótidos válidos."""
    valid_nucleotides = set('ATGC')
    for seq in dna_sequences:
        assert all(nucleotide in valid_nucleotides for nucleotide in seq)

def test_sequence_count(dna_sequences):
    """Test que verifica el número de secuencias."""
    assert len(dna_sequences) == 4


```

**Fuentes Consultadas:**
- https://docs.pytest.org/en/stable/explanation/types.html
- https://docs.pytest.org/en/stable/how-to/fixtures.html
- https://realpython.com/pytest-python-testing/


---

### Pregunta teórica 4 **<font color="gold" size="+2">CI</font>**

En el desarrollo de software científico para bioinformática, es importante no solo escribir tests, sino también medir su efectividad. Investiga sobre el concepto de **cobertura de código** (*code coverage*) y responde:

a) ¿Qué es la cobertura de código y qué tipos de cobertura existen (líneas, ramas, condiciones)?

b) ¿Por qué una cobertura del 100% no garantiza que el código esté libre de errores? Proporciona un ejemplo ilustrativo.

c) Investiga sobre la herramienta `coverage.py` para Python. ¿Cómo se puede integrar con `pytest` o `unittest` para generar informes de cobertura?

No olvides citar tus fuentes.

#### <font color="purple">Respuesta Pregunta teórica 4</font>

a) The code coverage is a percentage that measures the degree to which a program's source code is executed when a particular pytest test suite is run. In a normal workflow or production pipeline, before to promote develop branch in master branch, for example, a program with high code coverage has more of its source code executed during testing, suggesting it is less likely to contain undetected bugs.

There are:
- Line Coverage: Reports which lines of code were executed to complete the test
- Branch Coverage: Reports which branches or decision points of the code were executed to complete the test
- Condition Coverage: Measures how well Boolean sub-expressions have been tested for true and false values
- Function Coverage: The percentage of functions or methods covered by tests

b) Reach the 100% of the test coverage is similar a worse quality of code.
If the test is very low quality, in the real world, the "bug" appears and the scenario will be catastrofic. The coverage has a measure of the executions of the guided tests, no the possible fixes. Also, could be exist extreme cases which there are no precedents in the real world, and the test pass but the execution don't.

I generate an example very useful to understand how it works:

```
# Bug - debería ser a + b
def add(a, b):
    return a * b  

# Test con 100% cobertura pero que NO detecta el bug
def test_add():
    add(2, 3)  # Ejecuta la función pero no verifica el resultado
    # Sin assert, el test pasa aunque el código esté mal
```



c) The coverage.py is a tool for measuring code coverage in Python programs. It monitors your program, noting which parts of the code have been executed, and then analyzes the source code to identify code that could have been executed but wasn't. It is integrated with pytest and unittest. Normally save the final documentation generated like report of coverage in log format or html format.
To integrate within unittest the execution is like:
```
pip install coverage

coverage run -m unittest discover
```

by pytest

```
coverage run -m pytest tests/

```


**Fuentes Consultadas:**

- Atlassian - What is Code Coverage?: https://www.atlassian.com/continuous-delivery/software-testing/code-coverage

- Coverage.py Documentation: https://coverage.readthedocs.io/

- Wikipedia - Code coverage: https://en.wikipedia.org/wiki/Code_coverage


---

### Pregunta teórica 5 **<font color="gold" size="+2">CI</font>**

El **Desarrollo Guiado por Pruebas** (Test-Driven Development o TDD) es una metodología que ha ganado popularidad en el desarrollo de software científico reproducible. Investiga sobre TDD y explica:

a) ¿Cuál es la filosofía fundamental del TDD y cómo difiere del enfoque tradicional de escribir tests después del código?

b) Describe el ciclo "Rojo-Verde-Refactorizar" (Red-Green-Refactor) que caracteriza a TDD.

c) ¿Qué beneficios específicos podría aportar TDD al desarrollo de pipelines de análisis de datos en bioinformática? Menciona al menos dos ventajas concretas.

No olvides citar tus fuentes.

#### <font color="purple">Respuesta Pregunta teórica 5</font>

a) Test-Driven Development is a way of writing code that involves writing an automated unit case test that fails, then writing just enough code to make the test pass, then refactoring both the test code and the production code, and then repeating with another new test case. In traditional unit testing, developers write the code first, then create tests afterward to validate it. With TDD, the process is reversed: developers write a test before writing any code, allowing the test to guide the design and ensure clear expectations from the start.

b) Basically, the Red-Green-Refactor cycle is the heart of TDD:
* RED: In the Red phase, you write a test that fails. This means you create a test to verify a specific behavior or functionality that hasn't yet been implemented, for that it called "in the red."

* GREEN: In the Green phase, the focus shifts to implementing the code needed to pass the previously failing test. The goal is to write the minimum amount of code required to meet the test requirements. The objective is to find a solution, without worrying about optimizing your implementation.

3. REFACTOR: During the Refactor phase, the code is improved without altering its behavior. Refactoring is essential for maintaining the quality and readability of the codebase. The code is refactored for readability and maintainability. For example, hardcoded test data should be removed from the production code (always it might be). Running the test suite after each refactoring ensures that no existing functionality is broken.

c) In my opinion, in the Bioinformatics field, there are two main motivations:
- Improved reproducibility and maintainability which means the developing large and complex pipelines that handle massive amounts of data becomes challenging, especially when teams with diverse expertise are involved and operating in a distributed computational environment. Representing and tracking data provenance consistently is key, both for testing and documenting pipelines, enabling their reuse.

- Early error detection and reduced maintenance costs: TDD becomes very useful when you need to build robust production pipelines. TDD is particularly well-suited to unit testing, especially for the processing portions of the pipeline (preprocessing and postprocessing), where the code is deterministic.
By applying a test-first approach, TDD reduces the likelihood of introducing defects into the code from the outset.

**Fuentes Consultadas:**
- Wikipedia - Test-driven development: https://en.wikipedia.org/wiki/Test-driven_development
- Medium - The Philosophy Behind Test Driven Development(TDD): https://medium.com/@saminYasir/the-philosophy-behind-test-driven-development-tdd-9473f683efb2
- DEV Community - The TDD Cycle: Red, Green, Refactor: https://dev.to/mungaben/the-tdd-cycle-red-green-refactor-1aaf
- Codurance - Test Driven Development: https://www.codurance.com/test-driven-development-guide


---

### Pregunta teórica 6 **<font color="blue" size="+2">EG</font>**

Al trabajar con cálculos numéricos en bioestadística (correlaciones, p-valores, métricas de clasificación), la comparación de números en punto flotante puede ser problemática. Consulta la documentación oficial de `unittest` (https://docs.python.org/3/library/unittest.html#unittest.TestCase.assertAlmostEqual) y responde:

a) ¿Por qué comparar dos números `float` con `==` puede dar resultados inesperados en los tests?

b) ¿Qué método proporciona `unittest.TestCase` para comparar números decimales con tolerancia? Explica los parámetros `places` y `delta`.

c) Escribe un test unitario que verifique que el resultado de `0.1 + 0.2` es aproximadamente `0.3`, mostrando por qué `assertEqual` fallaría y cómo `assertAlmostEqual` lo resuelve.

No olvides citar tus fuentes.

#### <font color="purple">Respuesta Pregunta teórica 6</font>

a) The fundamental problem lies in how decimal numbers are represented in binary format. Representation errors stem from the fact that some (most, in fact) decimal fractions cannot be represented exactly as binary (base 2) fractions. This is the main reason why Python (or Perl, C, C++, Java, Fortran, and many others) often won't display the exact decimal number you expect.
Generally, the floating-point decimal numbers you input are only approximated by the floating-point binary numbers actually stored in the machine. For example, no matter how many base-2 digits you're willing to use, the decimal value 0.1 cannot be represented exactly as a base-2 fraction. In base 2, 1/10 is an infinitely repeating fraction.

The classic example of 0.1 + 0.2:
Adding 0.1 and 0.2 should give 0.3, but instead we get 0.30000000000000004. The reason is that neither 0.1 nor 0.2 has an exact binary representation, and small rounding errors accumulate when the values ​​are added.

```
>>> 0.1 + 0.2
0.30000000000000004

>>> 0.1 + 0.2 == 0.3
False # Unexpected result!
```

b) For example the method `assertAlmostEqual(first, second, places=7, msg=None, delta=None)` tests that `first` and `second` are approximately equal by calculating the difference, rounding it to the given number of decimal places (7 by default), and comparing it to zero.

Parameters used in the method:
`places` (decimal places):
* The method uses `places` to round the difference before comparing it to zero. Note that `places` are not significant digits.
* The method does the following: First, it calculates the difference. Second, it rounds it to the given number of decimal places (7 by default). Third, it compares the rounded value to zero.
* Internally, it uses: `round(first-second, places) == 0`
* Default: `places=7`
`delta` (maximum allowed difference):
* If `delta` is provided instead of `places`, then the difference between `first` and `second` must be less than or equal to `delta`. Providing both delta and places results in a TypeError.

* If you pass delta instead of places, then the difference between first and second must be less than or equal to (or greater than) delta.

c) An example for Biostatistics:

```
import unittest

class TestPrecisionBioestadistica(unittest.TestCase):
    """
    Ejemplo bioestadístico: Cálculo de proporciones en un estudio clínico
    
    Escenario: En un estudio con 10 pacientes, 1 mostró mejoría en el primer
    grupo (0.1 o 10%) y 2 en el segundo grupo (0.2 o 20%).
    La proporción total combinada debería ser 0.3 (30%).
    """
    
    def test_proporcion_con_assertEqual_FALLA(self):
        """
        Este test FALLA debido a la precisión de punto flotante.
        Python no puede representar 0.1 y 0.2 exactamente en binario.
        """
        proporcion_grupo1 = 0.1  # 10% de pacientes con mejoría
        proporcion_grupo2 = 0.2  # 20% de pacientes con mejoría
        proporcion_esperada = 0.3  # 30% total esperado
        
        proporcion_total = proporcion_grupo1 + proporcion_grupo2
        
        # Veamos qué valor real obtenemos
        print(f"\nValor calculado: {proporcion_total}")
        print(f"Valor esperado: {proporcion_esperada}")
        print(f"¿Son iguales? {proporcion_total == proporcion_esperada}")
        print(f"Representación completa: {proporcion_total:.20f}")
        
        # Este assertEqual FALLARÁ
        try:
            self.assertEqual(proporcion_total, proporcion_esperada)
            print("✓ assertEqual pasó (inesperado)")
        except AssertionError as e:
            print(f"✗ assertEqual falló: {e}")
    
    def test_proporcion_con_assertAlmostEqual_PASA(self):
        """
        Este test PASA porque assertAlmostEqual compara con una tolerancia.
        Por defecto, verifica 7 decimales de precisión.
        """
        proporcion_grupo1 = 0.1
        proporcion_grupo2 = 0.2
        proporcion_esperada = 0.3
        
        proporcion_total = proporcion_grupo1 + proporcion_grupo2
        
        # assertAlmostEqual permite pequeñas diferencias
        self.assertAlmostEqual(proporcion_total, proporcion_esperada, places=7)
        print("\n✓ assertAlmostEqual pasó correctamente")
        print(f"Diferencia: {abs(proporcion_total - proporcion_esperada):.20f}")
    
    def test_proporcion_especificando_decimales(self):
        """
        Podemos especificar cuántos decimales verificar según la precisión
        requerida en nuestro estudio bioestadístico.
        """
        proporcion_total = 0.1 + 0.2
        proporcion_esperada = 0.3
        
        # Para bioestadística, 2 decimales suelen ser suficientes (99% vs 99.5%)
        self.assertAlmostEqual(proporcion_total, proporcion_esperada, places=2)
        print("\n✓ Test con 2 decimales pasó (suficiente para la mayoría de análisis)")

if __name__ == '__main__':
    # Ejecutar los tests
    print("=" * 70)
    print("DEMOSTRACIÓN: Precisión de Punto Flotante en Bioestadística")
    print("=" * 70)
    
    unittest.main(verbosity=2))
```


**Fuentes Consultadas:**
- Python 3 Official Documentation - unittest.html: https://docs.python.org/3/library/unittest.html
- Python Tutorial - assertAlmostEqual: https://www.pythontutorial.net/python-unit-testing/python-assertalmostequal/
- GeeksforGeeks - Floating point error in Python: https://www.geeksforgeeks.org/python/floating-point-error-in-python/
- ClaudeGenerativeAI to reproduce some example above
https://claude.ai/share/26906a50-755f-4872-84de-14b7fe3792c6

---

### Ejercicio 1 **<font color="green" size="+2">MU</font>**

**Hablamos de tests en verde cuando todos nuestros tests se ejecutan correctamente y dan el resultado esperado, y tests en rojo en caso contrario.**

Se te proporciona una clase `TestGeneExpression` con una serie de pruebas unitarias para una clase `GeneExpression` que aún no has implementado. Tu tarea es escribir el código necesario para que todas las pruebas pasen (*tests en verde*). **No debes modificar la clase de tests.**

La clase `GeneExpression` representa los niveles de expresión de un gen y deberá:

1. Inicializarse con un nombre de gen (string) y un valor de expresión opcional (por defecto 0.0). El valor de expresión debe ser un número (int o float). Si no lo es, debe lanzar un `TypeError`. Si es negativo, debe lanzar un `ValueError`.
2. Tener un método `fold_change(control_value)` que calcule el cambio relativo respecto a un valor control: `(expresión - control) / control`. Si `control_value` es 0, debe lanzar un `ValueError`.
3. Sobrecargar el operador `>` para comparar dos genes por su nivel de expresión.
4. Sobrecargar el método `__str__` para devolver una representación legible del gen.

In [17]:
# IMPLEMENTA TU SOLUCIÓN AQUÍ

import unittest
import sys

class GeneExpression:
    """Clase que representa la expresión de un gen."""

    def __init__(self, gene_name, expression=0.0):
        #pass  # Implementa tu código
        self.gene_name = gene_name
        if not isinstance(expression, (int, float)):
            raise TypeError("El valor de expresión debe ser numérico.")
        elif expression < 0.0:
            raise ValueError("El valor de expresión no puede ser negativo.")
        else:
            self.expression = expression

    def fold_change(self, control_value):
        #pass  # Implementa tu código
        if isinstance(control_value, int):
            if control_value > 0:
                return ((self.expression - control_value) / control_value)
            else:
                raise ValueError("El valor control no puede ser cero.")

    def __gt__(self, other):
        #pass  # Implementa tu código
        if isinstance(other, GeneExpression):
            return self.expression > other.expression

    def __str__(self):
        #pass  # Implementa tu código
        if isinstance(self, GeneExpression):
            return "Gen: {0}, Expresión: {1}".format(self.gene_name, self.expression)


In [18]:
class TestGeneExpression(unittest.TestCase):

    def test_create_gene_default(self):
        gene = GeneExpression("BRCA1")
        self.assertEqual(gene.gene_name, "BRCA1")
        self.assertEqual(gene.expression, 0.0)

    def test_create_gene_with_expression(self):
        gene = GeneExpression("TP53", 150.5)
        self.assertEqual(gene.expression, 150.5)

    def test_create_gene_invalid_type(self):
        with self.assertRaisesRegex(TypeError, "El valor de expresión debe ser numérico."):
            GeneExpression("EGFR", "alto")

    def test_create_gene_negative_expression(self):
        with self.assertRaisesRegex(ValueError, "El valor de expresión no puede ser negativo."):
            GeneExpression("MYC", -50)

    def test_fold_change_calculation(self):
        gene = GeneExpression("KRAS", 200)
        self.assertAlmostEqual(gene.fold_change(100), 1.0)

    def test_fold_change_downregulated(self):
        gene = GeneExpression("PTEN", 50)
        self.assertAlmostEqual(gene.fold_change(100), -0.5)

    def test_fold_change_division_by_zero(self):
        gene = GeneExpression("AKT1", 100)
        with self.assertRaisesRegex(ValueError, "El valor control no puede ser cero."):
            gene.fold_change(0)

    def test_comparison_greater_than(self):
        gene1 = GeneExpression("BRCA1", 200)
        gene2 = GeneExpression("BRCA2", 150)
        self.assertTrue(gene1 > gene2)
        self.assertFalse(gene2 > gene1)

    def test_str_representation(self):
        gene = GeneExpression("TP53", 100.5)
        self.assertEqual(str(gene), "Gen: TP53, Expresión: 100.5")


if __name__ == '__main__':
    suite = unittest.TestLoader().loadTestsFromTestCase(TestGeneExpression)
    unittest.TextTestRunner(verbosity=1, stream=sys.stderr).run(suite)


.........
----------------------------------------------------------------------
Ran 9 tests in 0.007s

OK


---

### Ejercicio 2 **<font color="blue" size="+2">EG</font>**

Se te proporciona la siguiente función `calcular_imc(peso, altura)` que calcula el Índice de Masa Corporal. Tu tarea es **escribir los doctests en el docstring de la función** para verificar su correcto funcionamiento.

Consulta la documentación de `doctest` para recordar cómo capturar excepciones en los tests: https://docs.python.org/3/library/doctest.html#what-about-exceptions

**Contexto de la función (ya implementada):**
* El IMC se calcula como: `peso / (altura ** 2)`, donde peso está en kg y altura en metros.
* La función valida que `peso` y `altura` sean números positivos. Si alguno no es numérico, lanza `TypeError`. Si alguno es ≤ 0, lanza `ValueError`.
* Devuelve el IMC como un número flotante.

**Instrucciones:** Añade doctests para cubrir:
1. Un cálculo típico (peso=70, altura=1.75).
2. Un caso con persona de baja estatura.
3. Un caso donde el peso no es numérico (string).
4. Un caso donde la altura es cero.
5. Un caso donde el peso es negativo.

In [19]:
def calcular_imc(peso, altura):
    """
    Calcula el Índice de Masa Corporal (IMC).

    Parámetros:
    - peso: peso en kilogramos (número positivo)
    - altura: altura en metros (número positivo)

    Retorna:
    - IMC como número flotante

    # >>> AÑADE TUS DOCTESTS AQUÍ <
    >>> calcular_imc(70, 1.75)
    22.857142857142858

    >>> calcular_imc(50, 0.70)
    102.04081632653063

    >>> calcular_imc("75", 1.70)
    Traceback (most recent call last):
        ...
    TypeError: Peso y altura deben ser valores numéricos.

    >>> calcular_imc(75, 0)
    Traceback (most recent call last):
        ...
    ValueError: Peso y altura deben ser valores positivos.

    >>> calcular_imc(-75, 1.70)
    Traceback (most recent call last):
        ...
    ValueError: Peso y altura deben ser valores positivos.

    """
    if not isinstance(peso, (int, float)) or not isinstance(altura, (int, float)):
        raise TypeError("Peso y altura deben ser valores numéricos.")

    if peso <= 0 or altura <= 0:
        raise ValueError("Peso y altura deben ser valores positivos.")

    return peso / (altura ** 2)


if __name__ == "__main__":
    import doctest
    doctest.run_docstring_examples(calcular_imc, globals(), verbose=True)


Finding tests in NoName
Trying:
    calcular_imc(70, 1.75)
Expecting:
    22.857142857142858
ok
Trying:
    calcular_imc(50, 0.70)
Expecting:
    102.04081632653063
ok
Trying:
    calcular_imc("75", 1.70)
Expecting:
    Traceback (most recent call last):
        ...
    TypeError: Peso y altura deben ser valores numéricos.
ok
Trying:
    calcular_imc(75, 0)
Expecting:
    Traceback (most recent call last):
        ...
    ValueError: Peso y altura deben ser valores positivos.
ok
Trying:
    calcular_imc(-75, 1.70)
Expecting:
    Traceback (most recent call last):
        ...
    ValueError: Peso y altura deben ser valores positivos.
ok


---

### Ejercicio 3 **<font color="gold" size="+2">CI</font>**

Para este ejercicio debes:

1. Implementar una función llamada `calcular_distancia_hamming(seq1, seq2)` que calcule la distancia de Hamming entre dos secuencias.

2. **Comportamiento esperado:**
   * La distancia de Hamming es el número de posiciones en las que los símbolos correspondientes son diferentes.
   * Las secuencias deben tener la misma longitud. Si no la tienen, lanzar `ValueError` con mensaje "Las secuencias deben tener la misma longitud."
   * Las secuencias deben ser strings. Si no lo son, lanzar `TypeError`.
   * La comparación debe ser case-insensitive (no distinguir mayúsculas/minúsculas).

3. Escribir pruebas usando **`doctest`** para cubrir:
   * Dos secuencias idénticas (distancia 0).
   * Dos secuencias completamente diferentes.
   * Secuencias con diferencias parciales.
   * Error por longitudes diferentes.

4. Escribir pruebas usando **`unittest`** que incluyan:
   * Test con secuencias de DNA reales.
   * Test de case-insensitivity.
   * Verificación de mensajes de error exactos con `assertRaisesRegex`.
   * Test con secuencias vacías.

In [20]:
import unittest
import doctest

def calcular_distancia_hamming(seq1, seq2):
    """
    Calcula la distancia de Hamming entre dos secuencias.

    Hamming distance explained in scipy.distance documentation:
    https://github.com/scipy/scipy/blob/v1.17.0/scipy/spatial/distance.py#L720-L775

    # >>> AÑADE TUS DOCTESTS AQUÍ <
    >>> calcular_distancia_hamming("atgtg", "gccca")
    5

    >>> calcular_distancia_hamming("aACca", "CcCcT")
    3

    >>> calcular_distancia_hamming("agctg", "agctg")
    0

    >>> calcular_distancia_hamming("atgtg", "CcC")
    Traceback (most recent call last):
        ...
    ValueError: Las secuencias deben tener la misma longitud.

    >>> calcular_distancia_hamming(5, "CcCcT")
    Traceback (most recent call last):
        ...
    TypeError: Las secuencias deben ser del tipo cadena de texto.

    """
    pass  # Implementa la función
    if not isinstance(seq1, str) or not isinstance(seq2, str):
        raise TypeError("Las secuencias deben ser del tipo cadena de texto.")
    if len(seq1) != len(seq2):
        raise ValueError("Las secuencias deben tener la misma longitud.")

    hamm_distance = 0
    for a, b in zip(seq1, seq2):
        if a != b:
            hamm_distance += 1

    return hamm_distance


class TestDistanciaHamming(unittest.TestCase):

    def test_secuencias_identicas(self):
        pass  # Implementa
        test_seq1 = 'CcCcT'
        test_seq2 = 'CcCcT'
        self.assertEqual(test_seq1, test_seq2)

    def test_secuencias_totalmente_diferentes(self):
        pass  # Implementa
        test_seq1 = 'agctg'
        test_seq2 = 'CcCcT'
        self.assertNotEqual(test_seq1, test_seq2)

    def test_secuencias_dna(self):
        pass  # Implementa
        #test_dna = "CGTAcgta"
        #test_seq = 'AcCcT'
        #self.assertIn(test_seq, test_dna)

    def test_case_insensitive(self):
        pass  # Implementa
        test_seq = 'CcCcT'
        self.assertRegex(test_seq, r'[A-Za-z]')

    def test_error_longitudes_diferentes(self):
        pass  # Implementa
        test_seq1 = "CGTAcgta"
        test_seq2 = 'AcCcT'
        self.assertGreater(test_seq1, test_seq2)
        self.assertLess(test_seq2, test_seq1)
        with self.assertRaisesRegex(ValueError, "Las secuencias deben tener la misma longitud."):
            calcular_distancia_hamming(test_seq1, test_seq2)

    def test_error_tipo_incorrecto(self):
        pass  # Implementa
        test_seq1 = 5
        test_seq2 = None
        self.assertNotIsInstance(test_seq1, str)
        self.assertIsNone(test_seq2)
        with self.assertRaisesRegex(TypeError, "Las secuencias deben ser del tipo cadena de texto."):
            calcular_distancia_hamming("ABC", test_seq1)
        with self.assertRaisesRegex(TypeError, "Las secuencias deben ser del tipo cadena de texto."):
            calcular_distancia_hamming("ABC", test_seq2)

    def test_secuencias_vacias(self):
        pass  # Implementa
        test_seq1 = ""
        test_seq2 = ""
        self.assertEqual(test_seq1, "")
        self.assertIsNotNone(test_seq2)
        with self.assertRaisesRegex(ValueError, "Las secuencias deben tener la misma longitud."):
            calcular_distancia_hamming("ABC", test_seq2)
        with self.assertRaisesRegex(ValueError, "Las secuencias deben tener la misma longitud."):
            calcular_distancia_hamming("ABC", test_seq1)


if __name__ == '__main__':
    doctest.run_docstring_examples(calcular_distancia_hamming, globals(), verbose=True)
    suite = unittest.TestLoader().loadTestsFromTestCase(TestDistanciaHamming)
    unittest.TextTestRunner(verbosity=1).run(suite)


.......
----------------------------------------------------------------------
Ran 7 tests in 0.012s

OK


Finding tests in NoName
Trying:
    calcular_distancia_hamming("atgtg", "gccca")
Expecting:
    5
ok
Trying:
    calcular_distancia_hamming("aACca", "CcCcT")
Expecting:
    3
ok
Trying:
    calcular_distancia_hamming("agctg", "agctg")
Expecting:
    0
ok
Trying:
    calcular_distancia_hamming("atgtg", "CcC")
Expecting:
    Traceback (most recent call last):
        ...
    ValueError: Las secuencias deben tener la misma longitud.
ok
Trying:
    calcular_distancia_hamming(5, "CcCcT")
Expecting:
    Traceback (most recent call last):
        ...
    TypeError: Las secuencias deben ser del tipo cadena de texto.
ok


---

### Ejercicio 4 **<font color="blue" size="+2">EG</font>**

Los vectores bidimensionales son útiles en visualización de datos y análisis de componentes principales (PCA). Se presenta una estructura básica para una clase `Vector2D`.

Consulta la documentación de Python sobre métodos especiales numéricos: https://docs.python.org/3/reference/datamodel.html#emulating-numeric-types

**Tu tarea consiste en tres partes:**

1. Implementar la clase `Vector2D` con los métodos y propiedades que se indican en el enunciado.

2. **Describir con tus propias palabras** los casos de test que implementarías para la clase `Vector2D` y sus métodos (creación, suma, resta, producto escalar, magnitud). Considera casos normales, casos límite y errores.

3. **Implementar** los tests usando `unittest`.

In [42]:
import unittest
import sys
import math

class Vector2D:

    def __init__(self, x=0.0, y=0.0):
        """Crea un vector 2D con componentes x e y."""
        pass  # Implementa
        self.x = float(x)
        self.y = float(y)

    def __add__(self, other):
        """Suma de dos vectores."""
        pass  # Implementa
        if isinstance(other, Vector2D):
            return tuple(self.x + other.x, self.y + other.y)

    def __sub__(self, other):
        """Resta de dos vectores."""
        pass  # Implementa
        if isinstance(other, Vector2D):
            return tuple(self.x - other.x, self.y - other.y)

    def dot(self, other):
        """Producto escalar (dot product)."""
        pass  # Implementa
        if isinstance(other, Vector2D):
            return tuple(self.x * other.x, self.y * other.y)

    def magnitude(self):
        """Magnitud (norma) del vector."""
        pass  # Implementa
        return math.sqrt(sum( x*x for x in self ))

    def __eq__(self, other):
        """Compara igualdad de dos vectores."""
        pass  # Implementa
        if isinstance(other, Vector2D):
            return tuple(self.x * other.x, self.y * other.y)

    def __str__(self):
        """Representación como string."""
        pass  # Implementa
        return f"Vector2D({self.x}, {self.y})"


In [43]:
vector1 = Vector2D(1.0, 2.0)
vector2 = Vector2D(5.0, 6.0)

In [44]:
vector1.__add__(vector2)

TypeError: tuple expected at most 1 argument, got 2

In [25]:
vector1.__add__()

1.0

**Descripción de los tests a implementar:**


```
Colocar aquí la descripción de los tests
```


In [45]:


class TestVector2D(unittest.TestCase):

    def test_creation_default(self):
        pass  # Implementa
        v = Vector2D()
        self.assertEqual(v.x, 0.0)
        self.assertEqual(v.y, 0.0)
        self.assertIsInstance(v.x, float)
        self.assertIsInstance(v.y, float)

    def test_creation_with_values(self):
        pass  # Implementa
        v_one = Vector2D(7.2, -1.0)
        self.assertEqual(v_one.x, 3.5)
        self.assertEqual(v_one.y, -2.1)

        v_two = Vector2D(5, 7)
        self.assertEqual(v_two.x, 5.0)
        self.assertEqual(v_two.y, 7.0)

    def test_addition(self):
        pass  # Implementa
        v1 = Vector2D(3, 4)
        v2 = Vector2D(1, 2)
        result = v1 + v2

        self.assertIsInstance(result, Vector2D)
        self.assertEqual(result.x, 4.0)
        self.assertEqual(result.y, 6.0)

    def test_subtraction(self):
        pass  # Implementa
        v1 = Vector2D(5, 6)
        v2 = Vector2D(2, 3)
        result = v1 - v2

        self.assertIsInstance(result, Vector2D)
        self.assertEqual(result.x, 3.0)
        self.assertEqual(result.y, 3.0)

    def test_dot_product(self):
        pass  # Implementa
        v1 = Vector2D(1, 2)
        with self.assertRaises(TypeError):
            v1.dot([1, 2])

    def test_magnitude(self):
        pass  # Implementa
        v1 = Vector2D(3, 4)
        self.assertAlmostEqual(v1.magnitude(), 5.0)  # 3-4-5 triángulo

        # Vector unitario
        v2 = Vector2D(1, 0)
        self.assertAlmostEqual(v2.magnitude(), 1.0)

        # Vector con decimales
        v3 = Vector2D(2.5, 3.5)
        expected = math.sqrt(2.5**2 + 3.5**2)
        self.assertAlmostEqual(v3.magnitude(), expected)

    def test_magnitude_zero_vector(self):
        pass  # Implementa
        v = Vector2D(0, 0)
        self.assertEqual(v.magnitude(), 0.0)

        # Test con valores muy pequeños
        v2 = Vector2D(0.0001, -0.0001)
        self.assertGreater(v2.magnitude(), 0.0)

    def test_equality(self):
        pass  # Implementa
        v1 = Vector2D(1.5, 2.5)
        v2 = Vector2D(1.5, 2.5)
        v3 = Vector2D(1.5000001, 2.4999999)  # Casi igual
        v4 = Vector2D(1.6, 2.5)

        self.assertTrue(v1 == v2)
        self.assertTrue(v1 == v3)  # math.isclose permite pequeñas diferencias
        self.assertFalse(v1 == v4)
        self.assertFalse(v1 == "not a vector")

    def test_str_representation(self):
        pass  # Implementa


if __name__ == '__main__':
    suite = unittest.TestLoader().loadTestsFromTestCase(TestVector2D)
    unittest.TextTestRunner(verbosity=1, stream=sys.stderr).run(suite)


E.FFEEE.E
ERROR: test_addition (__main__.TestVector2D.test_addition)
----------------------------------------------------------------------
Traceback (most recent call last):
  File "/tmp/ipython-input-2590204168.py", line 25, in test_addition
    result = v1 + v2
             ~~~^~~~
  File "/tmp/ipython-input-3546140475.py", line 17, in __add__
    return tuple(self.x + other.x, self.y + other.y)
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
TypeError: tuple expected at most 1 argument, got 2

ERROR: test_equality (__main__.TestVector2D.test_equality)
----------------------------------------------------------------------
Traceback (most recent call last):
  File "/tmp/ipython-input-2590204168.py", line 77, in test_equality
    self.assertTrue(v1 == v2)
                    ^^^^^^^^
  File "/tmp/ipython-input-3546140475.py", line 40, in __eq__
    return tuple(self.x * other.x, self.y * other.y)
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
TypeError: tuple expected at mo

---

### Ejercicio 5 **<font color="blue" size="+2">EG</font>**

**Importante: este ejercicio puntúa el doble comparado con el resto de ejercicios.**

Define una nueva clase de nombre `Protein` que represente una proteína como cadena de aminoácidos.

Consulta la lista de aminoácidos estándar y sus propiedades en: https://www.imgt.org/IMGTeducation/Aide-memoire/_UK/aminoacids/abbreviation.html

Los aminoácidos se representan por código de una letra y solo pueden ser los 20 estándar:
`A, R, N, D, C, Q, E, G, H, I, L, K, M, F, P, S, T, W, Y, V`

Implementa:

1. **Constructor**: Valida que la secuencia contenga solo aminoácidos válidos. Almacena en mayúsculas.
2. **`molecular_weight()`**: Calcula el peso molecular aproximado usando 110 Da por aminoácido (valor promedio).
3. **`__add__`**: Concatena dos proteínas.
4. **`__len__`**: Devuelve la longitud de la proteína.
5. **`count_aa(aminoacid)`**: Cuenta las ocurrencias de un aminoácido específico.

Describe con tus propias palabras los casos de test que implementarías:

```
# Respuesta
```

Finalmente, implementa la clase y los tests:

In [87]:
protein1 = "YHSILICLIHHVGFM"
protein2 = "CRIATNTYSGHGKGC"

In [96]:
del protein_obj

In [97]:
protein_obj = Protein(protein1)
protein_obj

<__main__.Protein at 0x788f56470830>

In [98]:
protein_obj.aa_sequence

'YHSILICLIHHVGFM'

In [99]:
protein_obj.AVG_AA_WEIGHT

110

In [100]:
protein_obj.count_aa("l")

2

In [102]:
protein_obj.molecular_weight()

1650

In [129]:
from types import NoneType
import unittest
import sys

class Protein:

    VALID_AA = "ARNDCQEGHILKMFPSTWYV"
    """https://github.com/biopython/biopython/blob/master/Bio/SeqUtils/ProtParam.py"""

    AVG_AA_WEIGHT = 110 # it's a DA average value given

    def __init__(self, aa_sequence):
        # pass  # Implementa
        if aa_sequence is None or not isinstance(aa_sequence, str):
            raise TypeError("Invalid amino acid. It might an valid type.")

        aa_sequence_upper = aa_sequence.upper()
        for aa in aa_sequence_upper:
            if aa not in self.VALID_AA:
                raise ValueError("Invalid amino acid. Only standard amino acids are allowed.")

        self.aa_sequence = aa_sequence_upper

    def molecular_weight(self):
        pass  # Implementa
        mw = self.__len__() * self.AVG_AA_WEIGHT
        return mw

    def __add__(self, other):
        pass  # Implementa
        if not isinstance(other, Protein):
            raise TypeError("Can only concatenate with another Protein object")
        return Protein(self.aa_sequence + other.aa_sequence)

    def __len__(self):
        pass  # Implementa
        return len(self.aa_sequence)

    def count_aa(self, aminoacid):
        pass  # Implementa
        aminoacid_upper = aminoacid.upper()
        if aminoacid_upper not in self.VALID_AA:
            raise ValueError("Invalid amino acid. Only standard amino acids are allowed.")
        return self.aa_sequence.count(aminoacid_upper)


class TestProtein(unittest.TestCase):

    def test_creation_valid(self):
        pass  # Implementa
        protein = Protein("")
        self.assertEqual(protein.aa_sequence, "")

        protein = Protein("A")
        self.assertEqual(protein.aa_sequence, "A")

        protein = Protein("ARNDCQEGHILKMFPSTWYV")
        self.assertEqual(protein.aa_sequence, "ARNDCQEGHILKMFPSTWYV")

        protein = Protein("MKFLILLFNILCLFPVLAAD")
        self.assertEqual(protein.aa_sequence, "MKFLILLFNILCLFPVLAAD")

        protein = Protein("YHSIlIcLIhhVgFM")
        self.assertEqual(protein.aa_sequence, "YHSILICLIHHVGFM")

        protein = Protein("ARND")
        self.assertTrue(protein.aa_sequence.isupper(), True)

    def test_creation_invalid_aa(self):
        pass  # Implementa
        with self.assertRaisesRegex(TypeError, "Invalid amino acid. It might an valid type."):
            protein = Protein(None)

        with self.assertRaisesRegex(ValueError, "Invalid amino acid. Only standard amino acids are allowed."):
            protein = Protein("MixEdCaSe")

        with self.assertRaisesRegex(TypeError, "Invalid amino acid. It might an valid type."):
            protein = Protein(123456)

    def test_creation_lowercase(self):
        pass  # Implementa
        protein = Protein("arnd")
        self.assertEqual(protein.aa_sequence, "ARND")

        protein = Protein("aRNnd")
        self.assertEqual(protein.aa_sequence, "ARNND")

    def test_molecular_weight(self):
        pass  # Implementa
        protein = Protein("YHSILICLIHHVGFM")
        self.assertEqual(protein.molecular_weight(), 1650)

        protein = Protein("A")
        self.assertEqual(protein.molecular_weight(), 110)

        protein = Protein("ArNd")
        self.assertEqual(protein.molecular_weight(), 440)

        protein = Protein("")
        self.assertEqual(protein.molecular_weight(), 0)

    def test_concatenation(self):
        pass  # Implementa
        protein1 = Protein("ARND")
        protein2 = Protein("CQEG")
        protein3 = protein1.__add__(protein2)

        self.assertEqual(protein3.aa_sequence, "ARNDCQEG")
        self.assertIsInstance(protein2, Protein)

        with self.assertRaisesRegex(TypeError, "Can only concatenate with another Protein object"):
            protein1.__add__("ABCD")

    def test_length(self):
        pass  # Implementa
        protein = Protein("")
        self.assertEqual(len(protein), 0)

        protein = Protein("A")
        self.assertEqual(len(protein), 1)

        protein = Protein("aRNnd")
        self.assertEqual(len(protein), 5)

    def test_count_aa(self):
        pass  # Implementa
        protein = Protein("ARNdaARND")
        self.assertEqual(protein.count_aa("A"), 3)
        self.assertEqual(protein.count_aa("R"), 2)
        self.assertEqual(protein.count_aa("a"), 3)

    def test_count_aa_not_present(self):
        pass  # Implementa
        protein = Protein("ARND")
        self.assertEqual(protein.count_aa("C"), 0)
        self.assertEqual(protein.count_aa("W"), 0)

        protein_empty = Protein("")
        self.assertEqual(protein_empty.count_aa("A"), 0)

        with self.assertRaisesRegex(ValueError, "Invalid amino acid. Only standard amino acids are allowed."):
            protein.count_aa("Z")

if __name__ == '__main__':
    suite = unittest.TestLoader().loadTestsFromTestCase(TestProtein)
    unittest.TextTestRunner(verbosity=1, stream=sys.stderr).run(suite)


........
----------------------------------------------------------------------
Ran 8 tests in 0.011s

OK
