# Virus: Infection

![](virus.jpg)

Voor o.a. de farmaceutische industrie is het belangrijk om de succeskans van een geneesmiddel te bepalen.
Dit is lastig analytisch te doen, maar we kunnen het wel modelleren.
In deze opdracht ga je virusdeeltjes simuleren, welke kunnen reproduceren en sterven.
We bouwen deze opdracht stap voor stap op, tot een gehele simulatie.

Onder elke tussenstap vind je een code blok met een functie die jij gaat implementeren. Onder deze functie staat een stukje test code. Dat is code die de functie aanroept om even snel te checken of deze wel klopt. Deze tests zijn niet compleet, er kunnen nog bugs in de functie zitten ook al slagen de tests. Vertrouw er dus niet te veel op! Het is de bedoeling dat je deze tests aanvult als je dat nodig / handig lijkt.



### Tussenstap 1: Virusgenoom

Als model voor een virusgenoom gaan we gebruik maken van een DNA string welke bestaat uit de vier nucleotiden ATGC.
A (Adenine) is altijd verbonden met T (Thymine), G (Guanine) is altijd verbonden met C (Cytosine).
Voor de representatie doen we het volgende, een serie van nucleotides in een string.
Aangezien er maar 4 mogelijkheden zijn voor baseparen (AT, GC, TA, CG), kunnen we dit encoderen met de 4 letters.
Zie bijvoorbeeld de volgende string:

	AGTC

Dit is een DNA string met alle vier base paren, eerst het paar AT, dan GC, dan TA, en als laatste CG.
Effectief laten we telkens het aanhangende nucleotide weg, dat maakt de representatie wat simpeler!

* Schrijf een functie `generateVirus(length)`.
	* Deze functie accepteert één argument, `length`, dat is een integer die de lengte van het virusgenoom representeerd.
	* De functie moet een string returnen bestaande uit een willekeurige sequentie van nucleotides.
* Oh, one more thing: Je mag maar **twee regels code** gebruiken voor deze functie (dat is inclusief de regel `def generateVirus(length):`).

### Tips

* Kijk eens naar de `random.choice()` functie.
* Gebruik een list comprehension en de `"".join()` methode van een string.

In [1]:
import random

def generateVirus(length):
    return ''.join([random.choice(['A', 'G', 'T', 'C']) for letter in range(length)])


### Tussenstap 2: Muteren

Zodra een virus wordt geboren heeft deze een kans te muteren.
Muteren is het veranderen van één willekeurig nucleotide voor een willekeurige ander.
Bijvoorbeeld van AGTC naar ATTC.

* Schrijf een functie `mutate(virus)`.
	* Deze functie accepteert één argument, `virus`, dat is een string van nucleotides.
	* De functie moet een string returnen bestaande uit dezelfde nucleotides, waarvan er één is gemuteerd.
* Geen regellimiet dit keer, maar als je jezelf wilt uitdagen: 3 (of minder) regels is mogelijk.

### Tips

* Kijk eens naar de `random.randrange()` functie!
* Gebruik list slicing.

In [2]:
def mutate(virus):
    index = random.randrange(len(virus))
    return virus[:index] + random.choice([letter for letter in ['A', 'T', 'G', 'C'] if letter != virus[index]]) + virus[index + 1:]


### Tussenstap 3: Afsterven

Virussen sterven uiteindelijk ook, dit gebeurt met een bepaalde kans per tijdstap in de simulatie.

* Schrijf een functie `kill(viruses, mortalityProb)`.
	* Deze functie accepteert twee argumenten:
		* `viruses` is een lijst van virusgenomen.
		* `mortalityProb` is een float tussen 0 en 1 (inclusief) die de kans op het afsterven per virusdeeltje representeert.
	* De functie moet een **nieuwe** lijst returnen met daarin de virusgenomen die het hebben overleefd.
* Let op, elk virusgenoom heeft een individuele kans om af te sterven. Dus bij een `mortalityProb` van 0.2 overleeft gemiddeld 80% van de viruspopulatie het, maar dit kan fluctueren!
* Je mag hier **twee regels code** gebruiken (dat is inclusief de regel `def kill(viruses, mortalityProb):`).

### Tip

* Gebruik een list comprehension!


In [3]:
def kill(viruses, mortalityProb):
    return [virus for virus in viruses if random.random() > mortalityProb]


### Tussenstap 4: Reproductie

Een virus heeft een kans zich voort te planten op elke tijdstap in de simulatie.
Als een virus zich voortplant dan heeft het kind exact dezelfde DNA string als de ouder.
Behalve als het kind muteert, dan is er één basepaar anders.

* Schrijf voor reproductie een functie `reproduce(viruses, mutationProb, reproductionProb)`.
	* Deze functie accepteert drie argumenten:
		* `viruses` is een lijst van virusgenomen.
		* `mutationProb` is een float tussen 0 en 1 (inclusief) die de kans op mutatie bij het kind virusdeeltje representeert.
		* `reproductionProb` is een float tussen 0 en 1 (inclusief) die de kans op reproductie per virusdeeltje representeert.
* De functìe moet de lijst van de totale populatie van virusgenomen returnen. Dat is dus inclusief de ouders!
* Let op, elk virusgenoom heeft een individuele kans om te reproduceren. Dus bij een `reproductionProb` van 0.2 reproduceert gemiddeld 20% van de populatie, maar dit kan fluctueren!
* Geen regellimiet dit keer, maar als je jezelf wilt uitdagen: 2 regels is mogelijk.


In [4]:
import itertools
def reproduce(viruses, mutationProb, reproductionProb):
    return list(itertools.chain.from_iterable([([virus, mutate(virus)] if random.random() < mutationProb else [virus,virus]) if random.random() < reproductionProb else [virus] for virus in viruses]))



### Reproductiekans als functie van populatie grootte

Naarmate er meer virusdeeltjes aanwezig zijn, wordt de kans op reproductie kleiner.
Er is simpelweg niet genoeg ruimte voor alle virusdeeltjes.
Er is een negatief linear verband tussen het aantal virussen en de reproductie kans.
De kans op reproductie is gelijk aan `(1 - (grootte_van_virus_populatie / maximaal_aantal_virussen)) * maximale_reproductie_kans`.
De functie om de kans per individueel virusdeeltje in een populatie te berekenen vind je hieronder:


In [5]:
def reproductionProbability(viruses, maxReproductionProb, maxPopulation):
    return (1 - (len(viruses) / maxPopulation)) * maxReproductionProb 

### Tussenstap 5: Simuleren

Nu we een representatie hebben voor virussen, deze kunnen laten muteren, doen sterven, en laten reproduceren, kunnen we gaan simuleren.
Laat per tijdstap eerst virussen afsterven, daarna bereken je pas de reproductie kans en laat je ze reproduceren.

* Schrijf een functie `simulate(viruses, mortalityProb, mutationProb, maxReproductionProb, maxPopulation, timesteps = 500)`.
	* Deze functie accepteert vijf argumenten, en één optioneel argument:
		* `viruses` is een lijst van virusgenomen.
		* `mortalityProb` is een float tussen 0 en 1 (inclusief) die de kans op het afsterven per virusdeeltje representeert.
		* `mutationProb` is een float tussen 0 en 1 (inclusief) die de kans op mutatie bij reproductie representeert.
		* `maxReproductionProb` is een float tussen 0 en 1 (inclusief) die de maximale kans op reproductie per virusdeeltje representeert.
		* `maxPopulation` is een integer voor de maximale populatiegrootte.
		* `timesteps` is een integer en een optioneel argument die het aantal tijdstappen in de simulatie aangeeft.

	* De functie moet een lijst returnen met daarin de populatiegrootte (een integer) op elke tijdstap.

### Tips

* Test deze functie zorgvuldig! Maak eventueel een plot van de uitkomst, gebeurt er wat je verwacht?
* Let op, als `timesteps = 500`, dan moet `simulate()` een lijst van `501` lang returnen!

In [6]:
def simulate(viruses, mortalityProb, mutationProb, maxReproductionProb, maxPopulation, timesteps = 500):
    # Virus length list
    population = [len(viruses)]
    for step in range(timesteps):
        # Run functions on virus and append length
        viruses = kill(viruses, mortalityProb)
        viruses = reproduce(viruses, mutationProb, reproductionProbability(viruses, maxReproductionProb, maxPopulation))
        population.append(len(viruses))
    return population


# Virus: Geneesmiddel

![](medicine.png)

In dit deel van de module gaan we een geneesmiddel introduceren dat de virussen bestrijdt.
Maar virussen kunnen resistent zijn, en hun kinderen kunnen het worden.
Een resistent virus is een virus dat `AAA` in zijn DNA string heeft.
Zodra het geneesmiddel wordt geintroduceerd, kunnen alle virussen behalve resistente virussen niet meer reproduceren.

### Tussenstap 6: Resistentie
Allereerst gaan we kijken of een virusgenoom resistent is.

* Schrijf een functie `isResistent(virus)`.
	* Deze functie accepteert één argument, `virus`, dit is een virusgenoom.
	* De functie moet een boolean returnen welke aangeeft of het virus resistent is (`True`) of niet (`False`).
* Een virus is enkel resistent als `AAA` achterelkaar voorkomt.

### Tip

* Kijk eens naar de functie `string.find()`!

In [7]:
import string

def isResistent(virus):
    return True if 'AAA' in virus else False


### Tussenstap 7: Simuleren met een geneesmiddel
Nu kunnen we het effect gaan bestuderen van de introductie van een geneesmiddel.
We dienen het geneesmiddel toe zodra de diagnose is gesteld, bij de 100ste tijdstap.
Laat per tijdstap eerst virussen afsterven, daarna bereken je pas de reproductie kans en laat je ze reproduceren.

* Schrijf een functie genaamd `simulate_medicine(viruses, mortalityProb, mutationProb, maxReproductionProb, maxPopulation, timesteps = 500)`.
	* Deze functie accepteert vijf argumenten, en één optioneel argument:
		* `viruses` is een lijst van virusgenomen.
		* `mortalityProb` is een float tussen 0 en 1 (inclusief) die de kans op het afsterven per virusdeeltje representeert.
		* `reproductionProb` is een float tussen 0 en 1 (inclusief) die de kans op reproductie per virusdeeltje representeert.
		* `maxPopulation` is een integer voor de maximale populatiegrootte.
		* `mutationProb` is een float tussen 0 en 1 (inclusief) die de kans op mutatie bij reproductie representeert.
		* `timesteps` is een integer en een optioneel argument die het aantal tijdstappen in de simulatie aangeeft.
	* De functie moet een lijst returnen met daarin de populatiegrootte (een integer) op elke tijdstap.
* In tegenstelling tot `simulate()` mag een virus enkel reproduceren als het resistent is na de 100ste tijdstap.

### Tips
* Test deze functie goed!
* Maak eventueel een plot, gebeurt er wat je verwacht?

In [12]:
def simulateMedicine(viruses, mortalityProb, mutationProb, maxReproductionProb, maxPopulation, timesteps = 500):
    population = [len(viruses)]
    
    # Check which viruses are immune
    immune = [virus for virus in viruses if isResistent(virus)]
    non_immune = [virus for virus in viruses if not isResistent(virus)]
    
    # Simulate steps
    for step in range(timesteps):
        immune = kill(immune, mortalityProb)
        non_immune = kill(non_immune, mortalityProb)
            
        # only reproduce after 100th step if immune
        reproductionProb = reproductionProbability(viruses, maxReproductionProb, maxPopulation)
        if step <= 100:
            immune = reproduce(immune, mutationProb, reproductionProb)
            non_immune = reproduce(non_immune, mutationProb, reproductionProb)
        else:
            immune = reproduce(immune, mutationProb, reproductionProb)
            
        # Add together length of immune and non immune viruses  
        viruses = immune + non_immune
        population.append(len(viruses))
    return population

### Tussenstap 8: Genezing?
Met de volgende parameters:

* tijdstappen = 500
* genoomlengte = 16
* start virus populatie grootte = 10
* maximale virus populatie grootte = 1000
* maximale reproductie kans = 7%
* sterfte kans = 5%
* mutatie kans = 10%

Hoeveel van percent van de patienten is volledig genezen? Een patient is volledig genezen als er geen virusdeeltjes aanwezig zijn in de laatste tijdstap.

* Schrijf hiervoor een functie `experiment(numberOfPatients)`.
	* Deze functie accepteert één argument, `numberOfPatients`, dit is het aantal patienten in het experiment.
	* De functie moet een integer returnen dat het aantal compleet genezen patienten teruggeeft.



In [15]:
def experiment(numberOfPatients):
    cured = 0
    for i in range(numberOfPatients):
        viruses = [generateVirus(16) for _ in range(10)]
        if simulateMedicine(viruses, 0.05, 0.1, 0.07, 1000, timesteps = 500)[-1] == 0:
            cured += 1
    return cured