# PMDS - zad.dom lab. 2
## Wszechobecni terroryści – rozwiązanie poprzez symulację


#### Import używanych funkcji i implementacja funkcji pomocniczych

In [1]:
from random import randint
from random import random
from itertools import combinations
from math import factorial
from math import ceil
from math import sqrt
from collections import Counter


'''Binomial coefficient'''
def binom(n,k):
    if n == k:
        return 1
    elif k == 1:
        return n
    elif k > n:  
        return 0
    else:            
        return factorial(n) // (factorial(k) * factorial(n-k))    

### Podejście symulacyjne
#### Parametry symulacji

In [2]:
'''Number of people'''
n  = 10000
'''Probability of staying over the night in a hotel'''
p  = 0.1
'''Number of hotels'''
nh = 100
'''Number of days'''
nd = 100
'''Number of simulation repetitons'''
repeat = 50

#### Implementacja funkcji symulującej

In [3]:
'''
Make a simulation

:param n:  number of people
:param p:  probability of staying over the night in a hotel
:param nh: number of hotels
:param nd: number of days
:returns: dictionary of couples and the times they met
'''
def simulate(n, p, nh, nd):
    couples = {}
    for day in range(nd):
        #create new clean hotel clients list
        hotel_clients={}
        for person in range(n):
            #if the person goes to a hotel
            if random()<p:
                #person goes to hotel clients list
                hotel_id = randint(0, nh)
                if hotel_id not in hotel_clients:
                    hotel_clients[hotel_id] = [person]
                else: 
                    hotel_clients[hotel_id].append(person)
                    
        #daily couples dictionary update
        for clients in hotel_clients.items():
            #for every couple from the hotel
            for couple in combinations(clients[1],2):
                if couple not in couples:
                    couples[couple] = 1
                else: 
                    couples[couple] += 1
    return couples 


#### Funkcje do obliczania wyników z symulacji

In [4]:
'''
Counts the number of suspected couples
based on simulation results

:param hist: dictionary containing histogram data
:returns: the number of suspected couples
'''
def count_couples(hist):
    return sum(nr for met, nr in hist.items() if met >= 2)

'''
Counts the number of suspected couples and days
based on simulation results

:param hist: dictionary containing histogram data
:returns: the number of suspected couples and days
'''
def count_couples_days(hist):
    return int(sum(nr * binom(met,2) for met, nr in hist.items() if met >= 2))


'''
Counts the number of suspected people
based on simulation results

:param couples: dictionary of couples and the times they met
:returns: the number of suspected people
'''
def count_suspected_ppl(couples):
    suspected = set()
    for couple, met in couples.items():
        if met >= 2:
            suspected.update(couple)
    return len(suspected)
        

#### Powtórzenie symulacji i obliczenie wartości wynikowych


In [5]:
histogram = {}
suspected_couples = 0
suspected_couples_days= 0
suspected_ppl = 0
for r in range(repeat):
    couples = simulate(n, p, nh, nd)
    hist = dict(Counter(couples.values()))
    histogram = dict(Counter(histogram) + Counter(hist))
    suspected_couples += count_couples(hist)
    suspected_couples_days += count_couples_days(hist)
    suspected_ppl += count_suspected_ppl(couples)
histogram = {k: v/repeat for k, v in histogram.items()}
suspected_couples /= repeat
suspected_couples_days /= repeat
suspected_ppl /= repeat

### Podejście analityczne
Wzór na liczbę podejrzanych par "osób i dni"
$${{n}\choose{2}} \cdot {{n_d}\choose{2}} \cdot \Big (p^2 \cdot \frac{1}{n_h} \Big )^2 $$

Wzór na liczbę podejrzanych par osób
$${{n}\choose{2}} \cdot {{n_d}\choose{2}} \cdot \Big (p^2 \cdot \frac{1}{n_h} \Big )^2 $$

#### Funkcje do obliczania wyników podejścia analitycznego

In [11]:
'''
Counts the number of suspected couples and days
based on alaytical approach

:param n:  number of people
:param p:  probability of staying over the night in a hotel
:param nh: number of hotels
:param nd: number of days
:returns: the number of suspected couples and days
'''
def count_couples_days_anal(n, p, nh, nd):
    return binom(n,2) * binom(nd,2) * (p**2/nh)**2


suspected_couples_days_anal = count_couples_days_anal(n, p, nh, nd)

## Odpowiedzi
### 1. Liczba podejrzanych par “osób i dni” oraz liczba podejrzanych par osób.


In [12]:
print("Obliczone symulacyjnie:")
print("Liczba podejrzanych par osób: ", suspected_couples )
print("Liczba podejrzanych par osób i dni: ", suspected_couples_days )

print("\nObliczone analitycznie:")
print("Liczba podejrzanych par osób i dni: ", suspected_couples_days_anal )


Obliczone symulacyjnie:
Liczba podejrzanych par osób:  2414.54
Liczba podejrzanych par osób i dni:  2429.6

Obliczone analitycznie:
Liczba podejrzanych par osób i dni:  2474.752500000001


#### Jak bardzo różnią się te wartości od siebie? Czy przybliżone obliczenia korzystające ze wzoru analitycznego są poprawne?
Liczba podejrzanych par osób jest zawsze mniejsza od liczba podejrzanych par osób i dni. Wartość liczby podejrzanych par osób i dni uwzględnia również kombinacje dni spotkań osób, które widziały się więcej niż dwa razy, stąd ta wartość jest większa. Wielkości te niewiele się od siebie różnią, ponieważ par osób, które spotkały się ze sobą więcej niż 2 razy jest niewiele, zatem samych kombinacji par dni też nie jest dużo.

Przybliżone obliczenia korzystające ze wzoru analitycznego są poprawne.

### 2. Histogram ilustrujący liczbę par osób do liczby dni, w których się spotkały

In [8]:
print(histogram)

{1: 489791.56, 2: 2407.04, 3: 7.48, 4: 0.02}


#### Jak dużo jest par osób, które spotkały się w więcej niż w 2 dni? Dlaczego tak jest?

Liczba par osób, które spotkały się w więcej niż 3 dni jest bardzo mała. Dzieje się tak dlatego, że prawdopodopieństwo spotkania się 2 osób w tych samych hotelach w trzy różne dni w przeciągu 100 dni jest bardzo małe.


### 3. Liczba podejrzanych osób. 

In [9]:
print("Liczba podejrzanych osób: ", suspected_ppl )

Liczba podejrzanych osób:  3582.36



#### Jaka jest minimalna i maksymalna liczba podejrzanych osób, znając liczbę podejrzanych par osób?
$ n_c $ - liczba podejrzanych par 

$ m_{min} $ - minimalna liczba podejrzanych osób

$ m_{max} $ - maksymalna liczba podejrzanych osób

Maksymalna liczba podejrzanych osób -  w każdej parze są różne osoby:
 $$ m_{max} = 2 \cdot n_c $$
 
Maksymalna liczba podejrzanych osób - zbiór osób, z których tworzone są pary jest jak najmniejszy:
 $$ m_{min} = min~~x: {{x}\choose{2}}  \geq n_c $$
 $$ {{x}\choose{2}} = \frac{x!}{2! \cdot (x-2)!} = \frac{x \cdot (x-1)}{2}$$
 $$ m_{min} = min~~x: x^2 - x - 2n_c \geq 0$$
 $$ m_{min} =\Bigg \lceil \frac{1+\sqrt{8n_c+1}}{2} \Bigg \rceil $$

In [10]:
m_max = 2 * suspected_couples
m_min = ceil((1+sqrt(8 * suspected_couples + 1))/2)
print("Maksymalna liczba podejrzanych osób: ", m_max)
print("Minimalna liczba podejrzanych osób: ", m_min)

Maksymalna liczba podejrzanych osób:  4829.08
Minimalna liczba podejrzanych osób:  70
