# Construisons nos bitcoins avec une BlockChain et quelques lignes de code Python

L'objectif de cet atelier est de comprendre un principe de la blockchain.
Comme nous allons la construire complètement, nous appelerons notre monnaie "AcademyCoin".

<div class="alert alert-block alert-success">
Crédits : Arnaud Bodin / Exo7 : Python au Lycée ©CC-BY-NC-SA
</div>


## 1. Qu'est-ce qu'une preuve de travail ? (proof of work)

<span style="color:blue"><em> Certains problèmes sont "difficiles" à résoudre et sont "faciles" à vérifier, nous allons voir un exemple d'un tel problème et nous allons voir aussi et surtout que l'on peut en régler la difficulté.</em></span>

Etant donné un nombre entier $y$ et un nombre premier $p$, on cherche $x$ tel que $x^2 = y \text{ ( mod p )}$. (c'est à dire le reste de la division de $x^2$ par $p$ vaut $y$, note : $y < p$). 


Exemple : pour $p = 13$ et $y = 10$ alors $x = 6$ est une solution : 

$x^2 = 6 \times 6 = 36$

$36 = 26 + 10$

$26 + 10 = 13 \times 2 + 10 = 2 \times p + y$ 


<span style="color:red"><em>Est-ce que 7 est également une solution ? </em></span>

Il existe aussi des cas qui n'ont pas de solution ($p=13$ et $y=5$)

Essayez avec cet exemple : trouver $x$ pour $p=13$ et $y=9$

In [9]:
y,p = 9,13

x = 4
while x*x % p != y : 
    x = x + 1
print(x-1)


x = 1 
while x < 5:
    x = x + 1 
print(x)

9
5


#### Passons au coding : 

- écrivez une fonction `verify()` qui prend 3 paramètres $x,y,p$ , et qui renvoie `True` si $x^2 = y \text{ ( mod p )}$, et renvoie `False` sinon.

On rappelle que : 

- en Python `%` donne le reste de la division Euclidienne
- par exemple : 

$29$ `%` $2 = 1$

$146$ `%` $2 = 0$

$14$  `%` $4 = 2$

In [1]:
def verify(x,y,p): 
    if x**2 % p == y: 
        return True
    else: 
        return False

# exemples pour vérifier si votre code fonctionne, 
# ces exemples renvoient True : 
print(verify(6 ,10,13))
print(verify(6543210,8371779,15486869))

True
True


- écrivez une fonction `search()` qui prend 2 paramètres ($y$ et $p$) qui trouve $x$ tel que $x^2 = y \text{ ( mod p )}$ : 

In [11]:
# pour ce problème il faut passer en revue toutes les valeurs de x 
# jusqu'à en trouver une qui résoud l'équation : c'est ce que l'on 
# appelle un problème "difficile" : ce n'est pas difficile d'écrire 
# le programme may l'ordinateur peut prendre beaucoup de temps 

def search(y,p):
    # start with x = 1, and increase "forever" untill we find a 
    # solution and we exit the function 
    x = 1
    while x**2 % p != y: 
        x = x + 1
    return x

# example for checking if your function works: 
print(search(8371779,15486869))


6543210


Ces valeurs de $p$ peuvent être utilisées : $101$ (facile), $15486869$ (moyen) , $2276856017$ (difficile)

- trouver $x$ pour $p=101$ et $y=17$

- trouver $x$ pour $p=15486869$ et $y=8371779$

- trouver $x$ pour $p=15486869$ et $y=13017204$

Cela vous donne une idée de la manière dont le temps de calcul croît.

In [4]:
# pour chronométrer le temps d'exécution, c'est facile : 

import time

start_time = time.time()
##
## placer ici le code que vous voulez chronométrer
##
end_time = time.time()

elapsed_time = end_time - start_time

print(elapsed_time)

6.771087646484375e-05


et par exemple : 

In [5]:
import time

start_time = time.time()

print(search(8371779,15486869))

end_time = time.time()

elapsed_time = end_time - start_time

print(elapsed_time)

6543210
3.1490461826324463


Avec de grandes valeur de $p$ le temps pour trouver la solution augmente beaucoup, mais la vérification est toujours très rapide. 

<div class="alert alert-block alert-success">
Nous avons donc trouvé un problème difficile à résoudre, mais facile à vérifier.
</div>
    
Nous avons aussi une possibilité d'ajuster le niveau de difficulté : 

- Au lieu de chercher une solution exacte $x$ pour l'équation, on peut trouver une valeur de $x$ qui satisfait **approximativement** l'équation. C'est à dire au lieu de résoudre $x^2 = y \text{ (mod p )})$ on cherche $x^2 = y \pm m\text{ (mod p )}$ , et le fait d'augmenter $m$ (la marge d'erreur en quelque sorte) va diminuer la "difficulté". 


Ecrire une fonction `approx_search()` prenant 3 paramètres ($y$, $p$ and $m$) qui trouve un $x$ tel que $x^2 = y \pm m $ (mod p) : 

Indication : 
- $x^2 = y \text{ (mod p )}$ est la même chose que : $x^2 - y = 0\text{ (mod p )} $
- en Python la fonction `abs()` renvoie la valeur absolue d'un nombre

In [6]:
def approx_search(y,p,m):
    x = 1
    while abs((x**2 % p) - y) > m: 
        x = x + 1
    return x

# example for checking if your function works: 

print(approx_search(8371779,15486869,20))

413988


Vous avez droit à une pause d'une minute, grâce à la lenteur de votre processeur :-) puis augmentez la valeur de $m$ (plus grande que 100) pour obtenir un résultat plus rapidement : 

In [7]:
import time

start_time = time.time()

print(approx_search(8371779,32416187567,100))

end_time = time.time()

elapsed_time = end_time - start_time

print(elapsed_time)

126607073
69.02296805381775


## 2. Créons quelques outils pour notre démo BitCoin (AcademyCoin)

### 2.a. Listes Python

#### 2.a.1. Addition de listes
Créer une fonction qui ajoute deux listes d'entiers (les listes doivent avoir la même longueur) élement par élement, et l'addition se fait modulo 100, c'est à dire que si la somme est plus grande que 100, on retranche 100 au résultat) 

Exemple : $[12,34,56,78] + [11,22,33,44] = [23,56,89,22]$


In [12]:
def add_lists(l1,l2):
    l = []
    if len(l1) == len(l2): 
        for i in range(len(l1)):
            l.append((l1[i]+l2[i]) % 100)
        return l
    else: 
        raise Exception('Error : lists should have same size to be added') 

    
l = add_lists([1,2,3,4,5,6],[1,1,1,98,98,98])
print(l)

[2, 3, 4, 2, 3, 4]


#### 2.a.2 Comparaison de listes
Créer une fonction qui compare 2 listes dans l'ordre lexicograhique `list_comp()`, cette fonction accepte deux paramètres ( $l1$ et $l2$ de type `list`et renvoie  `True` if  $l1 < l2$. 

Exemples : 

$[23,99,56,61] < [89,45,34,12]$, la fonction retourne `True`

$[11,23,99,56,61] > [11,23,45,34,12]$, la fonction retourne `False`

$[0,0,0,1] < [0,0,1,0]$, la fonction retourne `True`


In [447]:
def list_comp(l1,l2):
    length = min(len(l1),len(l2))
    res = True
    for i in range(length): 
        if l1[i] > l2[i]: 
            res = False
    return res
    
print(list_comp([0,0,5],[0,0,1,2,3,4]))

False


2.a.3 string vers liste
Créer une fonction qui transforme une string (liste de caractères) en une liste de nombres (entier, de 0 à 99) et qui ajoute des 0 à gauche (padding) de manière à ce que la taille de la liste obtenue soit un multiple de 6

Exemples: 
- l'entrée "yes" donne $[0,0,0,21,1,15]$
- l'entrée "python" donne $[12, 21, 16, 4, 11, 10]$
- l'entrée "I love Python" donne $[0, 0, 0, 0, 0, 73, 32, 8, 11, 18, 1, 32, 80, 21, 16, 4, 11, 10]$

Indication : en Python, transformer un caractère en une valeur numérique est facile :

`print(ord('A'))` donne $65$, `print(ord('z'))` donne $122$ 

Quel est le résultat pour `ord(Z)` et `ord(a)` ? quels sont les caractères entre Z et a ? (`chr(n)` renvoie le caractère dont la valeur numérique est $n$)

In [27]:
def str_to_list_6(s):
    l = []
    if len(s) % 6 != 0:
        for i in range( 6 - (len(s) % 6)):
            l.append(0)
    for c in s:
        l.append(ord(c) % 100)
    return(l)

print(str_to_list_6('try'))    

[0, 0, 0, 16, 14, 21]


### 2.b. Outils de hashage

#### 2.b.1 
Partant d'un message de longueur quelconque, nous allons créer un "hash" de longueur fixe. Il est très difficile de trouver deux messages différents ayant le même hash, et calculer un hash est facile mais l'opération inverse (à partir d'un hash trouver le texte) est pratiquement impossible. 

Nous allons créer un système de hashage qui produit une liste de 6 entiers à partir d'une liste de $6*N$ entiers compris entre 0 et 99. 

On commence avec le premier bloc de 6 entiers. 

La méthode consiste à mélanger puis combiner à chauqe fois avec le bloc suivant, jusqu'à la fin de la liste, selon les règles suivantes :

Mélange : 

- on commence avec $[b_0,b_1,b_2,b_3,b_4,b_5]$, on calcule  $[b'_0,b'_1,b'_2,b'_3,b'_4,b'_5] = [b_0,b_1 + b_0,b_2,b_3 + b_2,b_4,b_5 + b_4]$
- on "multiplie" (terme à terme), par  $[7,11,13,17,19,23]$: now : $[b''_0,b''_1,b''_2,b''_3,b''_4,b''_5] = [7 \times b'_0 + 1, 11 \times b'_1 + 1, 13 \times b'_2 + 1 , 17 \times b'_3 + 1 , 19 \times b'_4 + 1 , 23 \times b'_5 + 1] $
- on fait une permutation (le dernier élément vient en premier, et chacun des autres augmente son rang d'une unité) : $[b'''_0,b'''_1,b'''_2,b'''_3,b'''_4,b'''_5] = [b''_5,b''_0,b''_1,b''_2,b''_3,b''_4]$
- on réduit modulo 100
- on répète ceci 10 fois

Combiner : on ajoute (modulo 100) au résultat que l'on vient d'obtenir, le prochain bloc de 6. 

On mélange alors à nouveau le bloc ainsi obtenu, et ainsi de suite jsuq'à la fin de la liste de $6*N$.

Avec ce système l'entrée $[0,1,2,3,4,5]$ donne : $[98, 95, 86, 55, 66, 75]$

Commencer par faire la fonction de hash sur 6 caractères : 

In [449]:
# with the rule defined above, create a function that shuffles 
# a list of 6 integers :  

def shuffle_one_time(l): 
    l =  [l[0], l[1]+ l[0], l[2], l[3] + l[2], l[4], l[5] + l[4] ]
    l = [7 * l[0] + 1, 11 * l[1] + 1, 13 * l[2] + 1,17 * l[3] + 1,19 * l[4] + 1, 23 * l[5] + 1]
    l =  [l[5] % 100, l[0] % 100, l[1] % 100, l[2] % 100 , l[3] % 100, l[4] % 100]
    return l


# then create a function that call the previous one 10 times

def shuffle_10_times(l): 
    for i in range(10):
        l = shuffle_one_time(l)
    return(l)
    
# try with these, and see that a small difference in input can 
# result in a big difference of output
print(shuffle_10_times([0,1,2,3,4,5]))
print(shuffle_10_times([1,1,2,3,4,5]))

[98, 95, 86, 55, 66, 75]
[18, 74, 4, 42, 77, 42]


#### 2.b.2
Créer une fonction qui à partir d'une liste de taille $6*N$ crée une liste de listes de taille 6 (`slice_by_6()`)

In [450]:
#new
def slice_by_6(l): 
    l6 = []
    for i in range(int(len(l)/6)): 
        l6.append(l[6*i:6*(i+1)])
    return l6
     

[77, 91, 5, 91, 89, 99]


#### 2.b.3
Maintenant, créer la fonction de hashage en utilisant les fonctions créées ci-dessus : 

In [450]:
     
def hash_this_list(l):
    list_sliced = slice_by_6(l)
    list_hashed = []
    #print(list_sliced, len(list_sliced))
    
    hashed = list_sliced[0]
    hashed = shuffle_10_times(hashed)
    
    for i in range(int(len(l)/6) -1):
        list_sliced.pop(0)
        hashed = add_lists(hashed,list_sliced[0])
        hashed = shuffle_10_times(hashed)  
    return(hashed)

    
print(hash_this_list([0,1,2,3,4,5,1,1,1,1,1,1,10,10,10,10,10,10]))

[77, 91, 5, 91, 89, 99]


### 2.c. Minage

Maintenant, utilisons ces outils pour construire un problème de difficulté réglable que nous pouvons utiliser pour hasher du texte.

Le problème que nous allons utiliser est le suivant : étant donné une `LIST`, nous allons rechercher une liste de 6 entiers `HASH_KEY` telle que lorsque on l'ajoute (au sens de la concaténation) à `LIST`, le résultat (`LIST + HASH_KEY`) sera hashé en une chaine plus "petite" qu'une liste donnée `MAX` (au sens de la comparaison du 2a.2).

`LIST` peut être de longueur quelconque (on peut la transformer en une liste de taille $6*N$ comme vu ci-dessus)

Le problème "facile" : créer une fonction `verify_key()` prenant les paramètres `LIST,HASH_KEY,MAX` qui retourne `True`si et seulement si : `hash_this_list(LIST+HASH_KEY) < MAX`

In [451]:
def verify_key(l,h,m):
    #print(hash_this_list(l + h))
    #print("Verifying : ", l , h ,m)
    if list_comp(hash_this_list(l + h),m):
        return True
    else: 
        return False

my_list = [0,1,2,3,4,5]
hash_key = [12,3,24,72,47,77]
#hash_key = [53, 96, 0, 56, 75, 20]
#hash_key = [98, 95, 86, 55, 66, 75]
#True#hash_key = [69, 85, 9, 89, 47, 57]
max_list = [0,0,7]
print(verify_key(my_list,hash_key,max_list))

True


A présent le problème "difficile" : créer une fonction `search_key()`, acceptant les paramètres `LIST` et `MAX` qui va rechercher une `KEY` qui satisfait à `hash_this_list(LIST,KEY) < MAX`.

D'abord créer une fonction qui génère une `KEY`aléatoirement (`random_key()`)

In [452]:
# first build a 6 integers list random generator function

from random import randint

def random_key():
    k = []
    for i in range(6):
        k.append(randint(0,99))
    return k

print(random_key())

[59, 92, 43, 60, 63, 87]


Enfin, créer la fonction `search_key(list, max)` qui va tirer des clefs au sort, les hasher avec la liste et s'arreter quand le hash est plus petit que max.

In [460]:
def search_key(my_list,max_list):
    print("mining ! ", end ="")
    count = 0 
    while 1: 
        count += 1 
        new_key = random_key()
        #print(new_key)
        if verify_key(my_list,new_key,max_list):
            print(" done !")
            return new_key
        if count % 2000 == 0: 
            print('.',end="")
    
my_list = [0,1,2,3,4,5]
max_list = [0,0,7]
    
print(search_key(my_list, max_list))

mining ! ......................................... done !
[50, 72, 0, 51, 66, 15]


## 3. A présent nous pouvons démarrer notre système de BitCoins, on a enfin tout ce qu'il faut !

Nous allons utiliser un `book` pour y enregistrer les transactions avec le système de preuve de travail (les key <max). AVec ce système le `book` est en pratique inaltérable.

Pour initialiser notre BlockChain, nous créons un premier enregistrement par exemple $[0,0,0,0,0,0]$.

Nous définissons aussi un objectif de difficulté :

In [464]:
# initialization

# first key in book : 
book = [[0,0,0,0,0,0]]

# difficulty level : new-key will be valid if hashing new-key + trx+previous-key is < max_list 
max_list = [0,0,7]

print(book)

[[0, 0, 0, 0, 0, 0]]


In [461]:
# function to add a new transactiion in the book : add trx, take previous key and current trx to be added
# and find a hsh for both that is "smaller" than max_list.

def add_transaction(book, trx, max_list): 
    # add trx as a list to the book
    book = book + [trx]
    
    # my_list contains last 2 elements : trx and previous key 
    my_list = book[-2]
    my_list = my_list + str_to_list_6(book[-1])
    
    # with trx and previous key, search new key 
    new_proof_of_work = search_key(my_list,max_list)
    
    # now insert the new-key at the end of the book
    # in a real shared book : send key to other miners, they will stop mining, verify new key, and update 
    # their version of the book. (if someone's book has been hacked : it will be detected)
    
    book = book + [new_proof_of_work]
 
    return book
    

In [465]:
trx = "André has 100 AcademyCoins"
book = add_transaction(book,trx, max_list)
trx = "Oceane has 360 AcademyCoins"
book = add_transaction(book,trx, max_list)
trx = "Oceane gives 61 AcademyCoins to Christian"
book = add_transaction(book,trx, max_list)
trx = "André gives 15 Academycoins to Sowen"
book = add_transaction(book,trx, max_list)
trx = "André gives 23 AcademyCoins to André"
book = add_transaction(book,trx, max_list)
print(book)

mining ! .... done !
mining ! ....................................................................... done !
mining ! ................ done !
mining ! .......... done !
mining ! ..................................... done !
[[0, 0, 0, 0, 0, 0], 'Abel has 100 gebCoins', [26, 43, 82, 57, 55, 40], 'Barbara has 360 gebCoins', [50, 65, 6, 62, 87, 78], 'Barbara gives 61 gebCoins to Chris', [32, 37, 57, 29, 43, 56], 'Barbara gives 15 coiins to Diana', [0, 22, 53, 46, 14, 16], 'Chris gives 23 coins to Elise', [77, 10, 77, 66, 59, 12]]


Ecrivons une fonction pour vérifier l'intégrité de la BlockChain : 
`verify_blockchain()` qui utilise les paramètres `book` et `max_list` : 

In [466]:
def verify_blockchain(b,m):
    for i in range(0,len(b) - 2, 2):
        
        my_list = b[i] + str_to_list_6(b[i+1])
        
       
        if verify_key(my_list, b[i+2], m ) == False:
            return False
    return True

print(verify_blockchain(book, max_list))

True


In [467]:
book

[[0, 0, 0, 0, 0, 0],
 'Abel has 100 gebCoins',
 [26, 43, 82, 57, 55, 40],
 'Barbara has 360 gebCoins',
 [50, 65, 6, 62, 87, 78],
 'Barbara gives 61 gebCoins to Chris',
 [32, 37, 57, 29, 43, 56],
 'Barbara gives 15 coiins to Diana',
 [0, 22, 53, 46, 14, 16],
 'Chris gives 23 coins to Elise',
 [77, 10, 77, 66, 59, 12]]

In [468]:
book[5]

'Barbara gives 61 gebCoins to Chris'

In [473]:
book[5] = 'Oceane gives 62 AcademyCoins to Christian'

In [474]:
print(verify_blockchain(book, max_list))

True
