# Partie 4: Dictionnaires, factorisation et fonctions multiplicatives en Python 3.x

Le type de `list` est parfait pour stocker les données de façon ordonnée (premier élément de la liste - indéxé à zéro -, deuxième, etc.). Nous introduisons ici le type `dict` - pour dictionary -, qui peut être utilisé pour des paires *clé-valeur*, en anglais `key-value`. Cette structure de données convient bien pour stocker la décomposition en facteurs premiers des entiers, dans laquelle à chaque facteur premier - la *clé* - est associé un exposant - la  *valeur* -. Au fur et à mesure que nous introduirons le type `dict`, nous discuterons aussi plus généralement des *méthodes* et des *objets* en programmation Python.

Nous appliquons maintenent ces concepts de programmation à la fonction *somme des diviseurs* et aux fonctions multiplicatives en arithmétique - voir le Chapitre 2 de [An Illustrated Theory of Numbers](http://illustratedtheoryofnumbers.com/index.html).

## Table des matières

- [Dictionnaires et factorisation des entiers](#dictfact)
- [Fonctions multiplicatives](#multfunc)


<a id='dictfact'></a>

## Dictionnaires et factorisation des entiers

### Listes, dictionnaires, objets et méthodes

Les listes, comme `[2, 3, 5, 7]` sont des structures de données construites pour des données séquentiellement ordonnées. Les **éléments** d'une liste (dans ce cas, les nombres 2, 3, 5, 7) sont *indexés* par les entiers naturels (dans ce cas, les **indices** sont 0, 1, 2, 3).
Python vous permet d'accéder aux éléments d'une liste via leur index.

In [1]:
L = [2, 3, 5, 7]
type(L)

list

In [2]:
print(L[0])  # What is the output?

2


In [3]:
print(L[3])  # What is the output?

7


In [4]:
print(L[5])  # This should give an IndexError.

IndexError: list index out of range

Les **dictionnaires** Python sont des structures conçues pour les données ayant une structure *clé-valeur*. Les clés sont comme des indices. Mais au lieu d'indices numériques (0, 1, 2, etc.), les clés peuvent être n'importe quels nombres ou chaînes de caractères - techniquement, n'importe quel type [hashable](https://blog.m157q.tw/posts/2013/06/05/python-mutable-vs-hashable/), par exemple des tuples, des booléens, même des fonctions !, mais pas des listes, ni des dictionnaires. Chaque clé du dictionnaire fait référence à une **valeur**, de la même manière que chaque indice d'une liste fait référence à un élément. La syntaxe permettant de définir un dictionnaire est `{key1:value1, key2:value2, key3:value3, ...}`. Un premier exemple est ci-dessous. Vous pouvez également lire le [official tutorial](https://docs.python.org/3/tutorial/datastructures.html#dictionaries) pour en savoir plus sur les dictionnaires.

In [5]:
nemo = {'species': 'clownfish', 'color': 'orange', 'age': 6}

In [6]:
nemo['color']  # The key 'color' references the value 'orange'.

'orange'

In [7]:
nemo['age']  # Predict the result.  Notice the quotes are necessary.  The *string* 'age' is the key.

6

In [8]:
nemo[1]  # This yields a KeyError, since 1 is not a key in the dictionary.

KeyError: 1

Les dictionnaires peuvent avoir des valeurs de n'importe quel type.. Dans le cas précédent, les clés sont toutes des chaînes de caractères, tandis que les valeurs incluent des chaînes et des entiers. De cette façon, les dictionnaires sont utiles pour stocker des propriétés de différents types - ils peuvent également être utilisés pour stocker des [records](https://en.wikipedia.org/wiki/Record_(computer_science%29), car ils sont appelés dans d'autres langages de programmation.

### Un interlude sur les objets Python

Nous avons discuté de la manière dont Python stocke les données de différents types: `int, bool, str, list, dict`, entre autres. C'est maintenant le moment de discuter des "unités" fondamentales de Python : les **objets**. Si vous avez exécuté les cellules ci-dessus, Python stocke actuellement beaucoup d'objets dans la mémoire de votre ordinateur. Ces objets incluent `nemo` et` L`. De même, `L[0]` est un objet et `nemo['age']` est un objet. Chaque objet a un type. Chaque objet occupe un espace en mémoire.

Nous référençons ces objets par les noms que nous avons créés, comme `nemo` et` L`. Mais en interne, Python attribue à chaque objet un numéro d'identification unique. Vous pouvez voir le numéro d'identification d'un objet avec la fonction `id`.

In [9]:
id(L)

140648570040776

In [10]:
id(nemo)

140648509972680

In [11]:
id(L[0])

140648730131008

Il est parfois utile de vérifier le numéro d'identification des objets, de regarder un peu "sous le capot". Par exemple, considérez ce qui suit.

In [12]:
x = 3
y = 3
print(x == y)  # This should be true!

True


In [13]:
id(x)

140648730131040

In [14]:
id(y)

140648730131040

Qu'est-il arrivé ? Vous avez probablement remarqué que les deux variables `x` et` y` ont le même numéro d'identification. Cela signifie que Python est efficace et ne remplit pas deux emplacements de mémoire différents avec le même nombre $3$. Au lieu de cela, il place le nombre dans un seul et même emplacement mémoire et utilise `x` et` y` comme différents noms au choix pour cet emplacement.

Mais que se passe-t-il si nous changeons la valeur d'une variable ?

In [15]:
x = 5

In [17]:
id(x)

140648730131104

In [18]:
id(y)

140648730131040

Python ne sera pas dérouté par cela. Lorsque nous avons affecté `x = 5`, Python a ouvert un nouvel emplacement de mémoire pour le numéro $5$ et lui a attribué `x` comme nom de variable. Notez que y toujours "pointe" toujours à l'ancien emplacement. Python tente d’être intelligent en matière de mémoire, en se souvenant où les objets sont stockés.

In [19]:
id(3)  # Does Python remember where it put 3?

140648730131040

In [20]:
id(5)  # Does Python remember where it put 5?

140648730131104

In [21]:
id(4)  #  4 was probably not in memory before.  But now it is!

140648730131072

In [22]:
y = 5

In [23]:
id(y)  #  Did Python change the number in a slot?  Or did it point `y` at another slot?

140648730131104

In [24]:
id(L[2]) #  Python doesn't like to waste space.

140648730131104

Cette gestion de la mémoire est utile pour éviter la répétition. Par exemple, considérons une liste avec répétition.

In [25]:
R = [19, 19, 19]

In [26]:
id(R)  # The list itself is an object.

140648510047688

In [28]:
id(R[0])  # The 0th item in the list is an object.

140648730131552

In [29]:
id(R[1])  # The 1st item in the list is an object.

140648730131552

In [30]:
id(R[2])  # The 2nd item in the list is an object.

140648730131552

Comme chaque entrée de liste pointe au même emplacement en mémoire, Python évite de remplir trois blocs mémoire avec le même nombre $19$.

Les objets Python peuvent être associés à **méthodes**. Les méthodes sont des fonctions qui peuvent utiliser ou modifier les données dans un objet. La syntaxe de base pour utiliser des méthodes est `<object>.<method>()`. Par exemple, les clés et les valeurs d'un dictionnaire peuvent être récupérées à l'aide des méthodes `keys()` et `values()`.

In [33]:
nemo.keys()  # What are the keys of nemo?

dict_keys(['color', 'species', 'age'])

In [34]:
nemo.values()  # What are the values of nemo?

dict_values(['orange', 'clownfish', 6])

The output of the `keys()` and `values()` methods are list-like.  As such, they are convenient for iteration and membership-testing.

In [35]:
'color' in nemo.keys()

True

In [36]:
'taste' in nemo.keys()

False

In [37]:
'orange' in nemo.keys()  # Is 'orange' a key in the dictionary?

False

In [38]:
'orange' in nemo.values()  # Is 'orange' a value in the dictionary?

True

In [40]:
for k in nemo.keys():  # Iterates through the keys.
    print('Nemo\'s {} is {}.'.format(k, nemo[k]))  
    # \' is used to get a single-quote in a string.

Nemo's color is orange.
Nemo's species is clownfish.
Nemo's age is 6.


En fait, Python fournit une syntaxe simple pour parcourir des clés ou tester l'appartenance à des clés. La syntaxe `for k in <dictionary>:` itère la variable `k` à travers les clés du dictionnaire. De même, la syntaxe `k in <dictionary>` est un raccourci pour `k in <dictionary>.keys()`.

In [35]:
for k in nemo:  # This will iterate through the *keys* of the dictionary nemo.
    print('Nemo\'s {} is {}.'.format(k,nemo[k]))

Nemo's species is clownfish.
Nemo's color is orange.
Nemo's age is 6.


Parfois, nous voulons modifier un dictionnaire. Supposons par exemple que Nemo s'est perdu.

In [37]:
nemo['status'] = 'lost'

In [38]:
id(nemo)

140265918310856

In [39]:
id('status')

140266111704512

In [40]:
print(nemo)

{'species': 'clownfish', 'color': 'orange', 'age': 6, 'status': 'lost'}


La commande `nemo['status'] = 'lost'` crée une nouvelle clé dans le dictionnaire appelée `'status'` et attribue la valeur `'lost'` à la clé. Si nous trouvons nemo, nous pouvons changer la valeur.

In [41]:
nemo['status'] = 'found'
print(nemo)

{'color': 'orange', 'species': 'clownfish', 'age': 6, 'status': 'found'}


Comme `'status'` fait déjà partie des clés de `nemo`, la commande nemo `nemo['status'] = 'found'` ne crée pas de nouvelle clé cette fois. Cela change simplement la valeur associée de `'lost'` à `'found'`.

In [42]:
nemo.keys()  # What are the keys of nemo now?

dict_keys(['color', 'species', 'age', 'status'])

In [43]:
nemo.values()  # What are the values of nemo now?

dict_values(['orange', 'clownfish', 6, 'found'])

Nous avons mentionné précédemment que `keys()` and `values()` sont des méthodes associées à l'objet `nemo`, et que les méthodes sont des fonctions attachées aux objets Python.
Les objets Python ont souvent des méthodes qui leur sont attachées. Chaque dictionnaire et chaque liste de Python sont fournis avec des méthodes associées. Les méthodes peuvent être utilisées pour extraire les propriétés des objets ou les modifier. Voici des exemples de méthodes de liste.

In [44]:
L = [2, 3, 5, 7]
print(L) # Let's remember what the list L is.

[2, 3, 5, 7]


In [45]:
L[0] # What is this?

2

In [46]:
id(L[0]) # What is the ID number of the 0th item in the list?

140648730131008

In [47]:
L.reverse() # The reverse() method changes L!
print(L)

[7, 5, 3, 2]


In [48]:
L[0]  # We have definitely changed L.

7

In [49]:
L[3]  # The last item in the list L.

2

In [50]:
id(L[3]) # The ID number of the last item in the list L.

140648730131008

Notez que Python a modifié l'ordre des éléments de la liste. Mais cela ne les a pas déplacés en mémoire! L'objet `2` conserve le même numéro d'identification et reste au même endroit en mémoire. Mais l'élément `L[0]` pointe sur `2` avant le `reverse()` tandis que c'est `L[3]` qui pointe sur `2` après le `reverse()`. Ça peut être déroutant au début, mais le cadre général est `<variable> points at <memory location>`. Vous choisissez le nom de la variable et travaillez directement avec la variable. Python attribue un numéro d’identification à chaque emplacement de mémoire, place les objets en mémoire et les récupère en fonction de vos souhaits.

In [52]:
L.append(11) # Let's add another term to the list with the append(*) method.
print(L)

[7, 5, 3, 2, 11, 11]


In [53]:
L.sort()  # Let's get this list back in order.
print(L)

[2, 3, 5, 7, 11, 11]


D'autres méthodes de listes utiles peuvent être trouvées à [tutoriel Python officiel](https://docs.python.org/3/tutorial/datastructures.html#more-on-lists).  

### Dictionnaires pour la factorisation des entiers

Si $N$ est un entier positif, alors on peut le décomposer de manière unique en un produit de nombres premiers, de la forme
$$N = 2^{e_2} 3^{e_3} 5^{e_5} \cdots$$
dans lequel les exposants $ e_2, e_3, e_5 $, etc., sont des nombres entiers non nuls.

Un dictionnaire Python est bien adapté pour stocker la décomposition principale résultante. Par exemple, nous pourrions stocker la décomposition  $2^3 3^2 7$ dans le dictionnaire `{2:3, 3:2, 7:1}`.
Les nombres premiers qui apparaissent seront les *clés* du dictionnaire et les exposants les *valeurs* du dictionnaire.

Les fonctions suivantes décomposent un entier positif `N` en facteurs premiers, et enregistrent le résultat dans un dictionnaire. La stratégie consiste à séparer (diviser par) le plus petit facteur premier d'un nombre, en mettant à jour le dictionnaire en cours de processus, jusqu'à ce que le nombre soit réduit à `1`. La première fonction ci-dessous trouve le plus petit facteur premier d'un nombre.

In [70]:
2**3 * 3**2 * 7

504

### Exercices

1. Ecrire une fonction `smallest_factor` qui prend en argument un entier `n`, et qui renvoie le plus petit facteur premier de `n`. Attention : on utilisera la fonction `sqrt` pour gagner en temps d'exécution.

2. Ecrire une fonction `decompose` qui prend en argument un entier `n`, et qui renvoie un dictionnaire de la décomposition en facteurs premiers de `n`. Par exemple, pour `n = 504`, on devra obtenir le dictionnaire `{2:3, 3:2, 7:1}`.

In [54]:
# Réponse à l'exercice 1. ci-dessous
from math import sqrt  # We'll want to use the square root.
def smallest_factor(n):
    '''
    Gives the smallest prime factor of n.
    '''
    
    # Compléter le code de la fonction smallest_factor ici

Tests `smallest_factor()` ci-dessous

In [59]:
smallest_factor(105)

3

In [67]:
smallest_factor(1999*1999) # The result should be 1999.

1999

In [68]:
smallest_factor(11**3 * 13**9) # The result should be 11.

11

In [57]:
# Réponse à l'exercice 2. ci-dessous
def decompose(N):
    '''
    Gives the unique prime decomposition of a positive integer N,
    as a dictionary with primes as keys and exponents as values.
    '''
    
    # Compléter le code de la fonction decompose ici

Tests `decompose` ci-dessous

In [58]:
decompose(100) # What is the prime decomposition of 100?

{2: 2, 5: 2}

In [59]:
decompose(56401910421778813463) # This should be quick.

{11: 3, 13: 9, 1999: 2}

In [60]:
decompose(1)  # Good to test the base case!

{}

In [61]:
#  Use this space to experiment a bit with the decompose function.


Maintenant que nous avons une fonction pour calculer la décomposition première d'un entier positif, écrivons une fonction pour récupérer un entier positif à partir d'une telle décomposition. La fonction est d'une grande simplicité; il suffit de parcourir les clés du dictionnaire.

In [62]:
def recompose(D):
    '''
    If D is a dictionary with prime keys and natural values,
    this function outputs the product of terms of the form
    key^value.  In this way, it recovers a single number from a
    prime decomposition.
    '''
    N = 1
    for p in D.keys():  # iterate p through all the keys of D.
        N = N * (p ** D[p])  # Note that D[p] refers to the value (exponent) for the key p.
    return N

In [63]:
D = decompose(1000)
print(D)

{2: 3, 5: 3}


In [64]:
recompose(D)  # This should recover 1000.

1000

In [65]:
recompose({2:1, 3:1, 5:1, 7:1})  # What will this give?

210

In [66]:
# Use this space to experiment with decompose and recompose.


### Exercices

1. Créez la liste [1, 100 ,2, 99, 3, 98, 4, 97, ..., 50, 51] avec le moins de commandes possible.

2. Si vous essayez les commandes `x = 7`, `y = 11`, puis `x, y = y, x`, qu'attendez-vous obtenir ensuite des commandes `id(x)` et `id(y)` ?

4. Ecrivez une fonction `multiply(A, B)`, qui prend en arguments des entiers `A` et` B` donnés sous la forme de leur décomposition en facteurs premiers et qui renvoie la décomposition du produit `AB` en facteurs premiers.

5. Ecrivez une fonction `divides(A, B)`, qui prend en arguments des entiers `A` et` B` donnés sous la forme de leur décomposition en facteurs premiers et qui renvoie un booléen: `True` si `A` divise` B` et `False` sinon.

6. Le *radical* d'un nombre entier positif `N` est le nombre entier positif dont les facteurs premiers sont identiques à ceux de `N`, mais dans lequel tous les exposants valent `1`. Par exemple, $rad(500) = 2 \cdot 5 = 10$. Ecrivez une fonction `radical(N)` qui calcule le radical de `N`. Vous pouvez utiliser les fonctions `decompose(N)` et `recompose(N)`.

In [67]:
# Use this space for the exercises.


<a id='multfunc'></a>

## Multiplicative functions

A *multiplicative function* is a function $f(n)$ which takes positive integer input $n$, and which satisfies $f(1) = 1$ and $f(ab) = f(a) f(b)$ whenever $a$ and $b$ are *coprime*.  A good example is the divisor-sum function, implemented below.

In [68]:
def divisor_sum(n):
    S = 0 # Start the sum at zero.
    for d in range(1,n+1):  # potential divisors between 1 and n.
        if n%d == 0:
            S = S + d
    return S

In [69]:
divisor_sum(100)  # The sum 1 + 2 + 4 + 5 + 10 + 20 + 25 + 50 + 100

217

In [70]:
%timeit divisor_sum(730) # Let's see how quickly this runs.

10000 loops, best of 3: 67 µs per loop


A perfect number is a positive integer which equals the sum of its proper factors (its positive factors, not including itself).  Thus a number $n$ is perfect if its divisor sum equals $2n$.  This can be implemented in a very short function.

In [71]:
def is_perfect(n):
    return divisor_sum(n) == 2*n

In [72]:
is_perfect(10)

False

In [73]:
is_perfect(28)

True

Let's find the perfect numbers up to 10000.  It might take a few seconds.

In [74]:
for j in range(1,10000):
    if is_perfect(j):
        print("{} is perfect!".format(j))

6 is perfect!
28 is perfect!
496 is perfect!
8128 is perfect!


Multiplicative functions like the divisor sum function can be computed via prime decomposition.  Indeed, if $f$ is a multiplicative function, and $$n = 2^{e_2} 3^{e_3} 5^{e_5} \cdots,$$ then the value $f(n)$ satisfies
$$f(n) = f(2^{e_2}) \cdot f(3^{e_3}) \cdot f(5^{e_5}) \cdots.$$

So if we can compute the values of $f$ on prime powers, we can compute the values of $f$ for all positive integers.

The following function computes the divisor sum function, for a prime power $p^e$.

In [75]:
def divisor_sum_pp(p,e):  # pp stands for prime power
    '''
    Computes the divisor sum of the prime power p**e,
    when p is prime and e is a positive integer.
    This is just 1 + p^2 + p^3 + ... + p^e,
    simplified using a geometric series formula.
    '''
    return (p**(e+1) - 1) // (p - 1)

In [76]:
divisor_sum_pp(2,3)  # Should equal 1 + 2 + 4 + 8

15

In [77]:
divisor_sum_pp(3,1)  # Should equal 1 + 3

4

Now let's re-implement the divisor sum function, using prime decomposition and the divisor_sum_pp function for prime powers.

In [78]:
def divisor_sum(n):
    '''
    Computes the sum of the positive divisors of a 
    positive integer n.
    '''
    D = decompose(n)  # We require the decompose function from before!
    result = 1
    for p in D.keys():
        result = result * divisor_sum_pp(p,D[p])
    return result
    

In [79]:
divisor_sum(15)

24

In [80]:
% timeit(divisor_sum(730)) # this probably runs faster than the previous version.

The slowest run took 4.25 times longer than the fastest. This could mean that an intermediate result is being cached.
100000 loops, best of 3: 7.03 µs per loop


There are a lot of interesting multiplicative functions.  We could implement each one by a two-step process as above:  implementing the function for prime powers, then defining a version for positive integers by using the decompose function.  But there's a shortcut for the second step, which brings in a very cool aspect of Python.

In Python, **functions are Python objects**.  



In [81]:
type(divisor_sum_pp) # Every object has a type.

function

In [82]:
id(divisor_sum_pp) # Yes, every object gets an ID number.

140265917826864

Since functions are Python objects, it is possible to define a function which takes a function as input and outputs a function too!  You can pass a function as an input parameter to another function, just as if it were any other variable.  You can output a function with the `return` keyword, just as if it were another variable.  And you can define a new function within the scope of a function!

Here's a basic example as a warmup.

In [83]:
def addone(x):  # Let's make a simple function.
    return x + 1  # It's not a very interesting function, is it.

In [84]:
addone(10) # Predict the result.

11

In [85]:
def do_twice(f):
    '''
    If a function f is input, then the output is the function
    "f composed with f."
    '''
    def ff(x):  # Defines a new function ff!
        return f(f(x)) # This is what ff does.
    
    return ff

In [86]:
addtwo = do_twice(addone)  # addtwo is a function!

In [87]:
addtwo(10)  # What is the result?

12

Now we exploit this function-as-object approach to create a Python function called `mult_function`.  Given a function `f_pp(p,e)`, the function `mult_function` outputs the *multiplicative function* which coincides with `f_pp` on prime powers.  In other words, if `f = mult_function(f_pp)`, then `f(p**e)` will equal `f_pp(p,e)`.

In [88]:
def mult_function(f_pp):
    '''
    When a function f_pp(p,e) of two arguments is input,
    this outputs a multiplicative function obtained from f_pp
    via prime decomposition.
    '''
    def f(n):
        D = decompose(n)
        result = 1
        for p in D:
            result = result * f_pp(p, D[p])
        return result
    
    return f

Let's see how this works for the *divisor-counting* function.  This is the function $\sigma_0(n)$ whose value is the *number* of positive divisors of $n$.  For prime powers, it is easy to count divisors, $$\sigma_0(p^e) = e + 1.$$  

In [89]:
def sigma0_pp(p,e):
    return e+1

Since the divisor-counting function is multiplicative, we can implement it by applying `mult_function` to `sigma0_pp`.  

In [90]:
sigma0 = mult_function(sigma0_pp)

In [91]:
sigma0(100)  # How many divisors does 100 have?

9

### Exercises

1.  A positive integer $n$ is called deficient/perfect/abundant according to whether the sum of its proper divisors is less than/equal to/greater than $n$ itself.  Among the numbers up to 10000, how many are deficient, perfect, and abundant?

2.  If $f(n)$ is a function with natural number input and real output, define $F(n)$ to be the function given by the formula $F(n) = \sum_{i=0}^n f(i)$.  Create a function `sumfun(f)` which takes as input a function `f` and outputs the function `F` as described above.

3.  Consider the function $f(n)$ which counts the number of positive divisors of $n$ which *are not* divisible by 4.  Verify that this is a multiplicative function, and implement it using `mult_function`.

4.  Write a function `foursquare(n)` which counts the number of ways that a positive integer `n` can be expressed as `a*a + b*b + c*c + d*d` for integers `a`, `b`, `c`, `d`.  Hint:  loop the variables through integers between $-\sqrt{n}$ and $\sqrt{n}$.  Compare the values of `foursquare(n)` to the multiplicative function in the previous problem.

5.  A positive integer is "square-free" if it has no square factors besides 1.  The **Mobius** function $\mu(n)$ is defined by $\mu(n) = 0$ if $n$ is not square-free, and otherwise $\mu(n) = 1$ or $\mu(n) = -1$ according to whether $n$ has an even or odd number of prime factors.  Verify that the Mobius function is multiplicative and implement it.  Try to reproduce the graph of the Mertens function $M(n)$ as described at [Wikipedia's article on the Mertens conjecture](https://en.wikipedia.org/wiki/Mertens_conjecture).  (See the previous Python notebook for an introduction to matplotlib for creating graphs.)



In [None]:
#  Use this space to work on the exercises.