Distant Reading I: hacker les humanités

# Algorithmique 1

Simon Gabay

Genève

<a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licence Creative Commons" style="border-width:0;float:right;" src="https://i.creativecommons.org/l/by/4.0/88x31.png" /></a><br />This work is licensed under a <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Creative Commons Attribution 4.0 International Licence</a>.

# 0. Avant toute chose
---
## 0.1 Un peu de vocabulaire

* _Programme_ (informatique): ensemble ordonné d'instructions destinées à être exécutées par un ordinateur.
* _Instruction_ (informatique): action nécessaire que l'ordinateur doit effectuer avant de passer à l'instruction suivante.
* _Langage_ (de programmation): notation conventionnelle destinée à formuler des algorithmes et produire des programmes informatiques qui les appliquent. D'une manière similaire à une langue naturelle, un langage de programmation est composé d'un alphabet, d'un vocabulaire, de règles de grammaire et de significations.
* _Logiciel_ : ensemble de programmes et le jeu de données formant un tout pouvant être distribué et exécuté.
* _Code source_ : un texte qui présente les instructions composant un programme sous une forme lisible, telles qu'elles ont été écrites dans un langage de programmation.
* _Code_ (ou langage) machine: version du code source sous la forme d'une suite de bits qui est interprétée par le processeur d'un ordinateur exécutant un programme informatique.
* _Compilateur_ : est un programme qui transforme un code source en un code machine.

## 0.2 Algorithmique

L'algorithmique est l'étude et la production de règles et techniques qui sont impliquées dans la définition et la conception d'algorithmes.

Un algorithme est une suite finie et non ambiguë d’opérations ou d'instructions permettant de résoudre une classe de problèmes.

En plus simple:

> « Un algorithme, c’est tout simplement une façon de décrire dans ses moindres détails comment procéder pour faire quelque chose. Il se trouve que beaucoup d’actions mécaniques, toutes probablement, se prêtent bien à une telle décortication. Le but est d’évacuer la pensée du calcul, afin de le rendre exécutable par une machine numérique (ordinateur…). On ne travaille donc qu’avec un reflet numérique du système réel avec qui l’algorithme interagit. »
>
>Gérard Berry

Nous exécutons tous des algorithmes au quotidien, le meilleur exemple est sans doute une recette de cuisine. La cuisine tend d'ailleurs à se mécaniser avec des robots du type Thermomix qui organisent la cuisson comme une succession d'étapes. Ainsi la recette du velouté de lentilles vertes:
1. Mettre dans le bol l’échalote coupée en deux, les carottes coupées en tronçons. Mixer 10 sec / vitesse 5.
2. Ajouter les lentilles rincées avec le reste des ingrédients sauf la crème, et programmer 35 mn / 100° / vitesse 1.
3. A la sonnerie, rajouter la crème et mixer 1 mn / vitesse 10.
4. Goûter et rectifier l’assaisonnement si nécessaire.
5. Pour une touche plus gourmande, vous pouvez éventuellement ajouter des dés de lardons.

L'addition est un algorithme que nous faisons sans nous en rendre compte. 18+32 est ainsi calculé de la manière suivante par la plupart des gens:
```
18+32
(10+8)+(30+2) # Règle de notre système de numération
10+8+30+2 # Associativité de l’addition
10+30+8+2 # Commutativité de l’addition
(10+30)+(8+2) #Associativité de l’addition
40+10
50
```

Notre objectif est donc d'arriver à faire une chose similaire, mais avec un ordinateur.

## 0.3 Un programme

### 0.3.1 Le code

Un programme a un début et une fin, et il est fait d'instructions et de données, qui se lisent/s'exécutent du haut vers le bas

```
DEBUT
	instruction données
FIN
```

Par exemple
```
DEBUT
	ecrire "je suis un programme"
	attendre 3000
	ecrire "qui aime prendre son temps"
FIN
```
Ce qui donne en python

```python
import time
print("Je suis un programme")
time.sleep(3)
print("qui aime prendre son temps")
```

### 0.3.2 Langage et… langage
Il existe une multitude de langage de plusieurs niveaux. Comme n'importe quel langage, il est possible de passer de l'un à l'autre. Ceux de bas niveaux sont souvent plus complexes à apprendre, mais aussi plus rapides, efficaces et légers

Ainsi le code en python suivant

```python
def loop():
    for i in range(10):
        putc(65 + i)            # 65 is 'A'

def main():
    loop()

```

devient en x86-64

```
loop:
        pushq   $0              # allocate stack space for "i"
        pushq   %rbp            # save and setup frame pointer
        movq    %rsp, %rbp
        movq    $0, 8(%rbp)     # i = 0
loop_1_while:
        movq    $10, %rdx       # rax = 1 if i < 10 else 0
        movq    8(%rbp), %rax
        cmpq    %rdx, %rax
        movq    $0, %rax
        jnl     loop_3_less
        incq    %rax
loop_3_less:
        cmpq    $0, %rax        # if bool is zero, break
        jz      loop_2_break
        movq    8(%rbp), %rdx   # 65 + i
        movq    $65, %rax
        addq    %rdx, %rax
        pushq   %rax            # putc()
        call    putc
        addq    $8, %rsp
        movq    $1, %rdx        # i = i + 1
        movq    8(%rbp), %rax
        addq    %rdx, %rax
        movq    %rax, 8(%rbp)
        jmp     loop_1_while
loop_2_break:
        popq    %rbp            # restore frame pointer
        leaq    8(%rsp),%rsp    # deallocate stack space for "i"
        ret                     # return to caller
```

Source: [https://github.com/benhoyt](https://github.com/benhoyt/pyast64/blob/master/forloop.p64)

À la vue de ce code, est-il utile d'expliquer pourquoi nous apprendrons Python dans ce cours?

### 0.3.3 Exécution du programme

<img src="images/compilation.jpg" style="float:right;" width="50%">

(Source image: [https://www.emi.ac.ma](https://www.emi.ac.ma/ntounsi/COURS/LogBase/logicielsDeBase-2.html))

Python, comme les autres langages, n'est pas compréhensible par une machine: il doit encore être transformé en fichier binaire, qui lui est exécuté par la machine.

Un fichier binaire ressemble à cela.

```xml
504b 0304 1400 0800 0800 1a44 6f3e 0000
0000 0000 0000 0000 0000 1400 0400 4d45
5441 2d49 4e46 2f4d 414e 4946 4553 542e
4d46 feca 0000 f34d cccb 4c4b 2d2e d10d
4b2d 2ace cccf b352 30d4 33e0 e572 ce49
2c2e d60d 482c c9b0 52d0 e3e5 f24d cccc
d305 8b59 29e4 17a5 eb95 54e4 ea65 e615
9724 e6e4 e885 0075 3b16 2567 64f2 72f1
7201 0050 4b07 08a1 2738 594d 0000 004f
0000 0050 4b03 040a 0000 0000 0060 8964
3e00 0000 0000 0000 0000 0000 0004 0000
006f 7267 2f50 4b03 040a 0000 0000 0060
8964 3e00 0000 0000 0000 0000 0000 0008
0000 006f 7267 2f74 786d 2f50 4b03 040a
0000 0000 0060 8964 3e00 0000 0000 0000
```

Nous allons donc apprendre à afficher <i>Hello world</i>, comme dans le dessin ci-dessus.

## 1. Premiers pas en python
Nous sommes ici dans un _Jupyter notebook_. C'est un outil très pratique pour apprendre à programmer, voire même à programmer tout court. Dans le bloc qui s'affiche juste en dessous, vous pouvez écrire et exécuter des programmes simples ou compliqués.
Essayez par vous-même et tentez des opérations mathématiques simples (trois plus deux, quatre moins huit…) dans le bloc au-dessous, et cliquez sur _Run_ dans le menu:
<img src="images/run.png" width="60%">


### 1.1 _Hello world_
Tentons d'afficher le célèbre _<a href="https://fr.wikipedia.org/wiki/Hello_world" target="_blank">Hello world</a>_. En Python, cela se fait ainsi avec une fonction qui s'appelle `print()`:

In [None]:
print("Hello world")

* `print()` est une fonction _built-in_ (ou "native"), comme `ls` ou `cd` en bash. Elle existe déjà dans Python: quelqu'un a déjà pris la peine de définir ce qu'elle doit faire pour nous.
* Cette fonction, comme son nom l'indique, permet d'afficher quelque chose (cf. le sens de _print_ en anglais), mais encore faut-il savoir quoi (affiche <i>ça</i>). Pour ce faire nous allons utiliser un _argument_ en suivant la syntaxe suivante:
```python
fonction(argument)
```
* Nous y reviendrons plus tard, mais _hello world_ est une chaîne de caractères (on parle de _string_ en anglais) et non, par exemple, un chiffre. Cette information est essentielle. Afin de la signaler, nous allons placer le contenu à afficher entre guillemets, d'où la forme finale:
```python
print("Hello world")
```
Nous savons désormais afficher toutes sortes de choses: essayez dans le bloc en-dessous!

### 1.2 De l'aide
Programmer n'est pas évident: il existe nombre de fonctions, d'arguments, etc. Afin de s'y retrouver, il existe
* une documentation officielle (https://docs.python.org/fr/3/) avec des définitions précises pour les fonctions natives (https://docs.python.org/fr/3/library/functions.html#print)
* une fonction `help()` qui permet de donner le manuel d'utilisation d'une fonction:

In [None]:
help(print)

Tout cela peut paraître un peu cryptique, mais on s'habitue à le lire avec le temps.

### 1.3 De l'erreur
Maîtriser ces fonctions ne nous empêche pas de commettre des erreurs lorsque nous prorammons: il y a un _bug_. Nous recevons alors un message indiquant la présence d'une erreur, avec quelques indices pour débuguer le programme. Par exemple, oublions de fermer les guillemets:

In [None]:
print("Hello world)

On nous indique bien la ligne fautive (`line 1`), et la zone problématique est signalée par un pointeur (`^`). Un message `SyntaxError` décrit l'erreur, en l'occurrence un problème de syntaxe python: une fin de ligne ( _EOL_ , "end of line") lors de l'analyse de la chaîne de caractère ( _string literal_ ) qui aurait dû se terminer par un guillemet.

In [None]:
print(Hello)

On nous indique à nouveau bien la ligne fautive (`line 1`), et la zone problématique est signalée par un pointeur (`^`). Un autre message s'affiche: ce n'est plus `SyntaxError` mais `NameError`, qui nous indique que `'Hello'` n'est pas défini. Kézaco? Il s'agit d'une variable

## 2. Les variables
### 2.1 Données externes


<img src="images/database.png" style="float:right;" width="40%">

(Source image: J. Pilla)

La plupart des programmes interagissent avec des données externes, souvent sous la forme de base de données.

* L'utilisateur entre des données, pour créer son compte personnel par exemple
* Le site en propose aussi: affichage de textes, de mots, d'horaires de train…

On parle souvent de base de données relationnelles (type SQL), de plus en plus de  <a href="https://fr.wikipedia.org/wiki/Base_de_donn%C3%A9es_orient%C3%A9e_graphe" target="_blank">base de données orientée graphe</a>, voire de données XML pour l'édition de texte.


### 2.2 Données internes

Pour fonctionner, un programme n'a pas recours uniquement à des données externes, mais aussi à des données internes.

Elles sont stockées dans une structure de données propre au langage de programmation utilisé. En python, il s'agit de:

* liste
* tuple
* dictionnaire

Nous y reviendrons!

### 2.3 Variable

(Source image: <a href="https://developer.mozilla.org/en-US/docs/Learn/JavaScript/First_steps/Variables" target="_blank">https://developer.mozilla.org</a>)

<img src="images/variable.jpg" style="float:right;" width="40%">

Les données sont stockées physiquement à un endroit de l'ordinateur pour pouvoir être réutilisées plus tard.

Ces données ont des adresses physiques (du type `0x45B0j`) qui seraient trop complexes à manier: on leur donne donc un nom. On parle de variable, c'est à dire la combinaison de:
* Une étiquette, qui ne peut pas changer
* Une valeur, qui peut changer (comme le type de la valeur)

Il existe un nombre presque infini de variables.


### 2.4 Assigner une valeur
Dans l'exemple précédent, nous avons fait appel à une variable du nom de _Hello_ que nous n'avons pas définie au préalable. Pour cela nous devons donc:
1. Définir une variable
```python
nomDeMaVariable
```
2. Lui assigner une valeur
```python
nomDeMaVariable="valeur"
```
3. Appeler cette variable
```python
nomDeMaVariable="valeur"
print(nomDeMaVariable)
```
Soit, par exemple, le code suivant:

In [None]:
Hello="Hello world"
print(Hello)

Le même code qui nous donnait une erreur fonctionne!
### 2.5 Nommer sa variable: _Dont's_
Il existe des règles strictes et des recommandations pour nommer ses variables. Commençons par les _don'ts_ :
1. Une variable commence par une lettre ou un underscore (`_`)
2. Corollaire logique: une variable ne commence pas par autre chose, comme un chiffre, un tiret (`-`) ou une espace (` `)

In [None]:
une_bonne_variable="ça c'est bien"
print(une_bonne_variable)

In [None]:
1_mauvaise_variable="ça c'est pas bien"
print(1_mauvaise_variable)

3. Une variable ne peut contenir que des caractères alphanumériques (en regex `[a-z0-9]`) ou un underscore (`_`)
4. Corollaire logique: une variable ne contient pas autre chose, comme un tiret (`-`) ou une espace (` `)

In [None]:
c_1_bonne_variable="ça c'est bien"
print(c_1_bonne_variable)

In [None]:
c-1-bonne-variable="ça c'est pas bien"
print(c-1-bonne-variable)

5. Les lettres peuvent être à choix majuscules ou minuscules (précisons la regex: `[a-zA-Z0-9_]`), mais attention: python est sensible à la casse ( _case sensitive_ ): `mavariable`≠`maVariable`

In [None]:
uneBonneVariable="ça c'est bien"
print(uneBonneVariable)

In [None]:
uneBonneVariable="ça c'est pas bien"
print(unebonnevariable)

6. Il ne faut pas utiliser de mot réservé, c'est à dire un mot utilisé par le langage python (`if`, `for`, etc.). Notons qu'il est possible de trouver la liste des mots réservés de la manière suivante:

In [None]:
import keyword
print(keyword.kwlist)

7. De la même manière il ne faut pas utiliser le nom d'une fonction (native ou non), car sinon la fonction est remplacée par la variable et devient inutilisable

In [None]:
#Je nomme ma variable avec le nom d'une fonction native
help = "c'est mal" 
# J'appelle la fonction que je viens de redéfinir en variable
help(print)

On note au passage que le code a été commenté. Comme en bash, nous avons placé un `#` qui permet de soustraire ce qui est écrit après lors de l'exécution. C'est une bonne pratique pour le développement, car il permet d'expliciter ce que l'on fait, pour soi-même comme pour les autres.

8. Il est très fortement recommandé de ne pas utiliser d'accent ou de diacritique de ce genre, même si ce n'est théoriquement pas un problème

In [None]:
variable_à_éviter="ça ce n'est pas mal, mais pas vraiment bien non plus"
print(variable_à_éviter)

### 2.6 Nommer sa variable: _Do's_
Comme nous l'avons précédemment vu pour les noms de fichiers, il existe deux grandes options pour nommer une variable:
1. Le _snake case_

In [None]:
variable_snake_case="j'emploi des underscores pour éviter la scripta continua"
print(variable_snake_case)

2. Le _camel case_

In [None]:
variableCamelCase="j'emploi des majuscules pour éviter la scripta continua"
print(variableCamelCase)

### 2.6 Nommer sa variable: _one more thing_
Il est possible d'affecter des données de différents types à une même variable. Ainsi:

In [None]:
mon_nom="Simon"
mon_nom

Peut devenir:

In [None]:
mon_nom="abcde"
mon_nom

Ou encore un nombre:

In [None]:
mon_nom=12345
mon_nom

Ou encore un booléen, soit un choix entre deux valeurs, _True_ ou _False_

In [None]:
mon_nom="True"
mon_nom

Comme on le voit, si c'est possible cela n'est pas recommandé, car le nom de la variable est déconnecté de sa valeur.

# 3. Des chiffres et des lettres

## 3.1 Manipuler une chaîne de caractère
Il est possible d'assigner une valeur à une variable

In [None]:
variable1="Jean-Baptiste n'aime pas Star Wars 8"
print(variable1)

Il est possible d'assigner comme valeur une autre variable:

In [None]:
variable1="Jean-Baptiste n'aime pas Star Wars 8"
variable2=variable1
print(variable2)

Il est possible d'avoir recours à plusieurs variables que l'on concatène

In [None]:
nom="Jean-Baptiste"
film="Star Wars 8"
print(nom+" n'aime pas "+film)

Il est possible d'accéder à une chacune des lettres ou un groupe de lettres d'une chaîne de caractère en appelant sa position
```python
ma_variable[1]
```

In [None]:
film="Star Wars 8"
premiere_lettre = film[0]
print(premiere_lettre)
deuxieme_lettre = film[1]
print(deuxieme_lettre)

Notons que la première position est `0` ce qui peut paraître étrange: python indexe en effet à partir de zéro, d'autres langages à partir de `1`.

Il est aussi possible de sélectionner une tranche (_slice_ en anglais) avec le signe `:` pour indiquer que l'on va de tel caractère à tel autre (non inclus)
```python
ma_variable[1:2]
```

In [None]:
film="Star Wars 8"
une_tranche = film[0:4]
print(une_tranche)

Il est possible de partir depuis la fin de la chaîne de caractère en utilisant le signe `-` (cette fois nous partons de 1 et non de 0)
```python
ma_variable[-1]
```

In [None]:
film="Star Wars 8"
derniere_lettre = film[-1]
print(derniere_lettre)

Pour résumer en une image tout cela:
![100% center](images/string-slicing.png)
Source: [https://www.nltk.org](https://www.nltk.org/book/ch03.html)

## 3.2 _String_ et _int_
Python permet de faire des opérations mathématiques simples, par exemple en additionnant des chiffres avec le signe `+`

In [None]:
2+2

Il devrait donc être possible d'additioner le numéro du _Star Wars_ contenu dans les variables suivantes en les récupérants via l'index, comme nous venons de le voir:
```python
premier_film="Star Wars 8"
second_film="Star Wars 12"
```
Essayez:

Qu'est-ce qu'il se passe? Pouvez-vous l'expliquer?
Passons le numéro de `premier_film` dans une variable spécifique et observons quel type d'objet c'est avec la fonction `type()`:

In [None]:
numero=premier_film[-1]
type(numero)

Il s'agit d'une chaîne de caractère: dans ce cas le signe `+` revient à accoler à la suite les différents objets de l'addition

In [None]:
var_1="a"
var_2="b"
var_1+var_2

Il en va de même pour les chiffres s'ils sont placés entre guillemets, car `1` est alors considéré comme un simple caractère et non comme un chiffre

In [None]:
var_1="1"
var_2="2"
var_1+var_2

Si l'on veut que `1` soit un chiffres, il faut retirer les guillemets:

In [None]:
var_1=1
var_2=2
var_1+var_2

En effet le type d'objet n'est pas le même. Le premier est un caractère

In [None]:
var_1="1"
type(var_1)

Le second est un intégral

In [None]:
var_2=2
type(var_2)

## 3.3 Les objets
Il existe quatre sortes d'objets différents:
1. Les caractères:

In [None]:
variable="abc"
type(variable)

2. Les booléens (vrai ou faux):

In [None]:
variable=False
type(variable)

3. Les entiers:

In [None]:
variable=3
type(variable)

4. Les décimaux ou flottants (c'est-à-dire avec un nombre avec une virgule)

In [None]:
variable=3.1
type(variable)

## 3.4 Les conversions
Il est possible de convertir le type de données.

In [None]:
nombre="8"
nombre_type=type(numero)
print(nombre + " est un " + str(nombre_type))

Je peux convertir un chiffre en caractère

In [None]:
nombre_en_integral=int(nombre)
#Je conserve le type dans une variable
nombre_newtype=type(nombre_en_integral)
#J'affiche les résultats
print(str(nombre_en_integral) + " est bien un " + str(nombre_newtype) +
     " alors que " + str(nombre) + " est un " + str(nombre_type))

Ce changement obéit néanmoins à des règles. Ainsi, je ne peux pas faire l'inverse et convertir un caractère en entier avec la fonction `int()`

In [None]:
lettre="a"
int(lettre)

Mais je peux convertir un flottant en entier avec `int()` (en revanche ce qui se trouve derrière la virgule est perdu)

In [None]:
flottant=1.2
flottant_en_entier=int(flottant)
flottant_en_entier

Je peux convertir une lettre en booléen avec la fonction (`bool()`)

In [None]:
caractere="a"
caractere_en_booleen=bool(caractere)
caractere_en_booleen

Je peux aussi convertir un entier en booléen

In [None]:
nombre=1
nombre_en_booleen=bool(nombre)
nombre_en_booleen

Mais attention! Il existe un piège:

In [None]:
nombre=0
nombre_en_booleen=bool(nombre)
nombre_en_booleen

Je peux enfin convertir un entier en flottant avec `float()` (on ajoute alors `.0` à la fin)

In [None]:
entier=4
entier_en_flottant=float(entier)
entier_en_flottant

## Exercice
1. Créez une variable avec votre nom
2. Créez une variable avec votre prénom
3. Créez une variable avec votre date de naissance
4. Contrôlez le type de chacune de ces variables
4. Affichez le contenu de ces variables sous la forme: "UNTEL est né à TELLE DATE"
5. Fabriquez un pseudo avec votre nom et la première lettre du prénom et affichez: "votre pseudo est PSEUDO"
_


_

_

_

_

_

_

_

_

_

_

_

_

Solution:

In [None]:
prenom="Simon"
nom="Gabay"
date_de_naissance=1984

In [None]:
print("prenom est de classe " + str(type(prenom)),
      "nom est de classe " + str(type(nom)),
      "date_de_naissance est de classe " + str(type(date_de_naissance)),
     sep="\n")

In [None]:
print(prenom + " " + nom + " est né en " + str(date_de_naissance))

In [None]:
pseudo=nom+prenom[0]
print("votre pseudo est " + pseudo)