# Protection des données

Internet est un monde **ouvert** où tout est accessible. Il est donc très important de protéger ses données **sensibles** (tout ce qui touche à votre vie privée). 

![](https://upload.wikimedia.org/wikipedia/commons/thumb/a/a6/Anonymous_emblem.svg/480px-Anonymous_emblem.svg.png)

## Objectifs

1. Comprendre le système de fichiers
1. Connaître quelques commandes UNIX
1. Comprendre l'importance d'un bon mot de passe

## Télécharger un dossier

* Depuis moodle, téléchargez le dossier ```dossier-a-hacker.zip```
* Depuis le dossier ```Téléchargements``` tirez le dossier ```dossier-a-hacker``` dans l'explorateur de fichiers de jupyter-lab

## Ben ranger pour mieux retrouver

Votre ordinateur stocke des données localement. Sur un ordinateur Mac, chaque donnée est un fichier. Chaque fichier peut se trouver dans un dossier qui lui même peut se trouver dans un autre dossier. C'est une structure en arbre ou une **arborescence** où la racine est représentée par le signe ```/```:

![](https://pixees.fr/informatiquelycee/n_site/img/nsi_prem_base_linux_2.png)

Vous pouvez retrouver cette arborescence sous forme graphique dans le finder:

![](https://osxdaily.com/wp-content/uploads/2010/02/mac-os-x-finder-column-view.JPG)

où chaque colonne représente un niveau dans la structure représentée par un nouveau dossier.

### Chemin vers un fichier

Chaque fichier possède donc un chemin depuis la racine. Par exemple le fichier ```README.txt``` qui se trouve dans le répertoire ```dossier-a-cracker``` possède le chemin ```/home/L12345/dossier-a-cracker/README.txt``` (le second dossier ```L12345``` sera différent pour vous : c'est votre identifiant à la place)

Ce chemin se retrouve dans propriétés du fichier (clic droit : ```Get info```) (FIXME : écrire la version française !!)

**Exercice** : Cliquez avec le bouton droite sur le fichier ```README.txt``` et retrouvez le chemin de ce fichier

## Devenons des Anonymous

Avant l'invention de la souris, toutes les interactions avec l'ordinateur se faisaient avec des **lignes de commandes**. Aujourd'hui encore, les professionnels utilisent ces lignes de commandes parce qu'elle permettent de gagner du temps (on garde ses mains sur le clavier, pas sur la souris).

### Ouverture d'un terminal

Dans Jupyter Lab, ouvrez un nouveau terminal : Fichier -> Nouveau -> Terminal. Cela va ouvrir un nouvel onglet "Terminal" dans lequel vous pouvez écrire des commandes à l'ordinateur

![](https://user-images.githubusercontent.com/4312421/28751772-9855637c-7510-11e7-900e-552b39a498f7.PNG)

FIXME: Prendre un screenshot au gymnase

### Commandes dans le terminal 

Plusieurs commandes sont importantes à connaître :

| Commande  | paramètre |  Résultat  | exemple | 
|---|---|---|---|
| ```pwd```  | | affiche le chemin du répertoire où nous nous trouvons  | ```pwd``` |
| ```cd```  | nom du répertoire | change de répertoire |```cd dossier-a-cracker``` va aller dans le répertoire ```dossier-a-cracker``` |
| ```cat```  | un nom de fichier | Affiche le contenu d'un fichier (attention : seulement les fichiers de type texte) | ```cat README.txt``` va afficher le contenu du fichier ```README.txt``` |
| ```ls```  | | affiche les  fichiers et dossiers du répertoire où nous nous trouvons | ```ls``` |



**Exercice** En utilisant les commandes ```ls```, ```cd``` et ```cat```, affichez le contenu du fichier ```README.txt```

## Mot de passe

Il sert à protéger ses données privées dans les réseaux sociaux, sur son téléphone portable, etc.. 

Il doit être difficile à trouver pour un être humain, mais surtout pour un ordinateur. L'[EPFL](https://wiki.epfl.ch/secure-it/questcequunbonmotdepasse) donne quatre caractéristiques pour un **bon mot de passe** :

1. il n'est **pas basé sur un mot courant** (nom, prénom, etc..)
1. il doit être **long**
1. il ne doit pas contenir des **répétitions**
1. il doit contenir des caractères **variés** (lettres, accents, chiffres, caractères spéciaux)

Malheureusement, beaucoup de personnes ont encore des mots de passe trop simple

**Exercice** Recherchez sur Internet quel est le mot de passe le plus utilisé pour les utilisateurs francophones

### Qualité d'un mot de passe

Le fichier ```dossier-a-cracker/passwords.txt``` contient les **20'000 mots de passes** les plus utilisés sur l'Internet francophone. Nous allons l'utiliser pour vérifier la qualité d'un mot de passe.

L'instruction Python suivante permettent de stocker dans la liste ```passwords``` les 20'000 mots de passes du fichier ```dossier-a-cracker/passwords.txt```

In [20]:
passwords = [line.rstrip() for line in open('dossier-a-cracker/passwords.txt', "r")]

On peut ensuite accéder au mot de passe le plus utilisé (en position 0 dans la liste)

In [37]:
print(passwords[0])

123456


**Exercice** Affichez le 1000ème mot de passe le plus utilisé

Il est ensuite possible de comparer si un mot de passe existe dans cette liste. Nous définissons une fonction ```mdp_Existe(mdp)``` qui prend en paramètre le mot de passe à tester contre toute la liste connue.

Testez avec ```iloveyou```, ```cristiano7``` ou ```licorne2```

In [39]:
def mdp_existe(mdp):
    existe = False
    for mot_de_passe in passwords:
        if mdp == mot_de_passe:
            existe = True
    if existe:
        print('Le mot de passe',mdp,'existe dans la liste')
    else:
        print('Le mot de passe',mdp,'n\'existe PAS dans la liste')

mdp1 = 'iloveyou'
mdp_existe(mdp1)
mdp2 = 'cristiano7'
mdp_existe(mdp2)
mdp3 = 'licorne2'
mdp_existe(mdp3)

Le mot de passe iloveyou existe dans la liste
Le mot de passe cristiano7 existe dans la liste
Le mot de passe licorne2 n'existe PAS dans la liste


**Exercice** depuis le Terminal, utilisez une commande UNIX pour afficher tout le contenu du fichier ```dossier-a-cracker/passwords.txt```. Testez ensuite avec l'avant-dernier mot de passe de la liste

**Exercice** : Pensez à un mot de passe et testez-le contre la liste de 20000:

In [36]:
mdp = input('Entrez un mot de passe:')
mdp_existe(mdp)

Entrez un mot de passe: 12345


Le mot de passe 12345 existe dans la liste


### Majuscules-Minuscules

Parfois ajouter une majuscule peut donner l'impression qu'un mot de passe est sûr. Le mot de passe ```coucou``` se trouve dans la liste:


In [40]:
mdp = 'coucou'
mdp_existe(mdp)

Le mot de passe coucou existe dans la liste


Mais le mot de passe ```CouCou``` n'y est pas :

In [41]:
mdp = 'CouCou'
mdp_existe(mdp)

Le mot de passe CouCou n'existe PAS dans la liste


Il est alors possible de vérifier toutes les combinaisons en modifiant la fonction ```mdp_existe()``` :

In [42]:
def mdp_existe_maj_min(mdp):
    existe = False
    for mot_de_passe in passwords:
        if mdp == mot_de_passe:
            existe = True
    if existe:
        print('Le mot de passe',mdp,'existe dans la liste')
    else:
        print('Le mot de passe',mdp,'n\'existe PAS dans la liste')

## Mon adresse mail est-elle en danger ?

Nous avons utilisé la **force brute** pour tester **un seul mot de passe** contre une liste définie. Les crackers du monde entier utilisent des dictionnaires bien plus grands contre des adresses mails, des comptes, etc.. que vous avez laissé ça et là au gré de vos interactions avec Internet. 

Ces listes sont ensuite vendues et utilisées à mauvais escient. 

Il existe un site web qui vérifie si votre adresse mail a été piratée : [Ai-je été piraté ?](https://haveibeenpwned.com)