# Table des matières :

* Comment lire ce document
* Eléments pratiques préalables
* <a href="#Introduction">1. Introduction</a>
    * <a href="#Quels objectifs ?">1.1. Quels objectifs ?</a>
    * <a href="#Quelle méthode ?">1.2. Quelle méthode ?</a>
* <a href="#Python, c'est quoi ? Pourquoi Python ?">2. Python, c'est quoi ? Pourquoi Python ?</a>
    * <a href="#Présentation">2.1. Présentation</a>
    * <a href="#Un langage et des outils pour expérimenter et produire des documents structurés">2.2. Un langage et des outils pour expérimenter et produire des documents structurés</a>
        * <a href="#Les bibliothèques de code ou packages">2.2.1. Les bibliothèques de code ou <em>packages</em></a>
        * <a href="#Les notebooks Jupyter">2.2.2. Les notebooks Jupyter</a>
* <a href="#Les bases de Python">3. Les bases de Python</a>
    * <a href="#Kit de survie pour dialoguer avec sa machine">3.1 Kit de survie pour dialoguer avec sa machine</a>
        * <a href="#Naviguer dans son système de fichier">3.1.1. Naviguer dans son système de fichier</a>
        * <a href="#Ouvrir un notebook Jupyter">3.1.2 Ouvrir un notebook Jupyter</a>
    * <a href="#Les variables et quelques fonctions essentielles">3.2. Les variables et quelques fonctions essentielles</a>
        * <a href="#Manipuler des nombres">3.2.1 Manipuler des nombres</a>
        * <a href="#Quelques règles concernant la déclaration des variables">3.2.2. Quelques règles concernant la déclaration des variables</a>
        * <a href="#Manipuler du texte">3.2.3. Manipuler du texte</a>
    * <a href="#Les types de données">3.3. Les types de données</a>
        * <a href="#Les données numériques">3.3.1. Les données numériques</a>
        * <a href="#La fonction type()">3.3.2. La fonction type()</a>
        * <a href="#Les données textuelles">3.3.3. Les données textuelles</a>
        * <a href="#Les conversions et les types personnalisés">3.3.4. Les conversions et les types personnalisés</a>
        * <a href="#En résumé">3.3.5. En résumé</a>
    * <a href="#Les structures de données">3.4. Les structures de données</a>
        * <a href="#Les listes">3.4.1. Les listes</a>
        * <a href="#Les tuples">3.4.2. Les tuples</a>
        * <a href="#Les dictionnaires">3.4.3. Les dictionnaires</a>
        * <a href="#List-ception...">3.4.4. List-ception...</a>
        * <a href="#Approfondissement sur les listes et les tuples">3.4.5. Approfondissement sur les objets mutables</a>
        * <a href="#En résumé2">3.4.6. En résumé</a>
    * <a href="#Les structures de contrôle">3.5. Les structures de contrôle</a>
        * <a href="#Les tests">3.5.1. Les opérateurs de comparaison</a>
        * <a href="#Les opérateurs booléens">3.5.2. Les opérateurs booléens</a>
        * <a href="#Combiner des conditions">3.5.3. Combiner des conditions</a>
        * <a href="#If et else">3.5.3. if et else</a>
    * <a href="#Les boucles">3.6. Les boucles</a>
        * <a href="#La boucle while">3.6.1. La boucle while</a>
        * <a href="#La boucle for">3.6.2. La boucle for</a>
        * <a href="#Imbriquer des boucles">3.6.3. Imbriquer des boucles</a>
* <a href="#Un peu de pratique">4. Un peu de pratique</a>
    * <a href="#Transformer un carnet d'adresse">4.1. Transformer un carnet d'adresse</a>
    * <a href="#">4.2. </a>
* <a href="#Les classes et fonction, les bases de la programmation orientée objet">5. Les classes et fonctions, les bases de la programmation orientée objet</a>

* <a href="#Sources et références utiles">Sources et références utiles</a>

## <div id="Introduction">1. Introduction</div>

Le présent document est le **deuxième module** d'une formation en **quatre volets** destinée à constituer un socle de connaissances et de compétences sur les **technologies du web** et le **langage Python**. Il n'y a **pas de prérequis** particuliers pour entamer ce module qui peut l'être sans passer par le premier. Néanmoins, les modules suivants s'orienteront progressivement vers l'application de connaissances générales sur Python pour la réalisation de projets concrets de **web scraping**.

Apprendre la programmation informatique n'est pas nécessairement complexe en soi mais l'évolution des environnements techniques dans lesquels s'inscrivent les différentes technologies, les différents formats, les connaissances théoriques et techniques liées à d'autres univers de l'informatique (matériel, réseaux, calcul, etc.) s'est tellement accéléré depuis le milieu du XXe siècle qu'il est aujourd'hui devenu impossible d'avoir une connaissance englobante et générale de l'informatique.

Si l'horizon d'apprentissage est presque infini dans ce domaine, apprendre à réaliser de petites opérations pratiques et savoir réutiliser des programmes pour les adapter à des besoins spécifiques peut s'apprendre assez rapidement. Néanmoins, c'est en intégrant ces opérations au travail quotidien que l'on gagne en assurance et en efficacité : apprendre à scraper un site web donné permet, bien souvent, de constituer un squelette de script que l'on pourra réutiliser à loisir pour répéter l'opération sur n'importe quel autre site. Il faudra, éventuellement, faire quelques adaptations marginales, mais le principe reste le même et ne nécessite pas de partir de zéro à chaque fois.

### <div id="Quels objectifs ?">1. 1. Quels objectifs ?</div>

Scraper un site web n'est pas une opération particulièrement difficile et a, par ailleurs, l'avantage de constituer une **pratique "stable"**, dans la mesure où les technologies sur lesquelles s'appuient le scraping sont aujourd'hui relativement anciennes et ancrées dans des usages et des environnements techniques stabilisées (navigateurs web, HTML/DOM, HTTP) dans l'univers très mouvant et en perpétuelle évolution de l'informatique.

Cette formation est conçue comme une "invitation" ou une **introduction à la programmation informatique avec Python**. Comme mentionné plus tôt, Python est très utile pour réaliser toute une série de tâches que l'on rencontre bien souvent dans un travail de recherche (collecter des données, constituer un jeu de données, analyser un corpus de texte, construire un tableau Excel, produire des graphiques, etc.). Le **web scraping** constitue ainsi une application possible parmi tant d'autres d'un socle de compétences et de pratiques qui seront axées autour de **l'apprentissage des bases de la programmation avec Python**.

Dans le cadre de cette formation, l'objectif est avant tout d'acquérir quelques connaissances élémentaires sur le **fonctionnement global du web** dans l'optique d'exploiter les contenus que l'on peut y trouver pour un travail de recherche. Cela nécessite :
* Des éléments de culture technique sur le web, traités dans le **premier module**
* Des compétences élémentaires en programmation informatique, qui seront détaillées dans ce **deuxième module**
* Une application de ces compétences en programmation à travers l'utilisation de bibliothèques de code utiles pour interagir avec les technologies du web, qui fera l'object d'un **troisième module**

### <div id="Quelle méthode ?">1. 2. Quelle méthode ?</div>

Ecrire des programmes et des petits scripts pour effectuer des tâches récurrentes est un processus qu'il faut, pour mieux l'appréhender, **découper en séries de petites opérations simples** s'imbriquant les unes les autres. En abordant la programmation de cette façon, elle n'a rien de particulièrement complexe en soi et se trouve à la portée de n'importe qui capable de manipuler un langage simple et d'imbriquer des éléments logiques entre eux.

Dans cette perspective, **Jupyter** constitue un outil précieux et utile pour expérimenter, faire des tests sans avoir à bousculer et réécrire tout son code, procéder au fur et à mesure en écrivant chaque étape de notre code dans une cellule spécifique.

Pour programmer, une compétence particulière est nécessaire, sans doute au-delà de toute autre : **savoir trouver et lire une documentation technique**. Ceci peut être complété par la consultation de forums comme https://stackoverflow.com/ pour rechercher des **exemples concrets d'application** ou de l'**aide** lorsque l'on bloque trop longtemps sur un problème particulier.

Dans l'optique d'inviter à intégrer une pratique régulière du code dans son activité de recherche, cette formation passera essentiellement par de la pratique, d'une part, à travers des exercices corrigés, d'autre part, à travers des pistes pour construire de petits projets pour s'entraîner.

## <div id="Python, c'est quoi ? Pourquoi Python ?">2. Python, c'est quoi ? Pourquoi Python ?</div>

### <div id="Présentation">2. 1. Présentation</div>

Python est un **langage de programmation interprété** sous licence libre. Cela signifie qu'il nécessite un interpréteur capable d'analyser et de traduire les scripts en langage machine : son avantage est de permettre l'exécution automatique d'un script une fois celui-ci écrit, son inconvénient est qu'il est plus lent que d'autres langages, car il doit passer, à chaque fois, par cette phase d'interprétation au moment de l'exécution d'un script.

Dans notre cas, cette caractéristique est particulièrement intéressante car elle permet d'expérimenter et de visualiser directement le résultat de nos scripts.

Python dispose d'une syntaxe simple et est donc **facile à lire et à écrire**. Il dispose d'une **communauté importante et active**, son usage étant aujourd'hui très répandu, ce qui est un avantage, notamment dès que l'on cherche l'aide de programmeurs plus expérimentés que soi. Enfin, Python est un langage particulièrement **versatile**, qui dispose d'outils pour répondre à une très grande variété de besoins de programmation (programmation web, analyse de données, visualisation de données, mathématiques appliquées, web scraping, etc.).

### <div id="Un langage et des outils pour expérimenter et produire des documents structurés">2. 2. Un langage et des outils pour expérimenter et produire des documents structurés</div>

#### <div id="Les bibliothèques de code ou packages">2. 2. 1. Les bibliothèques de code ou <em>packages</em></div>

Un des autres multiples avantages de Python consiste en la myriade de **bibliothèques de code** (ou ***packages***) disponibles en ligne, permettant de remplir à peu près n'importe quelle tâche possible en programmation informatique.

Tous les ***packages*** les plus courants de Python sont largement documentés et il existe bien souvent de nombreux tutoriels pour les prendre en main facilement. Comme nous le verrons, une fois les bases élémentaires de programmation acquises, il est possible de prendre en main à peu près n'importe quel outil en consultant sa documentation ou en cherchant des exemples d'utilisation sur des forums, des vidéos ou tutoriels, etc.

Dans notre cas, nous utiliserons essentiellement trois ***packages*** de Python :
* <a href="https://requests.readthedocs.io/en/master/"><code>requests</code></a>, qui nous permettra de construire des requêtes HTTP pour obtenir des pages web
* <a href="https://www.crummy.com/software/BeautifulSoup/bs4/doc/"><code>BeautifulSoup</code></a>, qui nous permettra de parcourir et de découper des pages HTML pour en sélectionner les informations qui nous intéressent
* <a href="https://docs.python.org/fr/2.7/howto/regex.html"><code>re</code></a>, qui nous permettra de construire des "expressions régulières" qui sont des formules permettant de filtrer les données textuelles en fonction de motifs spécifiques

#### <div id="Les notebooks Jupyter">2. 2. 2. Les notebooks Jupyter</div>

Parmi ces outils, on compte **Jupyter**. Il s'agit d'une forme d'**éditeur de code** qui permet, à la fois :
* D'écrire du code Python fonctionnel et que l'on peut directement exécuter
* D'écrire du texte comme on pourrait le faire avec un éditeur de texte classique

Jupyter est un outil particulièrement utile lorsqu'on souhaite expérimenter, effectuer des tests ou écrire rapidement un petit script pour remplir une tâche minimale. Il est également possible d'écrire des programmes plus complexes dans un notebook Jupyter bien que, dans ce cas là, on préférera passer par l'utilisation d'un **IDE (Environnement de développement)** plus adapté. Il en existe de très nombreux, bien que ceux utilisés majoritairement pour développement en Python le sont moins (voir <a href="https://wiki.python.org/moin/PythonEditors">ce lien</a> pour une liste des IDE pour Python).

Dans notre cas, **Jupyter** sera beaucoup plus utile dans la mesure où il permet également de produire des documents propres (exportables en PDF notamment), intégrant le code Python ainsi que des analyses associées, des commentaires ou une documentation de ce même code.

**Jupyter** sous la forme d'une page web disposant d'un menu dédié et fonctionnant à l'aide de **cellules**. Une cellule peut contenir :
* Du code Python
* Du texte, des images, des liens externes (n'importe quel contenu que l'on peut afficher sur un document HTML)

On peut exécuter une cellule indépendamment d'une autre. Cela permet de découper un code complexe en plusieurs étapes élémentaires successives.

Si l'on peut utiliser le menu de Jupyter pour exécuter les tâches que l'on souhaite, intégrer les raccourcis au fur et à mesure est bien utile pour gagner du temps. Ainsi, pour **exécuter une cellule**, on peut utiliser la combinaison `shift + entrée`.

**Quelques raccourcis utiles :**

|Action|Raccourci|
|---|---|
|Exécuter une cellule|`Shift + Entrée`|
|Quitter la cellule sélectionnée|`Esc`|
|Entrer dans la cellule active|`Entrée`|
|Passer la cellule en mode code|`Esc + Y`|
|Passer la cellule en mode texte|`Esc + M`|
|Copier la cellule active|`Esc + C`|
|Coller le contenu sur la cellule active|`Esc + V`|
|Supprimer la cellule sélectionnée|`Esc + D, D`|
|Afficher tous les raccourcis|`Esc + H`|

## <div id="Les bases de Python">3. Les bases de Python</div>

### <div id="Kit de survie pour dialoguer avec sa machine">3. 1. Kit de survie pour dialoguer avec sa machine</div>

Beaucoup de blabla jusque là, maintenant, place au code !

Pour programmer, il est bien utile de comprendre quelques commandes de base pour **naviguer dans notre système de fichiers**. Elles nous seront utiles par la suite lorsque l'on souhaitera écrire le résultat de nos traitements dans des fichiers types Excel ou Word.

Pour commencer, ouvrons notre **terminal** :

<blockquote>
    <h4><em>Comment accéder à la ligne de commande de mon terminal ?</em></h4>
    <ul>
        <li>Sous <strong>Windows</strong> : Démarrez > Système Windows > Invite de commande (accessible également en tappant <code>cmd</code> dans n'importe quelle barre de navigation de dossiers).
            <br>
            <br>
            <figure>
                <img src='img/cmd.png'/>
                <figcaption><strong>Fig. 1 : </strong><em>Ouvrir le terminal sous Windows</em></figcaption>
            </figure>
            <br>
        </li>
        <li>Sous <strong>Mac OS</strong> : Applications > Terminal (accessible également en tappant <code>terminal</code> dans Spotlight).
            <br>
            <br>
            <figure>
                <img src='img/terminal_macos_app.jpg'/>
                <figcaption><strong>Fig. 2 : </strong><em>Ouvrir le terminal sous Mac OS</em></figcaption>
            </figure>
            <br>
            <br>
            <figure>
                <img src='img/terminal_macos_search.jpg'/>
                <figcaption><strong>Fig. 3 : </strong><em>Ouvrir le terminal sous Mac OS via Spotlight</em></figcaption>
            </figure>
        </li>
    </ul>
    <h4><em>Comment accéder à la ligne de commande Anaconda ?</em></h4>
    <ul>
        <li>Sous <strong>Windows :</strong> Taper <code>anaconda prompt</code> dans votre outil de recherche.</li>
        <li>Sous <strong>Mac OS :</strong> Préfixer les commandes Anaconda par la commence <code>conda</code> sur votre terminal Mac OS.</li>
    </ul>
</blockquote>

#### <div id="Naviguer dans son système de fichier">3. 1. 1. Naviguer dans son système de fichier</div>

Apprenons, avant tout, à naviguer dans notre système de fichier.

Dans le terminal, tapez la commande suivante : `cd /`. Sous Windows comme sous Mac OS, `/` représente la **racine du système de fichier**. C'est en dessous ce cette racine que se déploie toute l'arborescence de dossiers que l'on stocke sur notre machine. Pour passer de dossier en dossier, on intercalera un `/` à chaque fois.

<div class="alert alert-success" role="alert"><strong>Premier exercice :</strong> Naviguer jusqu'au bureau en partant de la <strong>racine</strong> du système de fichier.</div>

<div class="alert alert-danger" role="alert">
    <strong>Naviguer jusqu'au bureau à partir de la racine :</strong>
    <br>
    <br>
    Commençons par accéder à la <strong>racine</strong> en tapant la commande suivante : <code>cd /</code>.
    <img src="img/terminal-racine.png" alt="terminal-racine"/>
    <br>
    Utilisons la même commande <code>cd</code> pour accéder au dossier suivant : <code>cd Users</code>.
    <br>
    <br>
    On peut utiliser la commande <code>dir</code> sous <strong>Windows</strong> ou <code>ls</code> sous <strong>Mac OS</strong> pour afficher la liste des différents dossiers accessibles au niveau du dossier auquel on a accédé avec la commande <code>cd</code>.
    <br>
    <img src="img/terminal-ls.png" alt="terminal-ls"/>
    <br>
    A noter : A chaque fois que l'on navigue d'un dossier à un autre, cette information est lisible au niveau de ce que l'on appelle le <strong><em>prompt</em></strong>, à gauche de l'invite de saisie.
    <br>
    <img src="img/terminal-naviguer.png" alt="terminal-naviguer"/>
</div>

#### <div id="Ouvrir un notebook Jupyter">3. 1. 2. Ouvrir un notebook Jupyter</div>

Avant toutes choses, apprenons à ouvrir un nouveau notebook **Jupyter**.

Tout d'abord, il faut naviguer jusqu'au répertoire où l'on souhaite ouvrir son notebook Jupyter. Pour ma part, je vais créer un dossier que je vais nommer `formation_web_scraping` sur mon bureau.

En partant de la **racine**, je navigue jusqu'à mon bureau (selon votre arborescence, le chemin sera différent) :
<br>
`cd /Users/RomainM/Desktop`.

Sur mon bureau (donc, au niveau `/Users/<mon_nom_utilisateur>/Desktop`), je peux créer un nouveau dossier : 
<br>
`mkdir formation_web_scraping`.

A l'aide de la commande `dir` ou `ls`, je peux afficher tous les dossiers et fichiers accessibles au niveau actuel de l'arborescence.

Si je me situe au niveau souhaité, je peux alors lancer **Jupyter** en entrant la commande suivante :
<br>
`jupyter notebook`

Si tout a bien fonctionné, votre navigateur doit s'ouvrir à l'adresse `localhost:8888` et afficher une page qui ressemble à celle ci-dessous.

<img src="img/jupyter-premier.png"/>

On peut alors créer son premier notebook en cliquant sur le bouton `New` et choisir `Python 3`.

<img src="img/jupyter-new.png"/>

Un nouvel onglet doit normalement s'ouvrir et ressembler à cela.

<img src="img/jupyter-empty.png"/>

### <div id="Les variables et quelques fonctions essentielles">3. 2. Les variables et quelques fonctions essentielles</div>

Dans Python, les opérations que l'on réalise s'appelle des **expressions**. Une **expression** est la combinaison d'un **opérateur** et de **valeurs**. Ainsi, `2 + 2` est une **expression** dans laquelle les `2` représentent des **valeurs** et `+` un **opérateur** permettant l'addition.

Python est capable de réaliser des **calculs** de diverses sortes. On dit qu'ils s'**évaluent**, c'est-à-dire qu'ils se réduisent pour former une nouvelle **valeur**. Dans notre exemple précédent, `2 + 2` s'évalue et donne la **valeur** `4`. Comme toutes les expressions viennent à s'évaluer, à chaque fois que l'on peut entrer une **valeur**, on peut également entrer une **exrpression**.

Voilà une phrase bien compliquée pour traduire quelque chose de simple. En somme, tout cela signifie que `2 + 2` (qui est une expression) peut encore être additionné à une autre **valeur** (ou à une autre **expression**) : là où l'on peut écrire `2 + 2 + 4`, on peut également écrire `2 + 2 + 2 + 2` ou `4 + 4` ou même plus simplement, `8`.

Ici, `8` est une **valeur** mais elle est aussi une **expression**. La spécificité de cette **expression** est qu'elle n'a pas besoin de s'**évaluer** ou, du moins, elle s'**évalue** directement (il n'est pas possible d'écrire `8` plus simplement que comme cela, alors qu'il est possible d'écrire `4 + 4` plus simplement).

#### <div id="Manipuler des nombres"> 3. 2. 1. Manipuler des nombres</div>

Commençons ici par explorer comment manipuler de l'information avec Python.

In [1]:
bonjour

NameError: name 'bonjour' is not defined

Quand on lit `Error`, ce n'est jamais bon signe... Pourtant, générer des erreurs est une étape récurrente lorsque l'on travaille à l'écriture de programmes. Il ne faut, dans tous les cas, pas être inquiété par l'idée de faire des erreurs : la pire des choses qui puisse arriver si on déclenche une erreur de Python est la fin prématurée du programme qu'on lui demande de lancer.

**Jupyter** et son fonctionnement par cellule est particulièrement utile pour cela : il ne faut surtout pas hésiter à lancer des programmes quitte à générer des erreurs. Comprendre comment se déclenchent les erreurs dans Python fait partie de l'apprentissage du langage.

Lorsque Python renvoie une information de type `Error`, cela signifie que le programme **n'a pas pu finir de s'exécuter correctement**, qu'il contient des informations que Python ne peut pas reconnaître, que celles-ci ont été mal formatées ou mal structurées.

Essayons autre chose.

In [2]:
2

2

Cette fois, Python renvoie une information. Lorsqu'on tape `2`, Python nous dit que cela vaut `2`. Jusque là, tout va bien.

Essayons autre chose.

In [3]:
2 + 2

4

Okay. Python est capable d'effectuer les calculs arythmétiques de base.

Ici, `+` constitue ce que l'on appelle un **opérateur**. `2` est une **valeur**. Les **valeurs** et les **opérateurs** sont les deux briques de base de la programmation.

Les **opérateurs** sont essentiellement utilisés pour effectuer des calculs ou des tests sur des valeurs.

Essayons encore autre chose.

In [4]:
2 < 3

True

Cette fois, on effectue un **test** que l'on demande à Python de vérifier. Si le **test** est vérifié, Python nous renvoie `True`. S'il n'est pas vérifié (c'est-à-dire que la proposition est fausse), il renvoie alors `False`.

In [5]:
3 < 2

False

A présent, essayons d'aller plus loin.

Python peut "stocker" des **valeurs** dans ce que l'on appelle des **variables**. On peut se représenter le fait d'affecter une **valeur** à une **variable** comme le fait d'aposer un post-it sur un objet pour lui attacher une information ou inscrire sur un carton le type d'objet qu'il contient ("ce carton contient de la vaisselle").

On peut ainsi utiliser des **variables** pour stocker une information et la récupérer plus tard dans notre code.

Si dans d'autres langages il est nécessaire d'expliciter le fait que l'on souhaite créer une variable, cela n'est pas nécessaire en Python. Il suffit simplement d'affecter une valeur à l'aide de l'**opérateur** `=`.

In [52]:
deux = 2

Petite nouveauté ici : Python ne répond pas. Cela signifie simplement que le code a été exécuté jusqu'au bout et qu'il n'a rencontré aucune erreur. Dans le cas présent, nous avons demandé une seule chose : stocker la valeur `2` dans une **variable** nommée `deux`.

Réitérons la même opération, mais demandons maintenant d'afficher ce que contient notre **variable** fraîchement créée.

In [3]:
deux = 2
print(deux)

2


Ici, nous voyons le premier exemple d'utilisation de ce que l'on nomme une **fonction**. Les **fonctions** se définissent très simplement : il s'agit d'une série d'instructions qui prennent des **valeurs** en entrée (on parle alors d'**arguments** ou de **paramètres** dans le cas des fonctions) et renvoie des **valeurs** en sortie.

Les **valeurs** que l'on passe aux **fonctions** peuvent être des **variables**, des **valeurs** et d'autres objets mais on ne traitera pas de ces cas là pour l'instant.

En effet, voyons si on peut demander à Python d'afficher la **valeur** `2` plutôt que la **variable** `deux`.

In [4]:
print(2)

2


**Parenthèse utile :** par la suite, nous serons parfois amené à **incrémenter** des **valeurs numériques**. Cela signie que l'on ajoute simplement `1` à la valeur actuelle contenue dans la **variable**.

Illustration avec un petit exemple.

In [54]:
deux = 2
deux += 1
print(deux)

3


Ce que nous avons écrit revient en fait à écrire quelque chose qui paraît étrange lorsqu'on est habitué à l'écriture mathématique.

In [55]:
deux = 2
deux = deux + 1
print(deux)

3


A travers cet exemple, nous voyons que la **valeur** affectée à une **variable** n'est pas figée, mais peut être redéfinie à chaque fois que l'on utilise l'**opérateur d'affectation**, `=`. Ainsi, on peut très bien réutiliser le même nom de **variable** pour modifier son contenu et y en affecter un nouveau.

A présent, créons une nouvelle **variable** dans laquelle on stockera la **valeur** `3`. Et testons de réaliser une opération arythmétique à l'aide, non plus des **valeurs** mais des **variables**.

In [5]:
trois = 3
cinq = trois + deux
print(cinq)

5


Comme les **variables** stockent des **valeurs**, on peut utiliser ces-dernières, au même titre que les **valeurs** pour effectuer des opérations diverses. Si deux **variables** stockent des nombres, alors, on peut additionner, soustraire, multiplier ou diviser ces deux **variables** entre elles.

#### <div id="Quelques règles concernant la déclaration des variables">3. 2. 2. Quelques règles concernant la déclaration des variables</div>

En déclarant une **variable**, il faut s'assurer de suivre certaines règles, sans quoi, Python retournera une **erreur** :
* Le nom de la variable ne peut contenir que des caractères alpha-numériques et le caractère `_` (underscore, tiret du bas)
* Le nom de la variable ne peut pas commencer par un chiffre
* Python est sensible à la casse, c'est-à-dire qu'une variable nommée `ma_variable` n'est pas la même que `MA_VARIABLE`

Faisons quelques tests.

In [7]:
9neuf = 9

SyntaxError: invalid syntax (<ipython-input-7-827a8256bedb>, line 1)

In [9]:
neuf huit = 98
print(neuf huit)

SyntaxError: invalid syntax (<ipython-input-9-fc2484211981>, line 1)

In [8]:
neuf = 9
NEUF = 99
print(neuf)
print(NEUF)

9
99


A noter également que certains mots-clés sont **réservés**, c'est-à-dire qu'on ne peut pas les utiliser tels quels pour déclarer nos variables. Ils constituent les fonctions ou les opérateurs de base du langage. En voici une petite liste (nous évoquerons notamment les premiers et laisseront de côté une partie de ceux inclus dans la catégorie `autres`) :

|Type|Mots-clés|
|---|---|
|Opérateurs|`and`, `or`, `not`|
|Valeurs|`True`, `False`, `none`|
|Structures de contrôle|`if`, `elif`, `else`, `try`, `assert`, `except`, `finally`|
|Boucles|`for`, `while`|
|Autres|`import`, `from`, `as`, `in`, `yield`, `del`, `break`, `continue`, `pass`, `raise`, `class`, `def`, `lambda`, `with`, `global`, `nonlocal`|

Voyons de suite ce qu'il se passe si on essaie d'affecter une **valeur** à une variable qui prendrait le même nom qu'une fonction déjà existante dans Python.

In [98]:
True = 2
True

SyntaxError: can't assign to keyword (<ipython-input-98-5eea996c1291>, line 1)

In [99]:
for = 3

SyntaxError: invalid syntax (<ipython-input-99-c8ee3642ab3d>, line 1)

Selon les cas, le message d'erreur sera différent, mais une erreur sera levée par Python à chaque fois.

#### <div id="Manipuler du texte">3. 2. 3. Manipuler du texte</div>

Nous avons vu le cas des nombres. Voyons à présent comment jongler avec du **texte** (ou plus exactement, des **chaînes de caractères** car celles-ci peuvent contenir des nombres) en Python.

Nous avons vu plus haut qu'en tapant directement `bonjour` dans une cellule, Python renvoyait une erreur. En effet, lorsque l'on tape directement du texte, il s'agit nécessairement du nom de **fonctions** ou de **variables** (et d'autres objets) dont Python a déjà connaissance.

Si on tape `trois` sans indiquer au préalable qu'est-ce que l'on souhaite "stocker" dedans, Python ne comprendra pas. Lorsqu'on affecte une **valeur** à une **variable**, Python comprend que l'on souhaite créer une **variable** que l'on appelle `trois` et dans laquelle on souhaite stocker une **valeur** particulière.

Pour manipuler du texte avec Python, il faut l'encadrer avec des guillemets simples `'` ou doubles `"`.

In [9]:
trois = "trois"
print(trois)

trois


Essayons quelque chose de curieux.

In [1]:
sept = "trois" + "quatre"
print(sept)

troisquatre


S'il n'est pas possible d'additionner du texte, on peut néanmoins **concaténer** plusieurs chaînes de caractères ensemble, c'est-à-dire, coller deux chaînes de caractère l'une à la suite de l'autre (sans espace ni aucun caractère de séparation).

### <div id="Les types de données">3. 3. Les types de données</div>

Comme nous avons pu le voir, Python est capable de manipuler des **données numériques** et **textuelles**. Sur chaque type de données, il est possible d'effectuer des opérations spécifiques :
* Appliquer les opérations arythmétiques sur des nombres
* Concaténer des chaînes de caractères

Ainsi, il est très important de savoir, avant d'entamer un travail sur des données, de savoir sur quel type de données on travaille. A priori, cela paraît simple, mais au fur et à mesure des transformations et de l'avancement du code que l'on écrit, il peut être facile de se perdre rapidement !

#### <div id="Les données numériques">3. 3. 1. Les données numériques</div>

Même si ce n'est pas décisif pour notre formation, il est important de savoir que Python distingue parmi les données numériques :
* Les nombres entiers (que l'on nomme `int` en Python)
* Les nombres à virgules (que l'on nomme `float` en Python)

Les deux types de données numériques sont distingués car, comme mentionné en introduction de cette partie, cela permet à Python de savoir quels types d'opérations sont réalisables sur ces données.

Par défaut, il n'est pas nécessaire d'indiquer à Python de quel type la **variable** que l'on crée doit être (c'est ce que l'on appelle la caractéristique de **typage dynamique** d'un langage comme Python). Si cela se révèle très pratique, cela peut aussi nous jouer des tours.

#### <div id="La fonction type()">3. 3. 2. La fonction <code>type()</code></div>

Pour nous mettre à l'abris des pièges liés aux différents types de données que l'on peut croiser, la fonction `type()` est bien utile.

Rappelons-nous, une fonction est suivie de parenthèses, c'est entre les parenthèses que nous renseignons les **arguments** ou **paramètres** de la fonction. Ici, nous allons vérifier le **type de données** que contient une **variable** que l'on aura créé au préalable.

Voyons cela.

In [24]:
a = 2
print(type(a))

<class 'int'>


In [23]:
b = 2.0
print(type(b))

<class 'float'>


La fonction `type()` nous renvoie ainsi :
* Pour la variable `a`, la valeur `int`
* Pour la variable `b`, la valeur `float`

A la déclaration de ces **variables**, nous n'avons pas eu à préciser le **type de données** qu'elles contiendront. En cas d'incertitude, la fonction `type()` permettra de vérifier quel **type de données** manipule la **variable** en question.

#### <div id="Les données textuelles">3. 3. 3. Les données textuelles</div>

Comme nous l'avons vu, Python permet également de manipuler des **chaînes de caractères**.

Utilisons la fonction `type()` sur une **variable** contenant une **chaîne de caractères**.

In [15]:
phrase = "Bonjour, j'apprends à coder en Python."
type(phrase)

str

Les **données textuelles** sont nommées `str` (pour *string* en anglais).

Comme nous l'avons vu plus tôt, on peut utiliser les guillemets doubles ou simples pour entrer des **chaînes de caractère** en Python. Dans certains cas, il sera utile d'**échapper** un caractère, c'est-à-dire, non pas pour donner une **instruction** à l'interpréteur Python, mais lui indiquer que l'on souhaite travailler avec des **caractères** (c'est un peu la même logique que les **mots-clés réservés** : il faut que l'interpréteur puisse faire la différence entre ce qui constitue un ordre qu'on lui donne et une information qu'on lui demande de traiter).

Pour **échapper** un caractère, on fait précéder le caractère que l'on souhaite échapper avec un backslash (`\`).

Un exemple pour clarifier cela : mettons que l'on souhaite utiliser des guillemets doubles dans une phrase, par exemple, si le texte avec lequel on travaille est un extrait de texte qui contient des citations (introduites et fermées avec des guillemets doubles donc).

In [18]:
réplique = "John Doe : \"Je n'ai pas le temps, je dois apprendre à coder en Python\"."
print(réplique)

John Doe : "Je n'ai pas le temps, je dois apprendre à coder en Python".


#### <div id="Les conversions et les types personnalisés">3. 3. 4. Les conversions et les types personnalisés</div>

Parfois, il sera nécessaire de **convertir des données d'un type à un autre**. Ces conversions ne sont possibles que dans certains sens : en toute logique, il sera difficile de convertir une donnée textuelle en donnée numérique. Comment, par exemple, traduire notre **variable** `réplique` que nous avons déclaré un peu plus haut en **donnée numérique** ? On comprendre bien que cela n'a pas vraiment de sens.

Par contre, on peut souhaiter convertir une **donnée numérique** en **chaîne de caractère**.

Voyons cela de suite et essayons de comprendre les implications de cette conversion.

In [19]:
deux = 2
trois = 3
type(deux)

int

In [20]:
print(trois - deux)

1


Jusque là, tout va bien. Voyons maintenant comment convertir une **variable** stockant des **données numériques** en **données textuelles**. On utilise pour cela la fonction `str`.

In [21]:
deux_str = str(deux)
trois_str = str(trois)
print(type(deux_str))

<class 'str'>


In [22]:
print(trois_str - deux_str)

TypeError: unsupported operand type(s) for -: 'str' and 'str'

<div class="alert alert-success"><strong>Deuxième exercice :</strong> Essayer d'additionner une chaîne de caractères et un nombre.
<br>
<br>
Essayer de multiplier une chaîne de caractère et un nombre.</div>

Maintenant que nos variables `deux_str` et `trois_str` ont changé de **type**, on ne peut plus réaliser certaines opérations (comme la soustraction, la multiplication, etc. ; à noter que l'addition est toujours possible mais il s'agit plus précisément d'une **concaténation**, comme nous l'avons vu plus tôt), quand bien même, de notre regard d'être humain, la **variable** `deux` qui stocke le chiffre `2` sous forme de **donnée numérique** et la **variable** `deux_str` qui stocke le même chiffre sous forme de **donnée textuelle** contiennent la même information.

A l'inverse, on peut également convertir des données numériques stockées sous forme de **chaînes de caractères** pour les transformer en `int` ou en `float`.

In [16]:
a = "2"
print(type(a))
b = int(a)
print(type(b))

<class 'str'>
<class 'int'>


Passons à présent à la pratique avec un premier exercice pour appliquer tous les éléments que l'on a vu jusque là.

<div class="alert alert-success" role="alert"><strong>Troisième exercice :</strong> Mettons que l'on nous fournisse des <strong>variables</strong> contenant, sous forme de <strong>type de donnée numérique</strong>, des informations sur une date. 
<br>
<br>
On a <strong>trois variables</strong> différentes :
<ul>
    <li>Une variable <code>jour</code> qui contient l'information sous forme numérique du jour de la date</li>
    <li>Une variable <code>mois</code></li>
    <li>On l'aura deviné, une variable <code>annee</code></li>
</ul>
<br>
    <strong>L'objectif de cet exercice</strong> est d'appliquer les éléments vus jusqu'à présent pour construire, dans une <strong>nouvelle variable</strong>, l'information sur la date en <strong>concaténant</strong> chacune des variables fournies pour former une date au <strong>format textuel</strong> puisque l'on séparera aussi chaque partie de la date (jour, mois, année) avec une barre oblique (un <em>slash</em>, <code>/</code>).
<br>
<br>
    Pour récupérer les <strong>variables fournies</strong>, on exécutera la cellule ci-dessous.
</div>

In [28]:
jour = 12
mois = 10
annee = 2020

<div class="alert alert-danger"><strong>Convertir des données numériques en données textuelles et les concaténer :</strong>
<br>
<br>
Procédons en deux étapes.
<br>
<br>
Dans un <strong>premier temps</strong>, nous allons prendre chaque <strong>variable</strong> et les convertir en de nouvelles variables qui contiendront la même information mais avec un type de données, non plus <strong>numérique</strong>, mais <strong>textuel</strong>.
<br>
<pre>
<code class="python">jour = str(jour)
mois = str(mois)
annee = str(annee)</code>
</pre>
<br>
<strong>Ensuite</strong>, nous allons construire notre nouvelle variable que l'on nommera <code>date_complete</code>. Puis, on affichera le résultat pour s'assurer que nous n'avons pas fait d'erreurs avec la fonction <code>print()</code>.
<br>
<pre>
<code class="python">date_complete = jour + "/" + "mois" + "/" + "annee"
print(date_complete)</code>
</pre>
</div>

En passant au **web scraping** notamment, nous serons confrontés à d'autres types **personnalisés**. N'importe qui peut créer ses propres types personnalisés avec Python (mais ceci est hors du cadre de la formation). Lorsque l'on utilisera des **packages** Python, il sera souvent question de manipuler de nouveaux types de données propres à ces packages.

#### <div id="En résumé">3. 3. 5. En résumé</div>

Un petit schéma pour résumer tout ce dont on a parlé jusque là.

<img src="img/types_data.png" alt="types données"/>

### <div id="Les structures de données">3. 4. Les structures de données</div>

Les structures de données en Python peuvent être vus comme des groupes de **variables** telles que nous les avons définies jusque là. Jusqu'à présent, nous avons vu que les **variables** permettent de stocker des **valeurs** de différents types : nous les utilisions uniquement pour stocker des données "simples" (chaîne de caractère, données numériques).

En réalité, les **variables** permettent de stocker à peu près n'importe quel type d'information (des valeurs, des fonctions mais aussi des structures de données plus complexes).

#### <div id="Les listes">3. 4. 1. Les listes</div>

Les **listes** sont des structures essentielles dans Python. Elles permettent de stocker plusieurs **valeurs** séparées par une virgule (`,`). On peut se représenter les **listes** comme un placard qui contiendrait un certain nombre de tiroirs : chaque tiroir est distingué d'un autre par une **virgule** et chaque tiroir contient une **valeur** (chaque valeur peut être d'un type différent).

Il y a deux façons différentes de **déclarer une liste** :
* En appelant la fonction Python permettant de créer une liste `list()` et en passant chaque valeur séparée par une virgule entre parenthèses
* En encadrant les valeurs séparées par des virgules entre crochets `[]`

Voyons cela plus concrètement avec des exemples.

In [34]:
liste_1 = list((1, 2, 3))
print(liste_1)

[2, 3, 4]


In [35]:
liste_2 = [4, 5, 6]
print(liste_2)

[4, 5, 6]


In [36]:
liste_3 = ["un", "deux", "trois"]
print(liste_3)

['un', 'deux', 'trois']


In [37]:
liste_4 = ["un", 2, "trois", 4]
print(liste_4)

['un', 2, 'trois', 4]


Avec la `liste_4`, nous voyons qu'il est possible de stocker à la fois des **valeurs numériques** et des **valeurs textuelles** dans une même liste.

Voyons maintenant comment vérifier le type d'une **valeur particulière** stockée dans notre liste. Pour cela, nous allons voir comment **accéder** à une valeur au sein d'une liste.

Les **listes** sont des objets dotés de ce que l'on appelle **index**. Un **index** est une forme de code que l'on accole à la suite de la variable contenant la liste pour indiquer l'emplacement de la liste auquel on souhaite accéder. L'**index** des listes commence à partir de `0` : pour avancer d'un pas, on ajoute simplement `1` à l'index actuel.

Voyons cela avec un exemple pour clarifier ce point.

In [38]:
print(liste_4[0])

un


Ici, nous accédons à la **première valeur** de la liste `liste_4`. Nous pouvons vérifier le type de données que contient cet emplacement de la liste.

In [40]:
type(liste_4[0])

str

Maintenant, essayons d'avancer à l'emplacement suivant de la liste `liste_4`.

In [42]:
print(liste_4[1])

2


De la même façon, on peut vérifier le type de donnée que contient cet emplacement de la liste `liste_4`.

In [43]:
type(liste_4[1])

int

Nous voyons ainsi que la `liste_4` contient à la fois des données `int` et des données `str`.

Le **premier index** d'une liste est `[0]` mais il existe aussi un moyen d'accéder directement au **dernier index** d'une liste en insérant l'index `[-1]`.

Essayons de voir cela avec la liste `liste_4`.

In [44]:
print(liste_4[-1])

4


Comme la liste `liste_4` contient 4 éléments au total, on peut également accéder à cette dernière valeur en utilisant l'**index** dans le sens "normal", du premier élément au dernier.

In [45]:
print(liste_4[3])

4


En partant du **dernier élément**, on peut ainsi avancer dans le sens "inverse", du dernier élément au premier. Profitons en pour nous remémorer le contenu de la liste `liste_4` pour visualiser ce fonctionnement par **index**.

In [48]:
print(liste_4)

['un', 2, 'trois', 4]


In [46]:
print(liste_4[-2])

trois


In [47]:
print(liste_4[-3])

2


Maintenant que nous savons comment **accéder** à des éléments dans une liste, voyons maintenant comment **découper** des listes (*slicing* en anglais).

A partir d'une première liste, il est possible d'en extraire une autre liste qui sera incluera uniquement les éléments que l'on aura indiqué dans une fourchette spécifique. Pour cela, on utilise le même principe des **index**, avec une subtilité complémentaire.

Voyons cela avec un exemple.

In [29]:
liste_5 = ["zèbre", "tigre", "crocodile", "girafe", "panda"]

Si on souhaite accéder à la valeur `zèbre`, pas de problème, on sait faire.

In [30]:
liste_5[0]

'zèbre'

Maintenant, si on souhaite obtenir, à partir de la liste `liste_5`, une nouvelle liste qui ne contient que les deux premiers animaux, alors, on peut utiliser les deux points `:` pour indiquer l'intervale qui nous intéresse.

A noter que les intervales sont exclusifs, c'est-à-dire que si l'on indique que l'on souhaite obtenir tous les éléments de la liste **jusqu'au troisième**, le troisième élément en lui-même sera exclu de la sélection.

Pour rappel, les **index** d'une liste commence à la valeur `0` de l'index.

Si on souhaite récupérer les deux premiers animaux, on indiquera alors du premier (`0`) jusqu'au troisième (`2`) index.

In [35]:
liste_5[0:2]

['zèbre', 'tigre']

Si on part du début ou de la fin, le premier ou le dernier index sont facultatifs.

In [36]:
liste_5[:2]

['zèbre', 'tigre']

In [37]:
liste_5[2:]

['crocodile', 'girafe', 'panda']

<div class="alert alert-success" role="alert"><strong>Quatrième exercice :</strong> A partir de la liste <code>liste_5</code>, récupérer le <code>tigre</code> et le <code>crocodile</code> dans une nouvelle liste.</div>

<div class="alert alert-danger" role="alert"><strong>Découper une liste :</strong> Pour récupérer le <code>tigre</code> et le <code>crocodile</code>, on pourrait procéder un a un, comme dans l'exercice précédent, en récupérant chaque élément de la liste en y accédant via son index, en le stockant dans une variable temporaire, puis en construisant une nouvelle liste et en y insérant les deux variables temporaires.
<br>
<br>
Dans le cas présent, il y a tout de même plus simple : sélectionner directement les deux animaux en <strong>découpant</strong> la liste puisqu'ils se suivent dans <code>liste_5</code>.
<br>
Pour cela, on fera simplement attention à prendre en compte le fait que les bornes supérieures et inférieures de notre sélection sont <strong>exclusives</strong>.
<pre>
<code class="python">tigre_croco = liste_5[1:3]</code>
</pre>
</div>

De la même façon que l'on affecte des **valeurs** numériques ou textuelles à des **variables**, on peut modifier la **valeur** d'un élément particulier d'une liste.

Pour cela, on récupère l'emplacement de l'élément que l'on souhaite remplacer à l'aide de la **sélection par index**, puis on utilise l'**opérateur d'affectation** (`=`) pour modifier la valeur.

<div class="alert alert-success" role="alert"><strong>Cinquième exercice : </strong>Toujours à partir de la liste <code>liste_5</code>, remplacer le <code>tigre</code> par un <code>T-Rex</code>.</div>

<div class="alert alert-danger" role="alert"><strong>Modifier des valeurs dans une liste :</strong>
<br>
<br>
Pour modifier des valeurs dans une liste, on peut procéder de façon similaire à ce que l'on a pu voir plus tôt concernant les <strong>valeurs</strong> textuelles ou numériques.
<br>
<br>
La seule différence tient ici dans le fait qu'il nous faut utiliser la <strong>sélection par index</strong> des listes pour identifier l'élément que l'on veut modifier dans la liste.
<br>
<br>
Commençons donc par identifier l'emplacement du <code>tigre</code>. Ensuite, nous pouvons affecter la nouvelle valeur à cet emplacement.
<pre>
<code class="python">liste_5[1] = "T-Rex"</code>
</pre>
</div>

Mais si on souhaite supprimer une valeur d'une liste ? Dans ce cas là, l'opération est un peu différente.

Il existe plusieurs options pour réaliser ce type d'opération, mais voyons pour l'instant simplement un moyen simple : l'instruction `del`.

On peut utiliser l'instruction `del` pour supprimer un élément particulier, à partir de son **index** ou même un morceau d'une liste en la **découpant**.

In [41]:
print(liste_5)
del liste_5[1]
print(liste_5)

['zèbre', 'tigre', 'crocodile', 'girafe', 'panda']
['zèbre', 'crocodile', 'girafe', 'panda']


In [43]:
print(liste_5)
del liste_5[:2]
print(liste_5)

['zèbre', 'crocodile', 'girafe', 'panda']
['girafe', 'panda']


#### <div id="Les tuples">3. 4. 2. Les tuples</div>

Une fois que l'on comprend le fonctionnement des listes et notamment la façon d'**accéder** aux **valeurs** qu'elles contiennent, le principe est similaire pour les autres structures de données. C'est notamment le cas pour les **tuples**.

Pour comprendre la différence entre un **tuple** et une **liste**, revenons à une comparaison entre deux types de données que nous connaissons déjà : les **listes** et les **chaînes de caractères**.

Les **listes** ont la particularité d'être des objets **mutables**. Un objet **mutable** est simplement un objet qui peut être modifié. Nous avons vu plus tôt que nous pouvions modifier le contenu d'un élément d'une liste en y accédant via son **index** et en utilisant l'**opérateur d'affectation** (`=`) pour modifier sa valeur. Mais on peut également retirer (avec l'instruction `del` notamment) ou ajouter (nous évoquerons ce cas plus tard) des éléments à une liste.

Une **chaîne de caractère** a la particularité d'être **immutable**. Je vous ai caché certaines choses un peu plus tôt car il se trouve que l'on peut accéder à chaque lettre d'une **chaîne de caractère** en utilisant le même système d'**index** que pour les **listes**. De la même façon, les **tuples** sont **immutables**.

Cela ne veut pas dire que l'on ne peut pas réaffecter leur **valeur**. On peut le faire, de la même façon qu'on le fait pour les **chaînes de caractères** : on écrase totalement l'ancien contenu de la **variable** et on lui réaffecte un nouveau contenu.

Cependant, on peut essayer de modifier les lettres une à une en les réaffectant, Python renverra une erreur car le type `str` est **immutable**.

In [52]:
mot = "tigre"
print(mot[0])

t


In [53]:
mot[0] = "b"

TypeError: 'str' object does not support item assignment

<div class="alert alert-success" role="alert"><strong>Sixième exercice :</strong> Utiliser la variable <code>mot</code> et remplacer la première lettre de sa valeur pour écrire le mot <code>bigre</code>.</div>

<div class="alert alert-danger" role="alert"><strong>Combiner le découpage par index et l'opérateur de concaténation :</strong>
<br>
<br>
Commençons par découper le contenu de la variable <code>mot</code> pour exclure la première lettre.
<pre>
<code class="python">mot_2 = mot[1:]</code>
</pre>
<br>
Maintenant, utilisons l'<strong>opérateur de concaténation</strong> pour reformer le mot <code>bigre</code>.
<pre>
<code class="python">mot_2 = "b" + mot[1:]</code>
</pre>
</div>

Les **tuples** ressemblent de très près aux **listes**. Pour construire un **tuple**, on utilise des parenthèses (`()`) et non plus des crochets (`[]`).

In [58]:
tuple_1 = (1, 2, 3)
print(tuple_1)

(1, 2, 3)


Vérifions leur propriété d'**immutabilité**.

In [84]:
tuple_1[0] = 10

TypeError: 'tuple' object does not support item assignment

Si on ne peut pas modifier un élément d'un **tuple** avec la méthode d'accès via l'**index** de l'élément, on peut tout à fait réaffecter un nouveau contenu à la variable qui accueille notre tuple.

In [85]:
tuple_1 = (4, 5, 6)
print(tuple_1)

(4, 5, 6)


Contrairement aux **listes** qui peuvent contenir un seul élément, il faut préciser que l'on souhaite créer un **tuple** avec un seul élément sinon Python l'interprétera comme une **chaîne de caractère** ou une **donnée numérique** selon la valeur que l'on entre.

In [59]:
tuple_2 = ("un",)
print(type(tuple_2))

<class 'tuple'>


In [60]:
pas_un_tuple = ("un")
print(type(pas_un_tuple))

<class 'str'>


Comme les **listes** et les **tuples** sont assez similaires, on peut facilement les convertir dans un sens ou dans l'autre, un peu comme nous avons procédé plus tôt avec les `str` et les `int`.

Voyons cela, essayons tout d'abord de convertir notre `tuple_1` en liste.

In [66]:
liste_1 = list(tuple_1)
print(liste_1)
print(type(liste_1))

[1, 2, 3]
<class 'list'>


Essayons maintenant dans l'autre sens.

In [68]:
tuple_1 = tuple(liste_1)
print(tuple_1)
print(type(tuple_1))

(1, 2, 3)
<class 'tuple'>


#### <div id="Les dictionnaires">3. 4. 3. Les dictionnaires</div>

Un **dictionnaire** est une structure de données similaire à une liste : il peut stocker des valeurs de n'importe quel type (**chaînes de caractères**, **données numériques** et autres comme nous le verrons plus loin).

Contrairement aux **listes**, les **dictionnaires** ne se parcourent pas par **index**, mais par **clé**. A chaque **clé**, les **dictionnaires** associent une **valeur** : on parle en cela de **paire clé-valeur**.

Contrairement aux **listes**, les **dictionnaires** sont délimités par deux accolades (`{}`).

Voyons un exemple pour clarifier cela.

In [87]:
dico1 = {"nom" : "Doe", "prenom": "John", "age": 30, "date_naissance": "01/01/1930", "telephone": "01.02.03.04.05"}

Pour accéder aux **valeurs** contenues dans le **dictionnaire**, on utilise un principe similaire à celui des **listes**, à la différence du fait que l'on précise la **clé** correspondante à la **valeur** que l'on souhaite récupérer (et non plus son **index**). Ceci est lié au fait que les **dictionnaires**, contrairement aux **listes** sont des structures de données **non-ordonnées**.

In [88]:
dico1["nom"]

'Doe'

<div class="alert alert-success" role="alert"><strong>Septième exercice :</strong> Construire un dictionnaire associant le nom et la date de naissances de personnes.</div>

<div class="alert alert-danger"><strong>Construire un dictionnaire en associant des clés à des valeurs :</strong>
<br>
<br>
Comme nous l'avons vu plus tôt, il est très simple de construire un dictionnaire. Il suffit de définir une <strong>clé</strong> et d'y associer une <strong>valeur</strong>.
    
<pre>
<code class="python">date_naissance = {
    "Voltaire": "21/11/1994",
    "Diderot": "05/10/1713",
    "Rousseau": "28/06/1712"
}</code>
</pre>
</div>

Comme pour les **listes**, les **dictionnaires** sont des objets **mutables**. On peut utiliser leur **clé** pour accéder à leur **valeur** associée mais aussi, les utiliser pour réaffecter de nouvelles valeurs.

Voyons cela.

In [90]:
dico1["prenom"] = "Jack"
print(dico1)

{'nom': 'Doe', 'prenom': 'Jack', 'age': 30, 'date_naissance': '01/01/1930', 'telephone': '01.02.03.04.05'}


Les **dictionnaires** disposent de **fonctions particulières** que l'on appelle **méthodes** (nous parlerons un peu plus tard de la différence entre les **méthodes** et les **fonctions**). Elles permettent de synthétiser les informations que contiennent un **dictionnaire**. Parmi ces **méthodes**, on compte en particulier :
* `.keys()` : permet d'obtenir toutes les **clés** du dictionnaire sur lequel cette méthode est appelée
* `.values()` : permet d'obtenir toutes les **valeurs** du dictionnaire sur lequel cette méthode est appelée
* `.items()` : permet d'obtenir toutes les **paires clé-valeur** du dictionnaire sur lequel cette méthode est appelée

Voyons cela en détail.

Commençons par afficher les **clés** de notre `dico1` créé un peu plus tôt.

In [93]:
cles = dico1.keys()
print(cles)

dict_keys(['nom', 'prenom', 'age', 'date_naissance', 'telephone'])


Maintenant, affichons toutes les **valeurs**.

In [94]:
valeurs = dico1.values()
print(valeurs)

dict_values(['Doe', 'Jack', 30, '01/01/1930', '01.02.03.04.05'])


Enfin, affichons les **paires clé-valeur**.

In [95]:
paires = dico1.items()
print(paires)

dict_items([('nom', 'Doe'), ('prenom', 'Jack'), ('age', 30), ('date_naissance', '01/01/1930'), ('telephone', '01.02.03.04.05')])


#### <div id="List-ception... et la fonction len()">3. 4. 4. List-ception... et la fonction <code>len()</code></div>

Nous avons vu, et cela vaut pour toutes les **structures de données** (tuples et dictionnaires compris donc), qu'une liste peut contenir des **valeurs** de différents types. En réalité, les listes peuvent contenir elles-mêmes d'autres **structures de données** : rien ne nous empêche de construire une liste qui, dans chaque emplacement, contiendra une autre **liste**. A son tour, cette liste inclue dans la liste pourra à nouveau accueillir une nouvelle liste ou un dictionnaire, ou un tuple, ou plus simplement, une chaîne de caractère ou un nombre.

Voyons à présent une fonction bien utile qui nous permettra de nous y retrouver dans les possibles imbrications infinies de listes, tuples et dictionnaires...

La fonction `len()` prend en **paramètre** une **variable** de n'importe quelle type (chaîne de caractère, nombre, liste, dictionnaire, etc.). Elle renvoie, en sortie, la longueur du type de données mesuré. Cette information variera en fonction du type de données mesuré :
* Si c'est une chaîne de caractère, `len()` renvoie le nombre de caractères de la chaîne
* Si c'est une liste, un tuple ou un dictionnaire, `len()` renvoie le nombre d'emplacements de la structure de données

Voyons cela concrètement.

In [9]:
liste_a = [2, 3, "abc", list((10, 11, 12)), {"nom": "John Doe", "age": 34, "tel": "01.02.03.04.05", "mail": "john.doe@mail.com"}]
print(liste_a)

[2, 3, 'abc', [10, 11, 12], {'nom': 'John Doe', 'age': 34, 'tel': '01.02.03.04.05', 'mail': 'john.doe@mail.com'}]


In [60]:
len(liste_a)

5

La liste `liste_a` contient bel et bien 5 éléments différents. Résumons ces éléments sous forme de tableau pour mieux comprendre leur imbrication.

|Index|Valeur|Type de données|
|---|---|---|
|0|`2`|`int`|
|1|`3`|`int`|
|2|`abc`|`str`|
|3|`[10, 11, 12]`|`list`|
|4|`{"nom": "John Doe", "age": 34, "tel": "01.02.03.04.05", "mail": "john.doe@mail.com"}`|`dict`|

Tentons d'accéder à certains de ses éléments et de vérifier leur type.

In [11]:
type(liste_a[3])

list

In [12]:
type(liste_a[-1])

dict

De la même façon, on peut mesurer la taille d'un dictionnaire : `len()` renverra alors le nombre de paires **clé-valeur** qui existe dans le dictionnaire.

In [10]:
len(liste_a[-1])

4

<div class="alert alert-success" role="alert"><strong>Quatrième exercice :</strong> A partir de la liste <code>liste_a</code>, affecter à une nouvelle liste, nommée <code>liste_b</code>, les valeurs suivantes de la liste <code>liste_a</code> :
<ul>
    <li><code>abc</code></li>
    <li><code>11</code></li>
    <li><code>John Doe</code></li>
    <li><code>john.doe@mail.com</code></li>
</ul>
</div>

<div class="alert alert-danger" role="alert"><strong>Utiliser les index de structures de données pour extraire leur valeur :</strong>
<br>
<br>
Il y a de multiples opérations à réaliser pour parvenir à notre résultat. Comme d'habitude, le plus simple est de <strong>décomposer</strong> chaque étape intermédiaire en utilisant des <strong>variables</strong> pour stocker les valeurs intermédiaires de chacune de ces étapes.
<br>
Commençons par accéder à chaque élément que l'on stockera dans des variables intermédiaires. Une pratique commune parmis les développeurs Python est de nommer les <code>variables temporaires</code> avec des noms du type <code>_</code>.
<br>
<br>
Récupérons la valeur <code>abc</code> de la liste <code>liste_a</code> :
<pre>
<code class="python">_1 = liste_a[2]</code>
</pre>
<br>
Plutôt facile, non ? Passons maintenant à la valeur <code>11</code>. Ici, c'est plus délicat car il faut accéder à l'index de la liste <code>liste_a</code>, puis accéder à l'index de liste qui se trouve à cet emplacement de <code>liste_a</code>. Pour cela, on peut utiliser deux <strong>index</strong> à la suite : le premier récupérera la position de la liste incluse dans <code>liste_a</code>, le second accédera à l'indice auquel se trouve la valeur <code>11</code> dans cette <strong>sous-liste</strong>.
<br>
<pre>
<code class="python">_2 = liste_a[3][1]</code>
</pre>
<br>
A présent, il s'agira d'utiliser le même <strong>chaînage d'index</strong> (c'est-à-dire les appeler les uns à la suite des autres) pour accéder à valeur dans le dictionnaire inclu dans la liste <code>liste_a</code>. Comme nous travaillons avec un dictionnaire inclu dans une liste, le deuxième index ne sera pas numérique mais renverra à la <strong>clé du dictionnaire</strong>.
<pre>
<code class="python">_3 = liste_a[4]["nom"]</code>
</pre>
<br>
Même principe pour récupérer l'adresse mail, <code>john.doe@mail.com</code>. Essayons de faire cela différemment cette fois, tout de même. Comme le dictionnaire dans la liste <code>liste_a</code> est le dernier élément, on peut utiliser l'<strong>index inverse</strong> et appeler directement le dernier élément de la liste <code>liste_a</code>.
<pre>
<code class="python">_4 = liste_a[-1]["mail"]</code>
</pre>
<br>
Maintenant que l'on a chaque valeur stockée dans une <code>variable</code>, on peut les utiliser pour construire notre liste <code>liste_b</code>.
<pre>
<code class="python">liste_b = [_1, _2, _3, _4]</code
</pre>
</div>

Nous avons ici pris l'exemple de listes et de dictionnaires imbriqués dans une liste, mais il est également tout à fait possible d'imbriquer des listes dans des dictionnaires ou des dictionnaires dans des dictionnaires, des tuples dans des dictionnaires ou des listes dans des tuples...

Voyons un exemple avec un dictionnaire dans un dictionnaire.

In [28]:
carnet = {
    "nom": "John Doe",
    "tel": "01.02.03.04.05",
    "famille": {
        "mere": "Jannie Doe",
        "pere": "Jack Doe",
        "frere": "James Doe",
        "soeur": "Jane Doe"
    }
}

print(carnet)

{'nom': 'John Doe', 'tel': '01.02.03.04.05', 'famille': {'mere': 'Jannie Doe', 'pere': 'Jack Doe', 'frere': 'James Doe', 'soeur': 'Jane Doe'}}


#### <div id="Approfondissement sur les objets mutables">3. 4. 5. Approfondissement sur les objets mutables</div>

Maintenant que nous sommes un peu plus à l'aise avec les structures de données, essayons de comprendre plus en détail le fonctionnement des **listes** et des **tuples** pour éviter de futurs pièges.

Voyons cela d'emblée avec quelques exemples.

In [69]:
liste_a = ["a", "b", "c", "d"]
liste_b = liste_a

Ici, nous avons simplement créé une première liste `liste_a` qui contient 4 valeurs différentes.

Ensuite, nous affectons la valeur de la **variable** `liste_a` à une nouvelle **variable** `liste_b`. De prime abord, on pourrait penser qu'il s'agit de deux objets différents.

Voyons ce qu'il se passe si nous tentons de faire quelques modifications sur notre `liste_a`.

In [71]:
liste_a[0] = "z"
print(liste_a)

['z', 'b', 'c', 'd']


Jusque là, tout va bien : nous avons réaffecté au premier élément de la liste `liste_a`, une nouvelle valeur `z`.

Voyons maintenant ce qu'est devenu notre liste `liste_b`.

In [72]:
print(liste_b)

['z', 'b', 'c', 'd']


Mauvaise surprise... Même si nous n'avons pas modifié la **variable** `liste_b`, celle-ci s'est modifiée... toute seule ? Pas exactement.

En réalité, lorsque l'on a utilisé l'**opérateur d'affectation** pour affecter la **valeur** de `liste_a` à la **variable** `liste_b`, Python n'a pas créé un nouvel objet, mais pointe vers une **référence** (qui se trouve être la même). Lorsque cette **référence** est modifiée, les deux **variables** qui pointent vers cette même **référence** renvoient les mêmes valeurs.

C'est pourquoi, parler de **variables** qui "stockent" des **valeurs** est un raccourci. Dans le cas des objest mutables (comme les listes ou les dictionnaires), il faut davantage se représenter les **variables** comme des étiquettes que l'on pose sur des objets. Si un objet est similaire à un autre, on lui posera la même étiquette. Si on demande ce qu'il y a écrit sur l'étiquette, la réponse sera la même (bien qu'il y ait deux étiquettes différentes). 

#### <div id="En résumé2">3. 4. 6. En résumé</div>

Comme un schéma vaut souvent mieux qu'un long discours (trop tard pour le long discours...), voyons ici en résumé les différents points sur les structures de données que nous avons abordé.

<img src="img/structures_data.png" alt="structures données"/>

### <div id="Les structures de contrôle">3. 5. Les structures de contrôle</div>

A présent, nous allons attaquer les choses sérieuses. Dans tous les langages de programmation, il existe ce que l'on appelle des **structures de contrôle** : celles-ci permettent de construire des **algorithmes** qui définiront des formes de "recettes" à suivre pour nos programmes.

Jusqu'à présent, nous avons simplement donné des ordres à notre machine, en créant des variables, des listes, et autres types d'objets. Maintenant, nous allons pouvoir contrôler l'évolution des **valeurs** que prennent nos variables et définir, en fonctions de critères particuliers, ce qu'il s'agit de faire pour poursuivre l'exécution du programme.

Une manière usuelle de représenter le fonctionnement d'un **algorithme** consiste à en dresser l'<a href="https://fr.wikipedia.org/wiki/Arbre_de_d%C3%A9cision">**arbre de décision**</a>. Cela peut être utile, lors de l'écriture de ses premiers prototypes, de prendre une feuille de papier et un crayon pour tenter de visualiser le comportement attendu de notre programme.

#### <div id="Les opérateurs de comparaison">3. 5. 1. Les opérateurs de comparaison</div>

Tout d'abord, il s'agit de comprendre comment fonctionnent les **tests** appliqués à des **valeurs**. Ceux-ci s'appuient sur des **opérateurs de comparaison** qui se limitent à **vérifier** si une **valeur** particulière répond à des critères précis.

Il existe plusieurs **opérateurs de comparaison** :

|Opérateur|Signification|
|---|---|
|==|Est égal à|
|!=|Est différent de|
|<|Est supérieur à|
|>|Est inférieur à|
|<=|Est supérieur ou égal à|
|>=|Est inférieur ou égal à|

Une ligne contenant un **opérateur de comparaison** comparant deux **valeurs** est une **instruction** qui ne peut renvoyer que deux types de réponses :
* `True` : les critères de la comparaison sont bel et bien vérifiés
* `False` : les critères de la comparaison ne sont pas vérifiés

Voyons quelques exemples pour y voir plus clair.

In [96]:
a = 2
print(a < 1)

False


Si les **opérateurs de comparaison** sont très utiles pour travailler sur des **données numériques**, ils peuvent être utilisés également pour travailler sur des **chaînes de caractères**. Attention toutefois, comme pour les fonctions disponibles selon le **type de données** que contient une **variable**, certaines **opérations de comparaison** ne seront pas possibles.

In [97]:
phrase = "J'apprends à programmer en Python."
print(a > phrase)

TypeError: '>' not supported between instances of 'int' and 'str'

In [105]:
text = phrase
print(text != a)
print(text == phrase)
print(text == a)

True
True
False


Voyons un autre exemple dans le même esprit.

In [114]:
a = 42
b = "42"
print(a == b)

False


Dans cet exemple, les **variables** `a` et `b` ne sont pas égales car elles ne sont pas du même **type**, bien qu'elles contiennent la même information à nos yeux.

Vérifions cela avec un **opérateur de comparaison** (et voyons par la même occasion comment on peut manipuler des fonctions un peu de la même façon que l'on utilise des **variables**).

In [116]:
print(type(a) == type(b))

False


Attention tout de même avec quelques subtilités. Il existe un contenu particulier qui peut être affecté à des variables : il s'agit de la valeur `undefined`.

Une variable `undefined` existe mais ne contient pas de valeur ou, plus exactement, renvoie la **valeur** `undefined` (qui peut être vue comme une **valeur** en Python).

Ainsi, une **chaîne de caractère** vide et une **variable** `undefined` ne contiennent pas la même information pour l'interpréteur Python (mais si, de notre point de vue, il s'agit de la même chose : quelle différence entre une variable vide et une variable indéfinie ?).

Effectuons quelques tests à l'aide des **opérateurs de comparaison** pour voir ces cas particuliers.

In [113]:
undef = None
vide = ""
print(vide == undef)
print(type(undef))
print(type(vide))

False
<class 'NoneType'>
<class 'str'>


Nous voyons bien que la **variable** `undef` est de type `NoneType`, contrairement à la **variable** `vide` qui est de type `str`.

#### <div id="Les opérateurs booléens">3. 5. 2. Les opérateurs booléens</div>

Les **opérateurs booléens**, derrière l'apparence d'un nom complexe, constituent en réalité des briques très simples pour effectuer des opérations logiques de base.

Il existe trois **opérateurs booléens** dont on résume souvent les priorités sous la forme de **tables de Boole** (ou **lois de Boole**).

#### <div id="Combiner des conditions">3. 5. 3. Combiner des conditions</div>



### <div id="Les boucles">3. 6. Les boucles</div>

Liste :
* Parler des .remove()
* .append()

## <div id="Sources et références utiles">Sources et références utiles</div>

Le présent support a été réalisé à l'aide des références suivantes. Tous ne sont pas utiles aux novices, mais peuvent constituer des compléments utiles pour approfondir des notions et travailler ses compétences acquises.

* **Documentation officielle :**
    * **Python 3, URL : https://docs.python.org/3/.**
* **Manuels** :    
    * **Al Sweigart, *Automate the boring stuff with Python. Practical programming for total beginners*, San Francisco, No starch press, 2015.**: Lecture très facile avec des applications et des exemples de scripts. Il permet de partir de zéro et d'arriver rapidement à appliquer ses connaissances pour construire de petits projets bien utiles pour automatiser un certain nombre d'opérations courantes (fichiers Excel, envoi de mails, web scraping, etc.).
    * **Luciano Ramalho, *Fluent Python. Clear, concise, and effective programming*, Sebastopol, O'Reilly, 2015.** : Lecture plus difficile, gros pavé de plus de 700 pages. Il permet d'approfondir sa connaissance du langage Python, ses spécificités et sa philosophie (pythonic). C'est une sorte de mini-bible du langage.
* **Blogs** :
    * **Rishi Sidhu, *Comprehensive Python cheat sheet for beginners*, Medium, 10 Avril 2020, URL : https://medium.com/the-codehub/comprehensive-python-cheat-sheet-for-beginners-5d76bb038fa2.** :
    * **Yong Cui, *6 things to understand Python data mutability*, Medium, 8 Avril 2020, URL : https://medium.com/swlh/6-things-to-understand-python-data-mutability-b52f5c5db191.** : Un post de blog qui explique en détail les les logiques de la mutabilité avec Python. Quelle est la différence entre les fonctions `type()` et `id()` ? Comprendre la différence entre l'identité, le type et la valeur d'un objet Python.
* **MOOCs** :
    * **OpenClassrooms, *Apprenez à programmer en Python*, URL : https://openclassrooms.com/fr/courses/235344-apprenez-a-programmer-en-python.** : Un cours très complet qui permet de partir des bases pour aller jusqu'aux notions plus avancées (programmation orientée-objet, métaclasses, décorateurs, générateurs, etc.). Le cours est plutôt orienté dans une optique de développement d'application mais peut servir de socle solide pour débuter et s'exercer avec des mini-projets et des séries d'exercices et de quizz pour tester ses connaissances.

In [None]:
# test imports
import requests
from bs4 import BeautifulSoup