# 1. Qu'est-ce qu'un Notebook Jupyter ?

- un fichier avec l'extension `.ipynb`
- contient 
  1. texte à lire (Markdown)
  2. code à exécuter (Python)

## Lancer le Notebook Jupyter avec Binder

- Aller sur le dépôt github du cours : https://github.com/enury/2024-01-18-collation-intro
- Cliquer sur : ![image.png](https://mybinder.org/static/images/badge_logo.svg?v=117793ab76524046ef44e2d2d5af220c)

Cela peut prendre un petit moment pour se mettre en route. en cas de problème, des instructions sont disponibles dans sur la page d'accueil du dépôt.

**Binder**
permet de créer un environnement virtuel, aucune installation nécessaire.

![instructions de secours](images/mybinder-instructions-secours.PNG)

![image.png](images/jupyter-lab-homepage.png)

Vous voyez quelque chose comme ça ? Hourra !

## Page d'accueil

Le panneau latéral gauche montre un gestionnaire de fichier, où vous pouvez naviguer normalement dans les dossiers. 

- **Data** : les données à utiliser pour la collation, 
- **Images** : les images qui illustrent les notebooks, comme celle juste au-dessus
- **Notebooks** : les fichiers avec extension *.ipynb* 

Faites un double-clic sur `Partie1-Jupyter-python-intro.ipynb` pour ouvrir le notebook.

## Opérations de base dans un Notebook Jupyter

Un notebook est fait de **cellules**, tout comme un texte se compose de paragraphes. Les **bordures** d'une cellule apparaissent lorsque l'on clique dessus. 

Une cellule peut contenir :

1. **Texte en Markdown**: c'est ce que l'on utilise pour ajouter de la documentation ou des instructions.
2. **Code en Python**.

Voyons un peu comment cela fonctionne...

### Les actions concernant les cellules

![image.png](images/jupyter-barre1.png)

1. Ajouter une nouvelle cellule
2. Afficher le texte / exécuter le code (CTRL+Enter)
3. Changer le type de cellule

### Cellules de texte

Cette cellule contient du texte ! Essayez de double-cliquez dessus pour voir apparaître la mise en forme:

- Trois hashtags indiquent un titre de niveau trois 
- Tout ce qui se trouve entre astérisques est en *italique*
- Tout ce qui se trouve entre **deux** astérisques est en **gras**
- les tirets créent une liste

On peut modifier le texte, par exemple changez le niveau du titre en enlenvant ou ajoutant des hashtags.

Maintenant cliquez sur le bouton ![run](images/jupyter-bouton1.png) pour afficher le texte.

### Markdown

Cette syntaxe s'appelle markdown. 

Voici une *cheatsheet* [ici](https://www.markdownguide.org/cheat-sheet) et un tutoriel [ici](https://www.markdowntutorial.com/) (Attention: la traduction française peut contenir des erreurs).

### Cellules de Code

Il suffit d'un clic pour "entrer" dans la cellule et la modifier.

Puis ![run](images/jupyter-bouton1.png) pour exécuter le code !

In [None]:
# ceci est un commentaire
print("Hello world!")

#### Input et output 

La cellule de code comporte deux parties:
1. le code, dans un rectangle précédé de `[x]:`
2. le résultat du code apparaît juste en dessous

## *A votre tour !*

### Cellule de texte

1. Sélectionnez la cellule *Insérez du texte* en cliquant dessus, et appuyer sur le bouton **+** dans la barre des tâches.
2. une fois dans votre cellule, changez son type en sélectionnant _Markdown_ au lieu de _Code_. Le `[x]` à gauche va disparaître.
3. Copiez le texte suivant dans la nouvelle cellule et affichez le résultat avec le bouton ![run](images/jupyter-bouton1.png).


`# Bienvenue !`

`Voici mon **premier** notebook *Jupyter*.`



### *Insérez du texte*

### Cellule de Code

1. Cliquez sur la cellule *Insérez du code* en cliquant dessus, et appuyez sur le bouton **+** dans la barre des tâches.
2. Ne pas changer le type de cellule !
3. Copiez et exécutez le code ci-dessous

`print("Hello World!")`

Bravo, vous avez créé votre premier programme !

### *Insérez du code*

## Sauvegarde

Comme nous sommes dans l'environnement virtuel de binder, nous ne pouvons pas sauvegarder avec un simple `Ctrl+S` ou bien en cliquant sur l'icône de sauvegarde.

Pour garder une copie de vos modifications, il faut télécharger le notebook.

## Téléchargement

Il est possible de télécharger le notebook dans différents formats (menu `File > Download`). 

**Conseil** : toujours sauvegarder une copie au format `.ipynb`. De cette façon, vous pourrez à nouveau travailler sur le notebook et exporter son contenu dans de nouveaux formats si nécessaire.

Pour d'autres formats, menu `File > Save and Export Notebook As`.

## Quelques ressources (anglais)

- le site officiel de [Jupyter](https://jupyter.org/) 
- La [documentation](https://jupyter-notebook.readthedocs.io/en/stable/index.html) des notebooks

Pour une introduction orientée DH, voir les premiers chapitres (*Getting setup* et *Getting wanted*) de [The Art of Literary Text Analysis](http://nbviewer.jupyter.org/github/sgsinclair/alta/blob/master/ipynb/ArtOfLiteraryTextAnalysis.ipynb) de Stéfan Sinclair et Geoffrey Rockwell.

# 2. Introduction à Python

## Les types de données


In [None]:
# comparer
"20"+"20"

In [None]:
20+20

**Chaines de caractères "string" (str)**:
une séquence de caractères (lettres, ponctuation, espaces...)

**Nombres entiers "integer" (int) et à virgule (float)**:  
correspond aux nombres entiers (42) et décimaux (42.5). On utilise le point au lieu de la virgule en suivant les conventions anglaises.

**Booléen (bool)**: 
soit vrai `True` ou faux `False`.

In [None]:
# voir le type de donnée de quelque chose
type("20")

## Variables
Les variables servent à nommer un bout de donnée(s).


In [None]:
# voici comment on attribue une valeur à une variable
# variable_nom = variable_valeur

a = 3.14159

# on peut aussi utiliser un guillemet simple: 'hello'
b = "hello world!" 

c = b

- les variables sont utilisées pour stocker une information à utiliser plus tard
- vous pouvez imaginer que c'est une **étiquette** qui pointe vers quelque chose dans la mémoire du programme
- la valeur d'une variable peut changer
- il faut assigner une valeur avant de pouvoir utiliser une variable


In [None]:
# 1. assigner une valeur à la variable x
x = 2+3

# 2. réutiliser et modifier la variable
y = x*2
x = "+++ Divide By Cucumber Error. Please Reinstall Universe And Reboot +++"

# maintenant, quelles sont les valeurs des variables x et y ?
print(x)
print(y)

## Nommer une variable
- le nom d'une variable peut **contenir** des lettres, chiffres et le tiret bas `_`
- le nom **commence** par une lettre ou `_`
- le nom est sensible à la casse (`Test`et `test` sont deux variables differentes)
- il est préférable d'utiliser des noms évocateurs (`wordCount` ou `word_count` plutôt que `a` ou `b`)

## Une erreur ? Pas de panique !

In [None]:
a = "The answer is "
b = 42
a+b

<img src="images/python-error-1.png"  style="display:block;margin-right:auto;margin-left:auto;">

Python vous donne l'information nécessaire pour corriger l'erreur:
1. la sorte d'erreur : il y a un problème avec un type de données (`TypeError`)
2. Le message : on peut seulement concaténer (`+`) des strings ensembles, pas des strings avec des nombres
3. la ligne de code qui contient l'erreur

**Conclusion**: la variable `b` devrait être convertie en string, si on veut éliminer l'erreur de la ligne 3 `a+b`.

In [None]:
# on peut ajouter manuellement des guillemets
b = 42

# ou utiliser la fonction str()
b = str(42)

## Fonctions
C'est avec les fonctions qu'on donne des instructions à la machine !

In [None]:
# attribuer votre nom à la variable
name = ""

# demander à l'ordinateur de vous saluer
print("Salut "+name+"!")

## Fonctions - Exemples

- général : `print()`, `help()`
- types de données : `type()`, `int()`, `str()`
- compter la longueur (*length*) : `len()`

Ce qui vient entre parenthèses s'appelle l'`argument`. Les arguments sont des données transmises à la fonction pour qu'elle puisse faire son travail ! 

Les arguments peuvent être optionnels ou obligatoires.

Normalement, les fonctions renvoient quelque chose, une donnée que l'on peut stocker dans une variable pour un autre usage :

In [None]:
a = "a short string"
b = len(a)
print(b)

## Méthodes
Les méthodes sont des fonctions qui s'appliquent à un type de données en particulier :
`str.upper()`, `str.find(sub[, start[, end]])`

Ces fonctions s'appliquent à une *string* (str). Les arguments nécessaires sont entre parenthèses: `str.upper` n'a pas d'argument, mais `str.find` a besoin d'au moins un argument (*sub*) et deux sont optionnels (*start* et *end*).

Voici la liste des méthodes pour les strings : <https://docs.python.org/3/library/stdtypes.html#string-methods>

## Exemples - travailler avec les strings

In [5]:
message = "Le petit chien est sur la pente fatale!!!"

# remplace des caractères
a = message.replace("petit chien", "grand chat")

# compte les occurrences d'une sous-chaîne (substring)
b = message.count("!")

# sépare une string aux espaces blancs
c = message.split(" ")

# joindre ensemble des strings
d = "-".join(c)

# afficher une variable pour voir le résultat

## Fonctions - Exercice
Les lignes commençant par `#` sont des commentaires, ignorés par Python. Les commentaires vous donnent les instructions de l'exercice.

Complétez chaque cellule en ajoutant le code sous chaque commentaire, puis cliquez sur le bouton pour exécuter.

In [None]:
# créer une variable qui est une string


In [None]:
# créer une nouvelle variable qui transforme la première en nombre entier


In [None]:
# trouver la longueur pour chaque variable. Que se passe-t-il ?


In [None]:
# demander de l'aide à propos de la deuxième variable !


### Fonctions - résumé
- `print()`: montrer une variable
- `help()`: aide à propos de Python. Si l'argument est une variable ou une fonction, vous verrez plus d'information à propos du type de variable, ou bien comment utiliser la fonction (ex : `help(a)`, `help(len)`)
- `type()`: connaître le type d'une variable
- `int()`: convertir une variable en nombre entier
- `str()`: convertir une variable en string
- `len()`: connaître la longueur d'une variable (pour une string, il s'agit du nombre de caractères)

## Pour aller plus loin...

Pour bien comprendre le fonctionnement de *CollateX*, il peut être utile de connaîtres quelques autres types de données :

1. listes
2. dictionnaires
3. objets

###  Liste
Les éléments d'une liste sont **ordonnés** en sequence. Une string est une forme de liste.

on accède aux éléments via un nombre qui indique leur position dans la liste (**index**).

In [None]:
# parenthèses carrées
cities = ["Vienna", "London", "Paris", "Berlin", "Zurich"]
world = "world"

# l'index commence à 0
print(world[0])
print(cities[1])

In [None]:
# ajouter un item
cities.append("Grenoble")

# enlever un item
cities.remove("Zurich")

cities

In [None]:
# les listes peuvent s'imbriquer
lists = [[1, 2, 3],
        ["Rincewind", "Ridcully", "Hex"],
        [42, "don't panic!"]]

### Dictionnaire

Un dictionnaire est une collection **non ordonnée** de paires comprenant une clé et une valeur.

La **clé** (*key*) est toujours une string.

La **valeur** peut être n'importe quel type de donnée !


In [None]:
# parenthèses
book = {"title": "Good Omens",
        "author": ["Terry Pratchett", "Neil Gaiman"],
        "year": 1990
       }
# on accède à la valeur grâce à la clé
book["author"]

In [None]:
# ajouter une paire clé/valeur
book["publisher"] = "Gollancz"

# enlever une paire clé/valeur
book.pop("year")

book

### Objets

Python est un langage de programmation orienté objet. Presque tout en Python est un objet, avec ses propriétés et ses méthodes, par ex. string, entiers, listes, etc.

Nous avons vu que **1 variable = 1 type de données** (plus ou moins, il existe des types de données plus complexes comme les listes et les dictionnaires).

Mais parfois, un seul type de données ne peut pas décrire quelque chose correctement. Les **Classes** vous permettent de créer vos propres objets et d'écrire des méthodes pour vos objets.

Par exemple, vous pouvez imaginer un objet Livre qui possède 3 propriétés ou plus : titre, auteur, date...

Imaginez que vous avez beaucoup de livres. Vous pouvez désormais faire différentes choses :

- les classer par ordre alphabétique du titre
- demander combien de livres ont été écrits par l'auteur X
- demander quel livre a été publié en premier

In [None]:
# exemple d'une Classe Book

class Book:
    # quand Book() is appelé, cela créé un objet Book (une "instance")
    def __init__(self, t, a, y):
        self.title = t # ajouter le titre
        self.author = a # ajouter l'auteur
        self.year = y # ajouter l'année de publication

# la fonction Book() a besoin de trois arguments, dans le bon ordre :
#1. titre, 2. auteur, 3. date de publication
b = Book("Alice's adventures in Wonderland", "Lewis Carroll", 1865)

# contrôler l'auteur du livre qu'on vient de créer
b.author

**Pourquoi est-ce important ?**
Nous n'allons pas créer d'objets nous-mêmes, mais il peut être utile de comprendre ce concept car c'est ainsi qu'est organisé le module CollateX.

**Exercices :**
Pouvez-vous imaginer quelles propriétés devrait avoir une classe « Collation » ? De quelles autres classes aurions-nous besoin ?

## Matériel supplémentaire (anglais)

- Cours Python : [types et variables](https://www.python-course.eu/python3_variables.php)
- The Python Tutorial: [lire et écrire des fichiers](https://docs.python.org/3/tutorial/inputoutput.html#reading-and-writing-files)
- Real Python: [comprendre un message d'erreur](https://realpython.com/python-traceback/#what-are-some-common-tracebacks-in-python)
- W3Schools Python tutorial: [objets et classes](https://www.w3schools.com/python/python_classes.asp)