<div class="licence">
<span>Licence CC BY-NC-ND</span>
<span>Thierry Parmentelat</span>
<span><img src="media/inria-25-alpha.png" /></span>
</div>

# mon premier dépôt

## objectifs

* utilisation **en local seulement** pour l'instant
* créer un dépôt / dépôt à partir de rien
* créer quelques commits
* illustrer le rôle de l'index dans la création d'un commit
* voir le contenu du dépôt

## idempotence  

pour rendre ce notebook idempotent, il est important de toujours commencer dans le même répertoire..

In [None]:
# ce sera toujours notre façon de commencer
[ -f scripts/helpers.sh ] && source scripts/helpers.sh

## quelle version de git ?

en fait toutes les commandes de git sont de cette forme

```bash
git subcommand [options] [arguments]
```

In [None]:
# en particulier pour savoir la version de `git` qui est installée
git version

## créer un dépôt git

la première commande à connaître est celle qui crée un dépôt vide:

`git init`

mais avant, toujours pour être idempotent, je vais partir d'un répertoire entièrement vide

In [None]:
# les détails techniques de cette cellule ne sont pas importants
# c'est simplement pour permettre de recommencer à zéro 

# cd veut dire 'change directory'
# on se met dans le répertoire des notebooks
cd $TOP

# pour pouvoir recommencer le scénario depuis le début
# je nettoie complètement ce qu'on a pu faire précédemment
if [ -d my-first-repo ]; then
    echo "on repart d'un directory vide"
    rm -rf my-first-repo
fi

# on le crée
mkdir my-first-repo

# on va dedans
cd my-first-repo

Il n'est pas important de comprendre cette cellule en profondeur, ce sont des détails qui nous permettent de rendre le scénario plus facilement rejouable. En substance ici, on s'assure simplement de repartir d'un répertoire vierge, qui s'appelle `my-first-repo` et qui est dans le répertoire des notebooks.

## on est bien dans un répertoire vide

Si on regarde bien partout (l'option `ls -a` montre **tous les fichiers** même ceux dont le nom commence par un point) :

In [None]:
ls -a

La commande `ls` est une commande Unix; sur Windows on peut utiliser à la place `dir`. 

## pour **transformer ce répertoire vide en dépôt git**

In [None]:
git init

## la zone de travail de git est créée dans `.git`

regardons à nouveau le répertoire (l'option `ls -F` montre le type des entrées)

In [None]:
ls -aF

ici vous voyez que les trois entrées sont des répertoires :  

* `.` c'est le répertoire courant,  
* `..` est son répertoire père, et  
* `.git` est le répertoire de travail de `git`

## ne plus pensez à `.git`

maintenant que vous avez vu ce répertoire `.git`, on va s'efforcer de **l'oublier entièrement**, car ce n'est qu'un détail d'implémentation

il est beaucoup plus important de se familiariser avec le modèle mental des objets de git, que de savoir en détail comment tout ça est rangé sur le disque.

In [None]:
# malgré la présence de ce directory .git
# si on demande la liste des fichiers 'normaux' 
# on voit un répertoire vide
ls 

## premier commit

les **principaux objets** dans ce modèle mental, ce sont les `commit`s. 

comme mon répository est vide, je n'ai encore aucun commit,  
je le vérifie en visualisant la liste des commits :

In [None]:
# git log permet de lister les commits
# il se plaint, c'est normal 
# car on n'a encore créé aucun commit
git log

## l'index

* l'index est aussi appelé *stage*, il contient des **modifications pendantes**
* sa raison est uniquement de **préparer** le prochain commit
* on ajoute des changements dans l'index avec `git add`
* lorsqu'on est satisfait on fait `git commit` 
  * qui crée un nouveau commit
  * l'index devient donc identique au nouveau commit

![](media/repo-contents-3-add-index-commit.png)

Une fois qu'un changement a été fait - le plus souvent manuellement - sur un fichier source : `git add` permet de mettre le changement dans l'index, et une fois qu'on est satisfait du contenu de l'index, `git commit` crée un commit identique à l'index.

## création d'un commit

![](media/changes-partial.png)

dans un premier temps, on fait un changement, disons à partir d'un éditeur de texte ; ce changement `δ` se trouve donc entre l'espace de travail et l'index  

avec `git add` on promeut e changement dans l'index, `δ` apparaît alors dans les différences entre l'index et le dernier commit  

enfin avec `git commit` on crée un commit qui reprend tous les changements ajoutés dans l'index; juste après le commit, l'index redevient donc identique au dernier commit.

nous allons créer un premier commit; pour avoir quelque chose à y mettre, on crée un premier fichier `README.md`, avec quelques lignes dedans, et une faute d'orthographe :

In [None]:
# là je triche, je crée README.md par script 
# imaginez que j'ai utilisé un éditeur de texte
$SCRIPTS/do create-readme

# voyons ce fichier
cat README.md

## `git status`

pour savoir où on en est,  
la commande `git status` nous indique surtout :

* en rouge les fichiers qu'on pourrait ajouter à l'index
* en vert les changements présents dans l'index (ici aucun)

![](media/changes-reference.png)

In [None]:
# on a pour l'instant une différence 
# entre l'espace de travail et l'index: en rouge
git status

La commande `git status` est utile car elle résume où on en est, en indiquant notamment la branche courante (un peu de patience), les différences entre espace de travail et index (en rouge, ce qu'on pourrait `add`er), et les changements entre index et dernier commit (en vert, ce qui irait dans le prochain commit).

Ici par exemple le fichier `README.md` n'est pas connu de `git`, on pourrait l'ajouter (c'est d'ailleurs ce qu'on va faire tout de suite), il apparaît en rouge.

Comme pour toutes les commandes du système, de très nombreuses options sont disponibles, à consulter dans la documentation; vous pouvez par exemple faire pour cela `git status --help`

`git add`

pour créer un commit, il faut d'abord **ajouter**  
avec `git add` des changements dans l'index,  
pour **préparer** le contenu du commit :

In [None]:
git add README.md

**remarque sur la granularité**

* on peut ajouter dans l'index **ligne par ligne** si on veut
* facile avec un GUI (Graphic User Interface)
* fastidieux avec une CLI (Command Line Interface)
  * ici on se contente d'ajouter d'un coup  
    tous les changements d'un fichier

**`git status` (après `add`)**

In [None]:
# notre différence est maintenant montrée en vert
git status

## `git commit`

et maintenant nous pouvons créer notre premier commit, sans grande surprise, avec la commande `git commit`

en pratique on fait juste `git commit` et ça ouvre un éditeur pour saisir le message; mais ici dans le notebook je ne peux pas passer par un éditeur, du coup je donne le commentaire sur la ligne de commande :

In [None]:
# en pratique vous pouvez faire simplement 
# git commit
# et écrire le commentaire avec un éditeur de texte
git commit -m 'my first commit: added README.md'

**après le premier commit**

pour voir la liste des commits: `git log`

In [None]:
# pour l'instant on n'en a qu'un
git log

**après le commit - suite**

naturellement après un commit, le contenu de l'index est égal à celui du commit courant (celui qu'on vient de créer)

In [None]:
# il n'y a plus de changement dans l'index
git status

## la branche `master` 

remarquez aussi que `git status` nous dit : 

> `on branch master`

on en reparlera, mais pour démystifier un peu :

* `master` est le nom de la **branche courante**
* elle désigne le dernier commit
* et elle avance au fur et à mesure  
  de la création des commits

## index et abus de langage

**ATTENTION** car:

* il y a deux termes **interchangeables** *index* et *stage* 
  * ils désignent ce même concept de 'zone tampon'
* et aussi, lorsqu'on parle de l'index
  * parfois on fait référence à **son contenu**  
    comme dans: "après un commit, l'index est égal au nouveau commit"

  * parfois on fait référence **aux changements** par rapport au dernier commit  
    «l'index est vide» ⇔ «l'index correspond au dernier commit»

L'endroit (totalement abstrait naturellement) où on stocke les changements en vue du commit s'appelle indifféremment l'***index*** ou le ***stage*** - et oui, ce serait mieux s'il n'y avait qu'un nom, mais bon, c'est comme ça :)

## c'est quoi un commit ?

pour essayer de définir un commit de manière formelle,  
un commit peut être vu comme :

* la **liste** et les **contenus**  
  des **fichiers** qui constituent une version,

* le ou les parents: les **commits** dont ce commit **dépend**  
  (pour ce premier commit, il n'y a pas de parent)

* des métadata :  
  l'auteur,  
  un commentaire en texte libre, …  
  
pour l'instant c'est un peu abstrait, on en reparlera..

## voir l'historique

l'historique d'un répository git,  
c'est donc principalement la liste des commits :

In [None]:
git log   

## codage hexadécimal

pour rappel, lorsqu'on utilise la base 16 pour représenter les entiers, on a besoin de 16 chiffres (ou digits)

on a choisi `0`, .. `9`, `A`, `B` .. `F` - indifféremment en majuscule ou en minuscule

où `A` = 10 et `F` = 15 

ainsi par exemple `FF = 15*16 + 15 = 255`

## chaque commit a son sha-1

comme vous le voyez, notre commit a un identifiant (en orange), assez long (40 chiffres hexadécimaux, donc des caratères de 0 à F) pour qu'on soit sûr qu'il est unique; on appelle ça le **hash** du commit, ou encore son **sha1** - prononcer *chat-ouane*.

40 caractères hexadécimaux, ça fait $40 * 4$ bits, donc $2^{160}$ hash différents; de l'ordre de $10^{50}$.

en général, seulement 7 caractères suffisent pour disambigüer les commits dans un dépôt; en effet il y a $2^{7*4} = 2^{28} = 268435456$  
suites de 7 digits hexadécimaux.

signalons tout de suite une présentation qui sera plus pratique, où chaque commit fait l'objet d'une ligne du rapport

In [None]:
# on reparlera de git log tout à l'heure
git log --oneline

la mention `(HEAD -> master)` nous indique que :

* ce commit est le commit courant (`HEAD`)
* la branche `master` est actuellement posée sur ce commit

## un second commit

utilisons la même technique pour créer un deuxième commit; cette fois nous allons créer un deuxième fichier `LICENSE`, et également modifier le premier `README.md`.

In [None]:
$SCRIPTS/do create-license

In [None]:
# voici le contenu du fichier LICENSE
cat LICENSE

In [None]:
# comme on veut que ce nouveau 
# fichier fasse partie du deuxième 
# commit, on l'ajoute
git add LICENSE

In [None]:
# voilà ce que nous montre alors "git status"
git status

In [None]:
# maintenant je corrige la faute d'orthographe

# de nouveau, normalement on fait ça avec un éditeur
# ici j'utilise un outil en ligne de commande, peu importe...
$SCRIPTS/do fix-readme 

In [None]:
# voici maintenant git status
# remarquez ce qui est en vert et ce qui est en rouge
# qui correspond aux deux étages
git status

dans l'immédiat je veux que la correction  
du typo soit dans le prochain commit;  

je commence par regarder ce qui a changé  
(depuis le dernier commit donc)

In [None]:
git diff

In [None]:
# c'est bien ce que 
# je voulais faire
# donc je peux ajouter
# tout le fichier 
git add README.md

La sortie de `git diff` contient pas mal de sucre pas forcément lisible, à destination notamment d'outils graphiques. Entre autres la ligne `@@ -1,4 +1,4 @@` signifie qu'on nous montre ici les lignes de 1 à 4 du fichier avant et après le changement.

In [None]:
# regardons à nouveau git status
# tout ce qui est en vert sera dans le prochain commit
git status

In [None]:
# tous les changements montrés EN VERT vont faire partie du prochain commit
git commit -m "added LICENSE, changed README.md"

## afficher le contenu du repository

lister le contenu du repository, c'est donc afficher les commits qui sont dedans

on l'a vu, le premier outil pour faire cela s'appelle `git log`

In [None]:
git log

In [None]:
# le format par défaut de git log est vite encombrant, si on veut condenser
git log --oneline

## `git log --graph`

prenons aussi l'habitude d'appeler `git log` avec l'option `--graph`

In [None]:
git log --oneline --graph

pour l'instant ça ne fait que d'ajouter cette petite étoile sur le coté gauche, mais c'est ça qui nous permettra de suivre les branches lorsqu'on en verra

## raccourci

In [None]:
# on peut facilement se définir des raccourcis
git config --global alias.l "log --oneline --graph"

# du coup c'est plus rapide
git l

In [None]:
# pour voir la documentation complète
# de git log (attention très très long !)
# tapez 
# git log --help

## la branche `master`

In [None]:
git l

vous remarquez aussi que le dernier commit est affiché avec le label `(HEAD -> master)`  
cela signifie que 

* la branche `master` est actuellement sur ce commit, 
* et que c'est la branche courante (`HEAD` désigne la branche courante)

c'est aussi ce que nous dit `git status` d'ailleurs :

In [None]:
git status

à ce stade de notre avancement, le repository possède une seule branche qui s'appelle `master`;  
c'est le nom par défaut, lorsqu'on crée un dépôt vide on se trouve sur la branche `master`

et donc naturellement, comme pour l'instant on n'a qu'une seule branche,
c'est aussi la branche courante (`On branch master`)

## la branche courante

à quoi sert cette branche ? pour nous pour l'instant, on peut se contenter de remarquer que

* la branche désigne un commit
* ce commit sera le *point de départ* du prochain commit (son parent);  
* et aussi, la branche courante *avance* en même temps que nos commits;  
  après le premier commit, `master` désignait le premier commit, après le second commit elle désigne le second commit.

on verra qu'on peut très facilement créer plusieurs branches, et basculer facilement entre les différentes évolutions du code, qui peuvent tout à fait se faire en parallèle; mais n'anticipons pas…

## créons quelques fichiers

In [None]:
# on crée deux fichiers; les détails importent peu
$SCRIPTS/do create-code

In [None]:
$SCRIPTS/do create-doc

In [None]:
# leur contenu
cat factorial.py    

In [None]:
cat factorial.md

à ce stade nous avons donc :  
deux fichiers dans le (dernier commit du) dépôt  
et 2 fichiers nouveaux (inconnus de git) 

In [None]:
# les fichiers dans le commit courant 
# (en fait dans l'index mais ici c'est pareil)
git ls-files

In [None]:
# sur le disque
ls -1

et deux commits

![](../media/repo-2c-1b.png)

## deux autres commits

l'intérêt de procéder en deux temps lorsqu'on fabrique un commit, c'est qu'on ne veut pas toujours mettre dans le prochain commit **tout ce qui a changé**

imaginons par exemple que je touche aussi le README:

In [None]:
# un changement dans README.md
echo 'commit #3' >> README.md

In [None]:
git status

**commit #3**

ici par exemple si je veux créer mon troisième commit:

* **avec** le changement dans README.md
* **avec** le code python `factorial.py`
* mais **sans** le markdown de `factorial.md`

je peux le faire comme ceci

In [None]:
# je prépare le commit 
git add README.md factorial.py 

In [None]:
# je fais le commit
git commit -m "new code file, tweak README"

In [None]:
git l

**commit #4**

et je crée un quatrième commit, qui modifie à nouveau le readme, et ajoute la doc 

In [None]:
# un changement dans README.md
echo 'commit #4' >> README.md

In [None]:
# ici git status me montre que j'ai 
# (*) le fichier README.md modifié 
# (*) le fichier factorial.md
#     qui n'est pas dans le dépôt
git status

In [None]:
# si j'ajoute les deux fichiers README.md et factorial.md
# je prépare un commit qui contient 
# tout ce qu'il y a dans mon répertoire de travail
git add README.md factorial.md

In [None]:
# du coup tout est en vert
git status

In [None]:
git commit -m "adding markdown, we now have 4 files"

In [None]:
git l

remarquez enfin que la branche master est toujours placée sur le tout dernier commit  
c'est parce que c'est notre branche courante, elle suit les commits au fur et à mesure

pour rappel, ce qu'on avait observé après deux commits :
![](../media/repo-2c-1b.png)

et maintenant
![](media/repo-4c-1b.png)

## le nom symbolique `HEAD`

le nom `HEAD` désigne **toujours** le commit courant

on va voir bientôt comment créer d'autres branches, et changer de branche, mais dans tous les cas `HEAD` désigne le commit courant

## repository *vs* espace de travail

à ce stade, il est crucial de bien faire la différence entre :

* les **fichiers** présents dans le répertoire, qui appartiennent à ce qu'on appelle l'**espace de travail**
* les **commits** appartiennent quant à eux au **repository**  
  (concrètement dans le répertoire `.git`)

* les commits contiennent naturellement des fichiers
* mais on n'a pas forcément correspondance parfaite 
  entre espace de travail et dernier commit

  * ex. fichier en cours de modification
  * fichiers présents mais pas ajoutés dans git

## maintien en cohérence

le plus souvent, le workflow consiste pour vous à modifier les fichiers, et une fois que vous êtes satisfait, à ranger ces nouvelles versions des fichiers dans un commit - en passant par l'index.

    espace de travail → index → dépôt

## maintien en cohérence

 
mais il faut bien comprendre, et le plus tôt sera le mieux, que dans certains cas, c'est l'**inverse qui se produit**

    dépôt -> espace de travail

par exemple:

1. un collègue a publié une nouvelle version sur github
2. vous allez la chercher et vous l'intégrez à votre travail
3. naturellement vous voulez que vos fichiers reflètent ce changement

## l'éditeur n'est pas le seul acteur à changer les fichiers

du coup, on ne **peut plus** partir du principe que c'est seulement l'éditeur qui change vos fichiers

c'est pourquoi les éditeurs modernes savent se rendre compte lorsqu'un fichier en édition a changé sur le disque

**ATTENTION** si vous utilisez un éditeur qui ne signale pas ce genre de cas

## fichier éditable, commit immutable

* les fichiers qui sont dans votre espace de travail,  
  comme `README.md` et `LICENSE`, sont des fichiers usuels,  
  vous pouvez donc les modifier, bien entendu

* par contre, une fois qu'un commit est créé,  
  on ne **peut plus le modifier**:  

  * bien sûr, si on s'est loupé on peut toujours revenir en arrière et créer **un autre** commit
  * mais on ne peut pas modifier un commit qui a été créé 

## graphe des commits

un point important pour comprendre la logique des outils git :

* un commit contient notamment des références vers  
  le⋅s commit⋅s *parent* sur lesquels il a été construit 

* comme c'est un immutable, on ne peut pas le modifier  
  a posteriori pour lui ajouter la référence inverse

* le graphe est donc orienté dans un seul sens
* en partant de mon HEAD actuel je peux parcourir les 4 commits
  * mais en partant du premier commit je ne **peux pas**  
  "remonter" vers le HEAD actuel

## navigation dans les commits

**NOTE** 

* on va introduire ici une notion plutôt avancée
* j'en ai surtout besoin dans le cours pour que le scénario soit répétable 
* il n'est pas forcément utile de retenir les détails
* juste savoir que ça existe

## navigation dans les commits

`git` propose un mécanisme permettant de "naviguer" dans le graphe de commits

* la forme en `^`
  * `HEAD^` est le (premier) parent
  * `HEAD^2` est de deuxième parent
  
* la forme en `~`
  * `HEAD~` est le parent
  * `HEAD~2` est le parent du parent


![](media/navigate-in-commits.png)

Naturellement le `X` du diagramme peut être lui-même, en pratique : un sha-1, un nom de branche, de manière générale toute forme qui désigne un commit.

In [None]:
# par exemple si je parcours les commits en partant de HEAD
# j'en vois donc 4
git l HEAD

In [None]:
# si je pars de HEAD^, je n'en plus que 3
git l HEAD^

In [None]:
# et ainsi de suite
git log --oneline HEAD^^

il y a plein d'autres façons de désigner un commit, notamment bien sûr par son *sha-1*; mais bon ne nous égarons pas

## résumé

les points à retenir:

* on crée un dépôt local avec `git init`
* on crée un commit en deux temps:
  * `git add` pour accumuler des changements dans le *stage* ou l'*index*
  * `git commit` pour créer le commit
  * le commit est créé le long de la branche courante
* un dépôt est essentiellement un ensemble de commits
  * liés entre eux par un graphe acyclique
* un commit peut être identifié par
  * le nom spécial `HEAD`
  * ou un nom de branche
  * ou un SHA-1
  * ou comme l'ancêtre d'un commit avec les notations `HEAD^` ou `master~2`

## état

à toutes fins utiles, en sortie de ce premier scénario, nous sommes dans cet état :

In [None]:
git l --all