## Objectif

L'objectif de ce notebook est de vous présenter l'outil ```git```. Cet outil permet de gérer la version des fichiers d'un projet réalisé en équipe.

Pour résumer, ```git``` permet :
- de sauvegarder l'historique des modifications de fichiers
- le développement collaboratif
- de tracer les actions des développeurs
- de gérer les différentes version du logiciel (version de test, de production, ...)

En pratique cela permet donc :
- de revenir à une version précédente d'un fichier
- de permettre à plusieurs développeurs de travailler sur un même fichier en même temps, et de le fusionner automatiquement
- de savoir qui a fait quelle modification
- d'avoir une version du logiciel en production (utilisé par les clients), une version de développement, une version de test, ...

Pour comprendre d'où vient le nom ```git```, voici l'explication obtenue sur Wikipedia :
```
The name "git" was given by Linus Torvalds when he wrote the very
first version. He described the tool as "the stupid content tracker"
and the name as (depending on your way):

 - random three-letter combination that is pronounceable, and not
   actually used by any common UNIX command.  The fact that it is a
   mispronunciation of "get" may or may not be relevant.
 - stupid. contemptible and despicable. simple. Take your pick from the
   dictionary of slang.
 - "global information tracker": you're in a good mood, and it actually
   works for you. Angels sing, and a light suddenly fills the room.
 - "goddamn idiotic truckload of sh*t": when it breaks
```



<br><hr>

## Fonctionnement

`git` comprend trois composants essentiels:
- working tree
- repository
- index

Le **working tree** est un dossier contenant l'ensemble des fichiers sur lequel vous travaillez (version courante de vos fichiers). 

L'**index** est un fichier binaire contenant la liste des fichiers appartenant à votre projet dont vous voulez suivre l'évolution. Dans notre projet, nous allons suivre l'évolution des notebook jupyter, mais pas l'évolution des fichiers de sauvegarde des notebook. Il faudra donc indiquer les fichiers du working tree à suivre ou non.

Le **repository** est un dossier caché contenant toutes les version de vos fichiers dont vous suivez l'évolution. Un repository peut être local, donc sur votre machine, ou bien distant, sur un serveur. Généralement, un développeur a un repository local et un repository distant. Ainsi, il peut réaliser plusieurs modifications sur son repository local dans la journée (développement, test, débuggage, ...) et envoyer toutes les modifications sur le repository distant en fin de journée (une version stable sans bug).

La figure ci-dessous explique le fonctionnement de `git` en faisant apparaitre quelques commandes :

<img src="figures/git-transport.png">

En pratique, voici comment cela fonctionne :
1. le développeur créé un fichier dans son working tree
2. il ajoute cette modification dans son index (commande ```add```). Le nouveau fichier est donc ajouté dans l'index
4. il réalise un ```commit``` pour ajouter les modifications de l'index dans son repository local
5. il réalise un ```push``` pour pousser les fichiers du repository local vers le repository distant

Imaginons que le développeur parte en vacances : quand il revient ses collègues ont réalisé plein de modifications sur le code, modifications qui ont été poussées sur le repository distant. Notre développeur a donc besoin de récupérer les mises à jour :
1. le développeur récupére tous les fichiers du repository distant vers son repository local via la commande `fetch`
2. les fichiers récupérés sont fusionnés avec les fichiers déjà présent dans le repository local avec la commande `merge`

Pour aller plus vite, le développeur aurait pu utiliser la commande `pull = fetch + merge`.

## Etat des fichiers

Un fichier inclus dans un projet git peut avoir les états suivants :
- `untracked` : le fichier n'est pas suivi par git. Il faut utiliser la commande `add` pour l'ajouter dans l'index
- `modified` : le changement apparait simplement dans le working tree
- `staged` : le changement est noté comme devant faire parti du prochain commit
- `commited` : le fichier modifié est inclus dans le local repository



<br><hr>

## Création d'un repository distant

Dans cette section, vous allez créer votre propre repository et réaliser les actions `git` les plus courantes.

### Exercice
1. connectez vous à gitlab.univ-nantes.fr
2. créez un nouveau projet "Test"

La première étape est réalisée, vous venez de créer le repository distant. Il est maintenant nécessaire de créer une copie de ce repository, le repository local, sur votre PC.


## Création d'un repository local

### Exercice
1. lancez une console (Windows) ou bien un terminal (Ubuntu)
2. vérifiez que `git` est installé en tapant `git`
3. positionnez vous dans le dossier qui contiendra votre projet git
4. sur gitlab, récupérez sur la page principale de votre projet, son adresse `https`
5. exécutez la commande : `git clone https://gitlab.univ-nantes.fr/xxxxxxx/test.git monProjet` où `monProjet` est à remplacer par le nom de dossier que vous voulez
6. vérifiez qu'un dossier `monProjet` contenant un dossier `.git` a bien été créé

Félicitation, vous venez de créer votre repository local

## Un peu de configuration

Afin d'éviter que `git` vous demande tout le temps votre nom d'utilisateur, il faut configurer votre projet avec les commandes suivantes :
```
git config --global user.name username 	
git config --global user.email email
```

L'option `--global` généralise la commande à tous vos projets `git`.

### Exercice
1. configurez votre nom d'utilisateur `git config user.name "votreLogin"`
2. configurez votre email `git config user.email "prenom.nom@etu.univ-nantes.fr"`




<br><hr>

## Modification d'un repository

Nous allons maintenant ajouter des fichiers dans le working directory, les ajouter dans l'index, les modifier et les ajouter dans le repository local, puis pousser les changements du repository local vers le repository distant.

### Exercice
1. ajoutez un fichier texte `test.txt` dans votre repository local (commande `touch test.txt`)
2. exécutez la commande `git status`. Votre fichier apparait bien en `untracked` ?
3. ajoutez votre fichier dans l'index via la commande `git add test.txt`
4. exécutez la commande `git status`. Votre fichier est noté comme staged ?
5. ajoutez votre fichier dans le local repository via la commande `git commit test.txt -m "ajout de test.txt"`. L'option `-m` permet d'ajouter le commentaire lié au commit. Un tel commentaire est obligatoire et sert à indiquer aux développeurs les réalisations que vous avez réalisé sur le projet
6. exécutez la commande `git push` pour recopier le repository local vers le repository distant
7. sur gitlab, vérifiez que votre fichier est bien apparu

Vous pouvez maintenant réaliser autant de modifications que vous le souhaitez sur ce fichier. Tous les commits seront tracés avec git.

### Exercice
1. modifiez votre fichier `test.txt`
2. affichez le status de ce fichier
3. exécutez un commit 

## Gestion des conflits

Un projet `git` est un projet collaboratif: plusieurs développeurs réalisent des modifications en parallèle sur le même projet, et parfois sur les mêmes fichiers. Ce qui implique des gestions de conflits : ```git``` ne peut pas toujours résoudre les conflits automatiquement.

### Exercice
1. choisissez un autre binôme pour réaliser ce test
2. inscrivez le deuxième binôme à votre projet `Test` en tant que `Maintener` (afin de pouvoir modifier la branche `master` - un `developer` n'a pas les droits par défaut pour modifier la branche `master`)
3. pour le deuxième binome, connectez vous au projet git du premier binôme
4. vérifiez que votre fichier `test.txt` fait plus de trois lignes (et cela n'est pas le cas, ajoutez des lignes)
5. réalisez des modifications sur les dernières lignes de votre fichier `test.txt`
6. pour le deuxième binôme, réalisez des modifications de `test.txt` en début de fichier
7. pour le premier binôme, réalisez un commit et un push
8. pour le deuxième binôme, réalisez un commit et un push. Si le push est refusé, faites un `git pull`
9. y a-t-il eu un problème pour la fusion des modifications ? Avez vous une ligne ressemblant à `You have unmerged paths` ?
10. pour les deux binômes, recommencez à l'étape 5, mais cette fois en réalisant des modifications toutes les 2 lignes sur le fichier `test.txt` 
9. y a-t-il eu un problème pour la fusion des modifications ?

Vous avez dû rencontrer un conflit à l'exercice précédent. Nous allons voir comment régler un tel conflit.

### Exercice
1. faites en sorte d'obtenir un conflit sur un de vos fichiers
2. exécutez la commande `git status`. Avez vous une ligne ressemblant à `You have unmerged paths` ?
3. ouvrez le fichier ayant un conflit. Le fichier doit contenir du texte ressemblant à ça :
```
If you have questions, please
<<<<<<< HEAD
du texte
=======
un autre texte
>>>>>>> branch-a
```

```git``` vous présente les zones qu'il n'a pu fusionner tout seul. `HEAD` représente votre version locale et `branch` la version du repository distant. Voyons voir comment résoudre le conflit: la solution consiste à réaliser les mêmes étapes que précédemment. Il faut ajouter le fichier dans l'index et réaliser un commit.

### Exercice
1. exécutez la commande `git add test.txt`
2. réalisez un commit avec la commande `git commit -m "Résolution du conflit"`


## Pour allez plus vite

Voici quelques commandes utiles pour aller plus vite pour réaliser un commit :
- ajout de tous les fichiers modifiés ou nouveaux dans l'index 
`git add --all`
- ajout dans l'index de tous les fichiers modifiés ou nouveaux via la commande commit
`git -a -m "message" `
- mémorisation de votre login/mot de passe pour le push:
```
> git config credential.helper store
> git push
> git config --global credential.helper 'cache --timeout 3600'
```
La première commande permet d'activer la sauvegarde de votre login/mot de passe dans le cache. Le push réalisé sauvegarde votre login/mot de passe dans le cache. La dernière commande permet de vider le cache après une heure.

## Gitignore

Il nous reste à voir comment indiquer que des fichiers ne soient pas tracés par le gestionnaire de version. 

`git` utilise des fichiers `.gitignore` pour indiquer quels sont les fichiers à ne pas tracer. Voici un exemple de fichier `.gitignore`:
```
# ignore the checkpoints
.ipynb_checkpoints/

# ignore html files
*.html

# ignore the file test.txt
test.txt

```

Dans cet exemple, il est indiqué que le dossier `ipynb_checkpoints` contenant les checkpoints de vos futurs notebook ne seront pas historisés par `git`.

#### Exercise
1. créez un fichier `nePasTracer.txt` et un dossier `dossierANePasTracer` dans votre projet
2. créez un fichier `.gitignore` (commande `touch .gitignore`)
3. complétez le fichier `.gitignore` pour ne pas tracer le fichier et le dossier de la question 1
4. faites un commit/push de l'ajout du fichier `.gitignore`
5. réalisez des modifications de `nePasTracer.txt` et du dossier `dossierANePasTracer` (en ajoutant des fichiers dedans)
6. vérifiez que `git` ne trace pas les modifications (`git status`)





<br><hr>

## Les branches

```git``` permet d'avoir plusieurs versions d'un même projet. Une version d'un projet peut être stockée dans une branche, ```branch``` en anglais. Voici quelques exemples pratiques montrant l'utilité d'une branche :
- une entreprise a généralement une version en cours de développement de son logiciel et une version en production, la version utilisée actuellement par ses clients. Tout nouveau développement ne doit pas gêner les clients qui utilisent le logiciel actuel.
- un développeur peut s'occuper d'une tâche de correction de bug en créant sa propre branche. Quand le bug est corrigé, il peut réaliser une fusion entre sa version et la version en production
- un développeur peut s'occuper d'une tâche d'ajout de fonctionnalité en créant sa propre branche. Quand la fonctionnalité est terminée dans la branche, il peut réaliser une fusion entre sa version et la version en production

En gérant plusieurs versions d'un logiciel dans des branches, un développeur peut travailler séparément sur des modifications ou des corrections, sans avoir d'effet de bord sur le travail des autres développeurs. Un autre avantage est de garder via les branches tout l'historique des modifications: on peut ainsi revenir en arrière. Il est fréquent qu'une entreprise publie un logiciel et revienne directement en arrière quand elle se rend compte que des bugs importants sont présents dans la nouvelle version.

<img src="figures/branch-01.png" height="500" width="700">


Dans cette figure, vous pouvez voir trois branches différentes du même projet.

### Exercice
1. listez les branches de votre projet `git branch`
2. créez une nouvelle branche avec la commande  `git branch NomDeLaBranche`. Une nouvelle branche est créée à partir des fichiers de la branche courante. Attention, vous êtes par contre toujours dans la branche courante
3. listez les branches de votre projet `git branch`
4. listez les branches du repository distant `git branch -r`. Votre nouvelle branche ne doit pas apparaitre sur le repository distant
5. connectez vous sur votre nouvelle branche `git checkout NomDeLaBranche`
6. modifiez votre projet
7. faites un commit sur le repository local
8. faites un push de votre nouvelle branche sur le repository distant : `git push --set-upstream origin NomDeLaBranche`. En local, le repository **distant** est nommé via un alias `origin`
9. sur Gitlab, vérifiez que votre branche apparait bien
10. connectez vous sur votre branche `master`
11. supprimez la branche `NomDeLaBranche` du repository local : `git branch -d NomDeLaBranche`
12. supprimez la branche `NomDeLaBranche` du repository distant : `git push --delete origin NomDeLaBranche`. Pour rappel, `origin` est un alias pour le repository distant



<br><hr>

## Références

Cette section contient les sources utilisées pour réaliser ce notebook.

https://blog.osteele.com/2008/05/my-git-workflow/

https://backlog.com/git-tutorial/git-workflow/

https://www.atlassian.com/git/tutorials/using-branches