# Fiche enseignant : utilisation de Git

## 1. Logiciels de gestion de versions (VCS)

Git est un logiciel de gestions de versions créé, à la base, par Linus Torwarld et distribué en licence GNU V2. En 2016, il était utilisé par douze millions de personnes.

Gérer les versions d’un logiciel, c'est
* pouvoir **travailler en commun et de manière concurrente** sur plusieurs fichiers de code source en même temps (§1.1),
* **garder l'historique de l'ensemble des modifications** effectuées sur un code source (quelle modification, et qui l'a faite ?)(§1.2).

Imaginons un groupe de 5 développeurs qui interviennent sur le même projet. Après avoir défini les fonctionnalités à programmer, il faut que chaque développeur puisse intervenir sur le même code source.

Bien que la plupart du temps utilisés pour le suivi de projets informatiques, le concept des gestions de versions peut s’adapter à d'autres types de ressources. Les wikis (tel Wikipédia) sont des exemples de logiciels de gestion de versions agissant sur des champs de base de données et non sur des fichiers.

### 1.1 Travailler en commun sur les mêmes fichiers

Il est difficile de travailler à plusieurs sur un document partagé. Imaginons que l’on souhaite modifier un document Excel à 5 personnes en même temps sur un partage réseau. Le premier qui va l’ouvrir aura de la chance : il pourra le modifier. Malheureusement, les suivants auront l’erreur 

![image.png](attachment:image.png)

Le système d’exploitation place des verrous exclusifs sur les fichiers pour qu’une seule personne ne puisse modifier le fichier à la fois. 

NB : on peut modifier à plusieurs, et en même temps, un fichier partagé sur un drive google. C’est plus facile à faire (enfin tout est relatif, quand même) car le fichier est géré sur un serveur de la plateforme et pas en local sur un poste client…

Pouvoir modifier un fichier à plusieurs est un des objectifs principaux des logiciels de gestion de versions (ou VCS en anglais, Version Control System). 

Ces outils permettent de tracer les fichiers sur lesquels vous travaillez en local (sur une machine cliente, votre machine de développement) et de les envoyer sur un serveur distant. Le VCS sera capable de savoir quel fichier sera modifié et pourra retourner les différences entre les fichiers s’ils ont été modifiés par plusieurs personnes.

Git fonctionne en ligne de commande. Il peut être aussi intégré dans les environnements de développement (PyCharm, Eclipse, etc.) où les commandes sont générées automatiquement.

#### TODO : Installe git
Pour installer git sous Ubuntu :
```
sudo apt-get install git
```

Pour installer git sous CentOS :
```
sudo yum install git
```

Vérifer la version du logiciel, car une version < à la 2 ne supporte pas toutes les commandes (à priori, tous les dépots proposent une version supérieure)
```
git -v
```
git permet de récupérer un code source publié sur un serveur (gitlab, github, framagit, serveur local, etc.). 
Lorsqu'on récupère le code source sur sa machine, on dit que l'on *clone* le code.

#### TODO : Clone un projet

Place toi dans ton répertoire personnel. Clone le projet disponible à l'adresse https://gitlab.com/missonnier/diu-bloc1 :
```
git clone https://gitlab.com/missonnier/diu-bloc1
```

Le code source cloné se retrouve dans le dossier ``diu-bloc1``. Il contient un répertoire ``.git``.

#### TODO : Regarde le code source dans un navigateur (Firefox ou Chrome). Ouvre les différents fichiers clonés en local. Les deux correspondent-ils ?

#### TODO : Configure ton environnement git
Tu vas modifier les différents fichiers locaux. Lorsque tu auras terminé, il faudra les *valider* et les *envoyer* sur le serveur. Avant de le faire, il faut configurer son mail et son nom dans le projet en cours :
``` 
git config user.name "Ton Nom"
git config user.mail "ton.adresse@tonfounisseur.com" 
```

Pour éviter de répéter l’opération à chaque clone de projet, on peut le faire dans le fichier de configuration global du profil (fichier ~/.gitconfig) :
```
git config --global user.name "Ton Nom"
git config --global user.mail "ton.adresse@tonfounisseur.com"
```

Sous Linux, à chaque fois que l'on récupère ou que l'on envoie des fichiers sur le serveurs, il faut s'identifier sur ce dernier. Pour stocker son identifiant et son mot de passe pendant une heure, on utilise la commande 
```
git config --global credential.helper 'cache --timeout 3600'
```

#### TODO : Modifie les fichiers et valide ces modifications

Modifie plusieurs fichiers. 

En général, on utilise des Environnements de Développement Intégrés (EDI - IDE) pour programmer. Ces environnements affichent les modifications qui sont portées sur le fichier depuis la dernière validation :

![image.png](attachment:image.png)

Dans cette image, le petit trait vert à côté des numéros de ligne correspond au code qui a été ajouté.


git enregistre l'ensemble de ces modifications dans le répertoire ``.git``.

Avant de les envoyer sur le serveur, il faut **valider** (**commit**) les valeurs 

### 1.2 Garder l'historique de l'ensemble des modifications

## VCS et process de programmation

Au-delà de ces principes techniques de base, les VCS permettent d’associer un processus de développement précis aux développeurs. Les processus, en entreprise, sont construits en fonction de ces outils. Imaginons, par exemple, qu’un projet soit associé à un cycle agile Scrum 

![image.png](attachment:image.png)

En informatique, une méthode est définie comme un _modèle de produit_ et un _modèle de processus_. Un VCS est utilisé pour créer un logiciel, le **produit** fini. C'est le _backlog_ qui recence les fonctionnalités futures d'une application (_features_, ou fonctionalité "atomique").

Lorsqu’on a établi le backlog du sprint avec le client, chaque développeur va programmer sa fonctionnalité pendant un sprint (un mois par exemple). On peut, par exemple, obliger chaque développeur à envoyer ses modifications tous les jours, ou toutes les semaines (on _commite_ et on _pushe_ le code sur le serveur). Ce code pourra être revu par ses collègues (_code review_) car il est disponible sur le VCS. 

Lorsque les fonctionnalités sont correctement implémentées et testés (tests unitaires et fonctionnels), le code peut être mis à disposition, à la fin du sprint, pour être mis en production. La personne ou le service automatisé chargé de la mise en production ira chercher le nouveau code source sur ce VCS. Le code sera _taggué_ et _versionné_. Cette organisation définie le **processus** du projet (non plus le produit).

Un VCS intervient donc dans l’ensemble du processus de développement pour construire un produit. Il permet de rationaliser les organisations. Par exemple, grâce à ces outils, Facebook produit des _releases_ plusieurs fois par jour en faisant tourner en même temps différentes versions de code, et ce de manière totalement transparente pour l’utilisateur :

> https://code.fb.com/web/rapid-release-at-massive-scale/ <br/>
> https://www.forbes.com/sites/quora/2013/08/12/how-do-facebook-and-google-manage-software-releases-without-causing-major-problems/#39719b6e65b2

Un VCS est donc plus qu'un outil technique, il oriente les choix des équipes projets. 

## Le fonctionnement d'un VCS : petit moment d'histoire !

> sources <br/>
> https://fr.wikipedia.org/wiki/Logiciel_de_gestion_de_versions <br/>
> https://en.wikipedia.org/wiki/PVCS

Les premiers gestionnaires de version étaient propriétaires (IBM, Microsoft, Serena, etc.). Dans les années 90, de nombreuses entreprises utilisaient, par exemple, PVCS. 

PVCS était simple : les fichiers de code source étaient stockés sur un serveur distant et, lorsqu’on souhaitait modifier ces derniers, on les téléchargeait et on posait un verrou exclusif sur le serveur. Comme pour Excel, personne ne pouvait les modifier.  

PVCS pouvait également être configuré pour prendre en charge plusieurs utilisateurs tentant simultanément d’éditer un fichier. Dans ce cas, le second développeur (dans l’ordre chronologique) avait une branche créée pour lui, de sorte que les deux modifications, au lieu d'être en conflit, apparaissent sous forme « d’histoires » parallèles pour le même fichier. 

Les **verrous exclusifs** sur les fichiers, même s’ils sont encore très utilisés en informatique, restent peu pratique car particulièrement contraignants, surtout lorsqu’on utilise des fichiers sans les modifier (la majorité des cas dans les gros projets). On l’appelle généralement **approche pessimiste**.

Technologiquement, on peut aussi utiliser des algorithmes ayant une **approche optimiste** : leur objet est de modifier les fichiers et de comparer ensuite l’ensemble de ces modifications avec leur état initial. Dans la majorité des cas, si l’on s’est bien organisé dans le projet, peu de fichiers communs seront modifiés. 

Si des fichiers ont été modifiés par un autre utilisateur, on produit un différentiel entre les deux fichiers et on demande quelle version on souhaite garder. Un différentiel sera efficace sur des fichiers au format texte ; par contre, difficile de faire un différentiel sur des fichiers binaires ou compressés…

![image.png](attachment:image.png)

 C’est sur cette approche optimiste que les VCS des années 2000 ont été implémentés. Il existe actuellement trois principaux outils sur le marché : git, mercurial et svn.

Même si SVN et Mercurial étaient très utilisés il y a une dizaine d’année, git s’avère être le produit à la mode de cette fin de décennie, donc difficile de passer à côté…

## Différence entre SVN et git : gestionnaire de version centralisé ou décentralisé 

Git ne repose pas sur un serveur centralisé. Le code développé est stocké sur l’ordinateur de chaque contributeur du projet, mais il peut également l'être sur un serveur dédié. 

La décentralisation de Git a aussi beaucoup apporté au développement des logiciels libres, puisque le besoin de demander un compte sur un dépôt SVN ou CVS centralisé devient obsolète.
Il suffit de forker un projet ou de le cloner pour commencer à travailler dessus (avec tout l'historique du projet en local) et ensuite de proposer sa contribution (pull request) au dépôt principal (mainteneur principal du projet).


Git, github, gitlab et consorts
Il existe aussi des logiciels et services de gestion de versions décentralisé (distribué) (ou DVCS en anglais, pour distributed version control system). Git et Mercurial1 sont deux exemples de logiciels de gestion de versions décentralisés et sont disponibles sur la plupart des systèmes Unix et Windows

Un logiciel de gestion de versions agit sur une arborescence de fichiers afin de conserver toutes les versions des fichiers, ainsi que les différences entre les fichiers.

Ce système permet par exemple de mutualiser un développement. Un groupe de développeurs autour d'un même développement se sert de l'outil pour stocker toute évolution du code source. Le système gère les mises à jour des sources pour chaque développeur, conserve une trace de chaque changement. Ceux-ci sont, en bonne utilisation, chaque fois accompagnés d'un commentaire. Le système travaille par fusion de copies locale et distante, et non par écrasement de la version distante par la version locale. Ainsi, deux développeurs travaillant de concert sur une même source, les changements du premier à soumettre son travail ne seront pas perdus lorsque le second, qui a donc travaillé sur une version non encore modifiée par le premier, renvoie ses modifications.

Généralement, chaque nouvelle version d'un fichier est appelée révision et son numéro de version est incrémentée de un par rapport à la précédente.

Autres utilisations


## Git, github, gitlab

Git indexe les fichiers d'après leur somme de contrôle calculée avec la fonction de hachage SHA-1. Quand un fichier n'est pas modifié, la somme de contrôle ne change pas et le fichier n'est stocké qu'une seule fois. En revanche, si le fichier est modifié, les deux versions sont stockées sur le disque.

Les serveurs Git utilisent par défaut le port 9418 pour le protocole spécifique à Git. Les protocoles HTTP, HTTPS et SSH (et leurs ports standards) peuvent aussi être utilisés.

Expliquer ici le processus

![image.png](attachment:image.png)