# Programmation Bash

---
<div class="alert alert-block alert-info">
Vous pouvez exécuter les commandes ci-desous directement dans le notebook ou dans un terminal.<br />
Nous vous conseillons de tester les deux.
</div>

**Rappel**, dans un notebook :

- la combinaison de touches <kbd>Ctrl</kbd>+<kbd>Entrée</kbd> exécute une cellule.
- la combinaison de touches <kbd>Shift</kbd>+<kbd>Entrée</kbd> exécute une cellule puis passe à la suivante. C'est équivalent à cliquer sur l'icone ▶️ dans la barre de menu en haut du notebook.
- la combinaison de touches <kbd>Alt</kbd>+<kbd>Entrée</kbd> exécute une cellule puis en crée une nouvelle (vide) en dessous.

Pour ajouter une cellule, vous pouvez aussi cliquer sur l'icone ➕ dans la barre de menu du notebook.

---

Exécutez la cellule ci-dessous pour télécharger tous les fichiers dont vous aurez besoin par la suite :

In [None]:
wget https://raw.githubusercontent.com/pierrepo/unix/master/script.sh
wget https://raw.githubusercontent.com/pierrepo/unix/master/var.sh
wget https://raw.githubusercontent.com/pierrepo/unix/master/arg.sh
wget https://raw.githubusercontent.com/pierrepo/unix/master/haiku.txt
wget https://raw.githubusercontent.com/pierrepo/unix/master/exit.sh
wget https://raw.githubusercontent.com/pierrepo/unix/master/while.sh
wget "https://raw.githubusercontent.com/pierrepo/unix/master/mon fichier.txt"
wget https://raw.githubusercontent.com/pierrepo/unix/master/people.dat

# Introduction

Bash est un interpréteur de lignes de commande (*shell*) utilisé sur des systèmes Unix / Linux. C'est un des *shells* les plus utilisés sous Linux.

Si vous avez oublié (ou ignorez) la différence entre *shell* et terminal, jetez un oeil à [cette video](https://www.youtube.com/watch?v=U2b-MYcSCLc).

Le *shell* Bash vous donne accès aux commandes Unix (`ls`, `cat`, `pwd`...). Bash est aussi un langage de programmation que pouvez utiliser pour automatiser un certain nombre de manipulations sur des fichiers.

En programmation, on a besoin de faire 4 actions essentielles :

1. Stocker de l'information (les variables).
2. Manipuler cette information (les opérateurs).
3. Répéter des actions (les boucles).
4. Prendre des décisions (les tests).

Vous pouvez consulter [cette vidéo](https://www.youtube.com/watch?v=N9URJ4yVuGA) pour en apprendre plus.

Une fois qu'on sait faire ces 4 actions, on peut pratiquement tout faire.

Mais souvenez-vous que quelque soit le langage de programmation :

> Fondamentalement, l'ordinateur et l'homme sont les deux opposés les plus intégraux qui existent. L'homme est lent, peu rigoureux et très intuitif. L'ordinateur est super rapide, très rigoureux et complètement con...

-- Gérard Berry, informaticien, médaille d'or du CNRS 2014, professeur au collège de France ([entretien au Nouvel Obs](https://tempsreel.nouvelobs.com/rue89/rue89-le-grand-entretien/20160826.RUE7684/gerard-berry-l-ordinateur-est-completement-con.html), 2016).


# Variables

En Bash, il est possible de définir un certain nombre d'objets, qui vont contenir de l'information et résider dans la mémoire du *shell*. On distingue des variables **locales** et des variables **d'environnement**.


## Variables locales

Les variables locales existent uniquement dans le *shell* courant.

Par convention, elles sont écrites en minuscules. Par exemple :

In [None]:
a=1
test="ma chaîne de caractères"

⚠️ Attention. Il n'y a pas d'espace avant ou après le symbole `=` !

Si `var` est une variable, alors `$var` donne accès au contenu de la variable et l'instruction `echo $var` affiche le contenu de cette variable. Par exemple :

In [None]:
a=1
echo $a

In [None]:
test="ma chaîne de caractères"
echo $test

Lors de l'utilisation d'une variable, il est fortement recommandé d'entourer son nom par des accolades `{ }`. Par exemple :

In [None]:
a=1
echo ${a}

In [None]:
test="ma chaine de caracteres"
echo ${test}

## Variable d'environnement

Les variables d'environnement sont transmises aux processus fils (c'est-à-dire aux programmes qui sont lancés depuis le *shell* courant). Par convention, elles s'écrivent en majuscules. Elles sont déclarées comme variables d'environnement avec la commande `export`.

Exemple :

In [None]:
export PROSPER="Youplaboum"
echo ${PROSPER}

Voici quelques variables d'environnement automatiquement crées par le *shell* et donc utilisables immédiatement :

- `PATH` contient les chemins d’accès (répertoires) où le *shell* recherche les commandes tapées par l’utilisateur.<br />
    Ainsi la commande
    ```
    export PATH=${PATH}:/mon/nouveau/repertoire
    ```
    ajoute le contenu de `/mon/nouveau/repertoire` à la variable `PATH`.
- `SHELL` contient le chemin vers le *shell* utilisateur (`/bin/bash` bien souvent).
- `USER` contient le nom (identifiant) de l’utilisateur.
- `HOSTNAME` contient le nom de la machine.
- `HOME` contient le chemin vers le répertoire personnel de l'utilisateur.
- `PWD` contient le chemin du répertoire courant.

Affichez le contenu des variables d'environnement `USER` et `HOSTNAME` :

La commande `env` affiche toutes les variables d'environnement disponibles dans un *shell*.

## Noms de variables

Les noms de variables peuvent contenir :

- des lettres minuscules de `a` à `z` (surtout pour les variables locales),
- des lettres majuscules de `A` à `Z` (surtout pour les variables d'environnement), 
- des chiffres de `0` à `9`;
- ainsi que les caractères `_`, `-` ou `.`.

Créez deux variables **locales** qui contiennent respectivement : `42` et `"Vive Unix!"`.

Affichez ensuite le contenu de ces variables avec la commande `echo`.

Remarque : n'oubliez pas les accolades...

## Guillemets doubles et simples

Les guillemets doubles (`"`) permettent l'interprétation des variables contenues dans une chaîne de caractères mais pas les guillemets simples (`'`). Exemple :

In [None]:
echo "mon login est ${USER}"

In [None]:
echo 'mon login est ${USER}'

Dans le second cas, la variable n'est pas intreprétée, c'est-à-dire qu'elle n'est pas remplacée par son contenu.

## Résultat d'une commande

Il est possible de stocker le résultat d'une commande Unix dans une variable.

Affichons d'abord le contenu du fichier `people.dat` :

In [None]:
cat people.dat

Puis comptons le nombre de femmes :

In [None]:
grep woman people.dat | wc -l

On peut stocker le résultat d'une commande pour l'utiliser ultérieurement en mettant cette commande entre `$(` et `)` :

In [None]:
nombre_femmes=$(grep woman people.dat | wc -l)
echo "Le nombre de femmes est ${nombre_femmes}"

On peut utiliser également les caractères `` ` ``, mais cette écriture est moins lisible :

In [None]:
nombre_femmes=`grep woman people.dat | wc -l`
echo "Le nombre de femmes est ${nombre_femmes}"

La première forme avec l'utilisation de `$( )` est préférable.

**Astuce** : On peut récupérer la racine du nom d'un fichier, c'est-à-dire son nom sans l'extension, par deux méthodes :

In [None]:
name="people.dat"

root1=$(basename $name .dat)
root2=${name%.dat}

echo "Nom complet du fichier : ${name}"
echo "Méthode 1 : ${root1}"
echo "Méthode 2 : ${root2}"

`basename` est une commande Unix qui renvoie le nom d'un fichier sans son chemin et sans son extension quand on lui passe en argument.

# Manipulation de variables

Bash ne sait manipuler que les variables numériques entières et des chaînes de caractères.

Commençons par les entiers :

In [None]:
i=20

In [None]:
let i=${i}+10
echo ${i}

In [None]:
let i=${i}-3
echo ${i}

Il existe un raccourci pour ajouter 1 à un nombre :

In [None]:
let i++
echo ${i}

ou retrancher 1 :

In [None]:
let i--
echo ${i}

On peut également manipuler des chaînes de caractères :

In [None]:
a="I love"
b="Unix"
echo "${a} ${b}"

# Boucle for

Les boucles permettent de répéter plusieurs fois des actions. Voici une boucle sur une liste d'éléments explicites :

In [None]:
for fruit in pomme poire fraise
do
    echo ${fruit}
done

Les actions à réaliser pour chacun des éléments de la boucle sont entre les mot-clefs `do` et `done`. Ici, l'action à réaliser est `echo ${fruit}`, c'est-à-dire afficher le contenu de la variable `fruit` qui va successivement prendre les valeurs `pomme`, `poire` et `fraise`.

On peut bien sûr réaliser plusieurs actions dans une boucle `for` :

In [None]:
for fruit in pomme poire fraise
do
    echo "J'aime"
    echo ${fruit}
done

Remarque : l'indentation, c'est-à-dire le retrait à droite, des actions à réaliser dans la boucle n'est pas obligatoire mais facilite la lecture de la boucle.

Voici maintenant une boucle sur tous les fichiers `.sh` (les scripts Bash) du répertoire courant :

In [None]:
for name in *.sh
do
    echo ${name}
done

Ici `*.sh` se substitue à tous les noms possibles de fichiers dont l'extension est `.sh`. Le caractère `*` remplace plusieurs caractères.

Et une boucle pour afficher tous les mots de fichier `haiku.txt`, un mot par ligne :

In [None]:
for word in $(cat haiku.txt)
do
    echo ${word}
done

Les mêmes commandes, mais sur une seule ligne :

In [None]:
for word in $(cat haiku.txt); do echo ${word}; done

# Test

Les tests sont une structure de programmation très utile pour prendre des décisions.

## Structure

Voici un premier test simple :

In [None]:
if free -h | grep Mem
then
    echo "Calcul de la mémoire vive : OK"
fi

Si la commande `free -h | grep Mem`, qui permet d'obtenir la quantité de mémoire vive sur la machine, s'exécute correctement, alors le programme affiche `Calcul de la mémoire vive : OK`.

Les actions à exécuter lorsque le test est correct se trouvent entre les mot-clefs `then` et `fi`. On peut ajouter le mot-clef `else` pour exécuter des actions si le test n'est pas correct :

In [None]:
if free -h | grep Mem
then
    echo "Calcul de la mémoire vive : OK"
else
    echo "Calcul de la mémoire vive impossible"
fi

Si la commande `free -h | grep Mem` ne s'exécute pas correctement alors le programme affiche `Calcul de la mémoire vive impossible`.

## Opérateurs de comparaison

Le plus souvent, pour faire un test, on réalise une ou plusieurs comparaisons. Une comparaison utilise des opérateurs.

Opérateurs pour des entiers :

| opérateur  | signification        |
|:----------:|----------------------|
| `-eq`      | égal à               |
| `-ne`      | différent de         |
| `-gt`      | supérieur à          |
| `-ge`      | supérieur ou égale à |
| `-lt`      | inférieur à          |
| `-le`      | inférieur ou égale à |


Opérateurs pour des chaînes de caractères :

| opérateur  | signification        |
|:----------:|----------------------|
| `=`        | égal à               |
| `!=`       | différent de         |
| `>`        | supérieur à          |
| `<`        | inférieur à          |
| `-z`       | vide                 |


Opérateurs pour des fichiers :

| opérateur  | signification                                         |
|:----------:|-------------------------------------------------------|
| `-e`       | le fichier existe                                     |
| `-s`       | le fichier existe et sa taille est non nulle          |
| `-r`       | le fichier existe et est lisible par l'utilisateur    |
| `-w`       | le fichier existe et est modifiable par l'utilisateur |
| `-x`       | le fichier existe et est exécutable par l'utilisateur |

L'opérateur `!` est un peu particulier car c'est l'opérateur de négation.

Voici un premier exemple avec une comparaison de nombres entiers :

In [None]:
nombre=4
if [[ ${nombre} -eq 10 ]]
then
    echo "Le nombre vaut ${nombre}"
    echo "Test positif"
else
    echo "Le nombre vaut ${nombre}"
    echo "Test négatif"
fi

Notez bien l'utilisation des doubles crochets ouvrants et fermants (`[[ ]]`) qui encadrent la comparaison. Il est impératif de garder un espace après `[[ ` et un espace avant ` ]]`.

Voici maintenant deux autres exemples avec des comparaisons de chaînes de caractères :

In [None]:
prenom="Pierre"
if [[ ${prenom} = "Pierre" ]]
then
    echo "Accès autorisé"
else
    echo "Accès refusé"
fi

Copiez dans la cellule ci-dessous le code précédent, puis modifiez la variable `prenom` pour afficher `Accès refusé` :

On peut également vérifier qu'une chaîne de caractères n'est pas vide :

In [None]:
msg="hello"
if [[ ! -z ${msg} ]]
then
    echo "msg vaut ${msg}"
else
    echo "msg est nulle"
fi

La comparaison `-z ${msg}` vérifie si la variable `msg` est vide donc la comparaison `! -z ${msg}` vérifie que `msg` n'est **pas** vide.

Enfin, voici un dernier exemple avec une comparaison de fichier :

In [None]:
if [[ -e /bin/bash ]]
then
    echo "Shell Bash trouvé !"
fi

Si le fichier `/bin/bash` existe, alors on affiche le message `Shell Bash trouvé !`.


**Remarque :** Vous pourrez trouver dans des livres ou sur internet d'autres manières d'écrire des tests.

- Avec un seul crochet ouvrant et fermant `[ ]` :

In [None]:
msg="hello"
if [ ! -z ${msg} ]
then
    echo "msg vaut ${msg}"
else
    echo "msg est nulle"
fi

- Avec la commande Bash `test` :

In [None]:
msg="hello"
if test ! -z ${msg}
then
    echo "msg vaut ${msg}"
else
    echo "msg est nulle"
fi

🔔 La méthode avec les doubles crochets `[[ ]]` est celle qui est recommandée et qu'il faut utiliser avec Bash. Pour en savoir plus, vous pouvez lire [Test Constructs](http://www.tldp.org/LDP/abs/html/testconstructs.html).


## Combinaisons de comparaisons

Enfin, on peut également combiner plusieurs comparaisons dans un même test avec des opérateurs booléens :

| opérateur  | signification |
|:----------:|---------------|
| `&&`       | et            |
| `\|\|`       | ou            |


Exemple :


In [None]:
msg="hello"
nombre=2
if [[ ! -z ${msg} && ${nombre} -eq 2 ]]
then
    echo "tests OK"
fi

La combinaison des deux comparaisons `! -z ${msg}` et `${nombre} -eq 2` se fait avec l'opérateur **et** logique `&&`. Les deux comparaisons se trouvent entre les doubles crochets `[[` et `]]`.


## Boucle while

Il existe un second type de boucle, qui utilise le mot-clef `while` et des tests.


In [None]:
nombre=1
while [[ ${nombre} -le 5 ]]
do
    echo "nombre vaut ${nombre}"
    let nombre++
done

La boucle s'exécute tant que la variable `nombre` est inférieure ou égale à 5.

Les boucles `while` sont un peu particulières car pour fonctionner, elles ont besoin d'une variable :

- initialisée avant la boucle (`nombre=1`) ;
- testée au niveau du mot-clef `while` (`while [[ ${nombre} -le 5 ]]`) ;
- et incrémentée (modifiée) dans le corps de la boucle, c'est-à-dire entre les mot-clefs `do` et `done` (`let nombre++`).

# Script

Quand il y a plusieurs commandes Bash à exécuter, on les écrit, la plupart du temps, dans un fichier qu'on appelle un **script**.

## Caractères spéciaux dans les noms de fichiers

L'utilisation des caractères spéciaux  `* ? ! $ < > & \ / " '  ; #` et des espaces dans les noms de fichiers n'est pas recommandé.

Le caractère `\` *échappe* le caractère spécial qui le suit de l’interprétation du *shell*.

Par exemple, avec le fichier `mon fichier.txt`, l'affichage de son contenu (`hello world`) avec la commande `cat` pourra être problématique. Sans *échapper* l'espace contenu dans `mon fichier.txt`, `cat` va vouloir afficher les fichiers `mon` et `fichier.txt`, qui bien sûr n'existent pas :

In [None]:
cat mon fichier.txt

Par contre, avec un espace correctement *échappé* avec `\` ou le nom de fichier entre guillemets, on peut afficher le contenu de `mon fichier.txt`.

In [None]:
cat mon\ fichier.txt

In [None]:
cat "mon fichier.txt"

In [None]:
cat 'mon fichier.txt'

Mais de manière générale, ne mettez pas (jamais, JAMAIS, **JAMAIS** !) d'espace dans vos noms de fichiers.

## Exécution

Pour pouvoir exécuter un script, il y a deux méthodes.

**Méthode 1**

Le script doit être rendu exécutable de façon à ce qu'on puisse ensuite le lancer de manière autonome.

Considérons par exemple le script `script.sh` et affichons les droits actuels de ce fichier :

In [None]:
ls -l script.sh

Puis rendons ce script exécutable avec la commande `chmod` :

In [None]:
chmod +x script.sh

Cette opération n'est à faire qu'une seule fois.

On vérifie alors les droits du script :

In [None]:
ls -l script.sh

Le symbole `x` indique que le script est désormais exécutable.

Le script est ensuite lancé en l'appelant avec son nom, précédé de `./` si il se trouve dans le répertoire courant :

In [None]:
./script.sh

ou du chemin complet vers le script si il se trouve dans un autre répertoire :

```
/chemin/complet/script.sh
```

**Méthode 2** 

On peut également exécuter un script Bash sans qu'il ne soit exécutable. Mais il faut pour cela appeler explicitement l'interpréteur Bash devant le nom du script. Par exemple :

In [None]:
bash script.sh

La seconde méthode est à la fois plus immédiate mais aussi plus explicite. On appelle en effet explicitement l'interpréteur Bash pour exécuter le script.

C'est donc cette méthode que je vous recommande.

## Première ligne et shebang

La première ligne du script est une ligne particulière qui débute par les caractères `#!` qu'on appelle [Shebang](https://fr.wikipedia.org/wiki/Shebang) (ou shabang) et qui contient le chemin pour trouver l'interpréteur de commandes, c'est-à-dire le *shell*. Pour Bash, on utilise :

```
#! /bin/bash
```

ou une forme plus générique :

```
#! /usr/bin/env bash
```

La forme `#! /usr/bin/env bash` est celle qui permettra d'utiliser le script Bash sur le plus de systèmes d'exploitation Unix / Linux différents. C'est celle à utiliser.

## Commentaires

Dans un script Bash, tout ce qui suit le caractère `#` est ignoré et considéré comme un commentaire (sauf pour la première ligne avec le shebang).

## Arguments et variables prédéfinies

En Bash, on a souvent besoin de passer de l'information depuis la ligne de commande qui lance le script vers l'intérieur du script.

Pour cela, il existe des variables prédéfinies comme :

- `$1`, `$2`... le premier argument, deuxième argument... de la ligne de commande.
- `$*` tous les arguments de la ligne de commande.
- `$#` le nombre d'arguments de la ligne de commande.

Par exemple, avec le script `arg.sh` suivant :

```
#! /usr/bin/env bash

# affiche le nombre d'arguments donnés dans la ligne de commande
echo "Nombre d'arguments : $#"

# affiche tous les arguments en une seule fois
echo "Tous les arguments : $*"

# affiche le premier argument, puis le deuxième, puis...
echo "Premier argument : $1"
echo "Deuxième argument : $2"
echo "Troisième argument : $3"
```

Si on utilise maintenant `arg.sh` avec deux arguments (`toto` et `titi`) :

In [None]:
bash arg.sh toto titi

On remarque que l'affichage du troisième argument, qui pourtant n'existe pas, ne pose pas de problème à Bash. Par défaut, si une variable est appelée alors qu'elle n'a pas été définie au préalable, sa valeur est une chaîne de caractères vide.

Si on utilise maintenant `arg.sh` avec trois arguments (`toto`, `titi` et `42`) :

In [None]:
bash arg.sh toto titi 42

## Affichage de variables

Affichons le contenu du script `var.sh` :

In [None]:
cat var.sh

puis exécutons-le :

In [None]:
bash var.sh

Soyez très attentifs aux différents type de guillemets utilisées (simples `'` et doubles `"`) qui ont une influence sur l'affichage ou non du contenu  d'une variable (ici `USER` et `HOSTNAME`).


## Quitter un script

La commande `exit` permet de quitter un script. Voici un exemple avec le script `exit.sh` et qui en plus utilise la boucle `while` et le test avec `if`.

Affichez le contenu du script :

In [None]:
cat exit.sh

Exécutez-le :

In [None]:
bash exit.sh

Quand la variable `nombre` atteint la valeur 3, le test `[[ ${nombre} -eq 3 ]]` est vérifié et le script s'arrête avec la commande `exit`.

# Conclusion

Pour conclure sur la programmation en générale et la programmation Bash en particulier, voici une citation de H. Abelsen :

> Programs must be written for people to read, and only incidentally for machines to execute.

-- [Harold Abelsen](https://fr.wikipedia.org/wiki/Hal_Abelson), *Structure and Interpretation of Computer Programs*, The MIT Press, 1996, préface de la première édition.

H. Abelsen est informaticien et un membre fondateur des Creatives Commons et de la Free Software Foundation.


Nous vous conseillons fortement de suivre ce principe et de rendre vos scripts Bash clairs et lisibles. Pour cela, vos programmes et scripts doivent contenir :

- des commentaires précis et informatifs ;
- des noms de variables qui ont du sens ;
- une structure et une organisation claire.