# Des commandes UNIX

## Ce qu’il est inutile de savoir

- **UNIX :** famille de systèmes d’exploitation
- issu de recherches menées par Kenneth Thompson
- Linux est de type UNIX
- Mac OS dérivé de UNIX (BSD)

## Ce qu’il est utile de savoir

- repose sur un interpréteur (*shell*)
- dispose de petits utilitaires appelés en ligne de commande
- ligne de commande débute par une invite (*prompt*), par exemple le `$` ou le `#` en mode superutilisateur
- syntaxe de l’appel d’une commande :
```txt
commande [-options] [arguments]
```
- exemple :
```bash
ls -l ./files/pg2490.txt
```

## Commandes usuelles

### Opérations sur les fichiers ou répertoires

- `ls`: liste le contenu d’un répertoire
- `touch`: crée un fichier
- `mv`: renomme un fichier
- `rm`: supprime un fichier
- `cp`: copie un fichier

### Opérations spécifiques aux répertoires

- `cd` : modifie le répertoire courant
- `pwd` : affiche le chemin vers le répertoire courant
- `mkdir`: crée un répertoire
- `rmdir` : supprime un répertoire

### Opérations sur des fichiers textes

- `cat` : concatène des fichiers pour les imprimer
- `less` : ouvre un fichier pour affichage
- `more` : ouvre un fichier pour affichage
- `head` : affiche les dix premières lignes d’un fichier
- `tail` : affiche les dix dernières lignes d’un fichier
- `grep` : recherche de motifs dans un fichier

### Divers

- `echo` : imprime un message
- `man` : obtenir la page du manuel relative à la commande

Un doute sur l’utilisation d’une commande ? Pensez à `man` ou au site [TLDR](https://tldr.ostera.io/) qui présente des cas pratiques.

## Enchaîner des instructions

Parmi les manières d’enchaîner des instructions :
- opérateur `;` pour tout exécuter en même temps
- opérateur `&&` pour exécuter une commande seulement si les précédentes ont réussi
- opérateur `|` pour envoyer à une commande le résultat des précédentes

Et puis citons deux opérateurs pour rediriger les flux :
- opérateur `>` pour remplacer le contenu d’un fichier par le résultat d’une commande
- opérateur `>>` pour ajouter à un fichier le résultat d’une commande

### Exemples d’utilisation

Essayons de lister les fichiers du répertoire *files* :

```bash
ls ./files
```

Sur la base du résultat, recherchons les fichiers avec une extension `.csv` :

```bash
ls ./files | grep ".csv"
```

Qu’il existe ou non des fichiers CSV, on souhaite créer un fichier de résultats :

```bash
ls ./files | grep ".csv" ; touch ./files/results.txt
```

S’il existe des fichiers CSV dans le répertoire, on souhaite en plus afficher un message :

```bash
ls ./files | grep ".csv" && echo "Il existe des fichiers CSV dans le répertoire."
```

S’il existe des fichiers CSV, on souhaite maintenant créer un fichier dans lequel écrire le message :

```bash
ls ./files | grep ".csv" && touch ./files/results.txt && echo "Il existe des fichiers CSV dans le répertoire." > ./files/results.txt
```

**Remarque :** il est possible d’obtenir le même résultat en effectuant les opérations les unes après les autres.

## Opérations courantes en analyse de texte

### Filtrage

L’utilitaire `grep` (*file pattern searcher*) associé à l’option `-a` considère les fichiers en paramètres comme de l’ASCII. Il est utile pour rechercher un motif (*pattern*) en utilisant les expressions rationnelles.

```bash
# find, in all the TXT files, the lines that contain the word 'upon'
cat ./files/*.txt | grep -a upon
```

```bash
# words that end with suffix -ly
cat ./files/*.txt | grep -a "[a-zA-Z]*ly"
```

### Remplacement

`sed` (*stream editor*) est un utilitaire très puissant qui permet d’éditer les lignes d’un flux en effectuant des remplacements.

```bash
# substitutes first occurrence of 'id' by 'it'
echo "Le petit chat boid du laid." | sed 's/id/it/'
```

```bash
# substitutes all occurrences of 'id' by 'it'
echo "Le petit chat boid du laid." | sed 's/id/it/g'
```

Il est possible d’utiliser des expressions rationnelles :

```bash
echo "Le petit chat boid du laid." | sed 's/\w*d/t/g'
```

Si l’utilitaire renvoie ordinairement le flux dans la sortie standard, l’option `-i` effectue le remplacement en place dans les fichiers en paramètres :

```bash
sed -i '' 's/subscribe/unsubscribe/g' ./files/*.txt
```

La configuration `d` dans le paramétrage de l’outil permet de supprimer les lignes qui répondent au motif renseigné :

```bash
# remove lines starting with a whitespace character
sed '/^[[:space:]]/d' ./files/*.txt
```

```bash
# remove empty lines
sed '/^$/d' ./files/*.txt
```

Un autre utilitaire pour manipuler le flux d’un texte est `tr` (*translate characters*). Il offre la capacité d’effectuer une concordance entre plusieurs caractères à remplacer.

```bash
# 'a' => 'e' ; 'e' => 'a'
echo "Le petit chat boit du lait." | tr ae ea
```

Les remplacements peuvent s’opérer depuis un fichier :

```bash
tr ae ea < ./files/*.txt
```

L’option `-d` s’utilise pour supprimer des caractères :

```bash
# removes all occurrences of character 'e'
tr -d e < ./files/*.txt
```

Avec l’option `-s`, les caractères répétés fusionnent :
```bash
# the three whitespace characters become one, while single ones still
echo "Le petit chat   boit du lait." | tr -s '[:blank:]' ' '
```

Une autre option intéressante consiste à effectuer un remplacement sur tous les autres caractères sauf ceux indiqués :

```bash
# keep all digits
echo "La révolution française a eu lieu en 1789." | tr -cd '[:digit:]'
```

```bash
# every character but digits become an 'x'
echo "La révolution française a eu lieu en 1789." | tr -c '[:digit:]' 'x'
```

### Tri

L’utilitaire `sort` permet de trier des lignes de textes. Avec l’option `-r`, le tri s’effectue de manière inversée et, avec `-f`, il ignore la casse des caractères :

```bash
echo "Le
petit
chat
boit
du
lait
." | sort -rf
```

Et pour effectuer un tri sur des valeurs numériques plutôt qu’alphabétiques, il faut recourir à l’option `-n`.

### Comptage

Il existe un utilitaire pour compter les lignes, mots et caractères dans un texte : `wc` (*word count*).

```bash
# 1 line, 6 words, 28 characters
echo "Le petit chat boit du lait." | wc
```

Pour limiter le comptage à l’une ou l’autre des unités, il faut utiliser les options `-l` (lignes), `-w` (mots) et `-m` (caractères).

### Fréquence

Grâce à `uniq` et son option `-c`, il est possible d’obtenir un décompte des occurrences d’un mot dans un texte :

```bash
echo "Le
petit
chat
boit
du
lait
.
Le
petit
chien
boit
de
l’
eau
." | sort | uniq -c | sort -rn
```

À noter que l’option `-i` permet d’effectuer ce calcul en ignorant la casse.

## Opérations courantes avec le Web

La communication entre un client et un serveur sur le Web s’effectue au moyen d’un protocole (http, https, ftp) et de méthodes (*verbs*) qui définissent le type d’échanges souhaité. Parmi les méthodes les plus souvent employées :
- **GET :** obtenir une ressource
- **POST :** ajouter une ressource
- **PUT :** modifier une ressource
- **DELETE :** supprimer une ressource

### *WGET*

L’utilitaire `wget` (*network downloader*) permet d’interroger le Web uniquement en mode **GET**. Il sert ainsi à télécharger du contenu.

```bash
wget http://www.inalco.fr/sites/all/themes/inalco/logo.svg
```

Un ensemble d’options permettent d’aspirer par exemple un site Web entier :

```bash
wget -r -k -E -np http://www.llf.cnrs.fr
```

Explication des options :
- `-r` : de manière récursive
- `-k` : conversion des liens en liens locaux
- `-E` : conversion des scripts PHP en pages HTML
- `-np` : pour ne pas remonter dans l’arborescence du site