attenzione: tutorial non finito

<center><span style="font-size:40px;"><b>BASH CODING</b></span></center>

---

# 01 - INTRODUCTION
The **shell** is a program that provides an interface between you (the user) and the operating system. It lets you run commands, start programs, navigate folders and manage files by typing text instead of clicking with a mouse. In particular, scripting (= running lists of command) makes it possible to run a sequence of commands automatically, instead of entering them one by one interactively.    

There are different kinds of shells. One of the most popular and widely used on Linux systems is **Bash** (Bourne Again SHell), created in 1989.  

Most Unix/Linux systems come with Bash pre-installed. To check the version, open a terminal and type:
```bash
bash --version
```
If Bash isn't installed, you can install it using your system's package manager. For example, on Ubuntu/Debian, type:
```bash
sudo apt-get install bash
```

You can also write scripts (a list of commands) in a file with a `.sh` extension (in the first line put `#!/bin/bash`) and run it with the command `bash file_name.sh`.

### IN JUPYTER NOTEBOOKS
In Jupyter notebooks you can run Bash commands directly by prefixing them with `!` (e.g., `! ls`).  
If you want to run a full script inside a cell, you can start it with a cell magic command `%%bash`.
```bash
# EXAMPLE 1:
! echo "Hello from Bash"
```
```bash
# EXAMPLE 2:
%%bash
echo "Hello from Bash"
```

---

# 02 - BASIC COMMANDS

#### BASIC COMMANDS WITHOUT OPTIONS
- `pwd` — Prints the current working directory (where you are).  
- `ls` — Lists files and directories in the current folder.
- `cd <directory>` — Changes the current directory.  
- `echo <text>` — Prints text or variables to the terminal.  
- `cat <file>` — Displays the content of a file.   
- `touch <file>` — Creates an empty file or updates its timestamp.  
- `mkdir <dir>` — Creates a new directory.  
- `rm <file>` — Removes a file. Use `rm -r <dir>` to remove a directory recursively (i.e. including what is inside).  
- `cp <source> <dest>` — Copies files or directories (add option`-r` for directories).  
- `mv <source> <dest>` — Moves or renames files/directories.  
- `wget <url>` — Downloads a file from the web.  
- `man <command>` — Shows the manual/help page for a command (press `q` to exit).  
- `history` — Displays the list of previously executed commands.  
- `clear` — Clears the terminal screen.  

#### SPECIAL PATH SYMBOLS

- `.` (dot): Refers to the current directory. Example: `./script.sh` (runs a script in the current folder).  
- `..` (double dot): Refers to the parent directory (one level up). Example: `cd ..`  
- `~` (tilde): Refers to the home directory of the current user. Example: `cd ~` or `~/folder_name/path/`  
- `/` (slash): At the beginning of a path, it refers to the root of the filesystem. Used between folder names, it separates directories. Example: `cd /usr/local`  
- `-` (dash): Switches back to the previous directory. Example: `cd -`  

#### COMMON BASH COMMAND OPTIONS (FLAGS)
Many commands can have many possible options/flags to specify the command itself, and while they are command-specific, many commands follow common conventions, showed in a list below.  
In any case, always check with `man <command>` or `<command> --help` the available options for your command. 

| Flag | Meaning (typical) | Example Usage |
|------|-------------------|---------------|
| `-r` | Recursive (apply to all files/subdirs) | `cp -r dir1 dir2`, `rm -r folder`, `grep -r "text" .` |
| `-a` | All (include hidden files / preserve attributes) | `ls -a`, `cp -a source/ dest/` |
| `-l` | Long format / detailed output | `ls -l` |
| `-f` | Force (ignore warnings/errors) | `rm -f file`, `cp -f src dest` |
| `-h` | Help (show usage info) | `ls -h --help`, `grep -h` |
| `-v` | Verbose (show what is happening) | `cp -v file1 file2`, `rm -v file` |
| `-i` | Interactive (ask before overwriting/deleting) | `rm -i file`, `cp -i file1 file2` |

### `ls` COMMAND

The `ls` command lists files and directories in the current directory.  
It supports many options to customize its output, for example:

- `-l` → Long listing format (detailed view)  
- `-a` → Include hidden files (those starting with `.`)  
- `-h` → Human-readable sizes (e.g., KB, MB)  
- `-t` → Sort by modification time  
- `-r` → Reverse the sort order  
- `-S` → Sort by file size   
- `-d` → Show directories themselves, not their contents  

In particular, the output of `ls -l` shows 7 fields:
1. Permissions
2. Number of hard links  
3. File owner  
4. File group  
5. File size  
6. Modification time  
7. Filename  

The **permissions** field has the structure:  
- FileType: the first character, it could be: `-` (regular file), `d` (directory), `l` (symlink), etc.  
- Permissions: 9 characters in groups of 3 (related to owner, group and others)   
  - `r` → read  
  - `w` → write  
  - `x` → execute  
  - `-` → no permission

```bash
# EXAMPLE:
-rw-r--r-- 1 alice staff 2.3K Oct 1 12:34 notes.txt
drwxr-xr-x 3 alice staff 128 Oct 2 09:10 projects/
-rwxr-x--- 1 alice staff 5.6M Oct 3 14:22 run.sh
# first one → regular file, owner can read/write, group can read, others can read  
# second → directory, owner can read/write/execute, group and others can read/execute  
# third → regular file, owner can read/write/execute, group can read/execute, others have no access  
```

---

# 03 - ADVANCED COMMANDS

#### OTHER COMMANDS

- `chmod <permissions> <file>` — Changes file permissions.  
  - Example: `chmod +x script.sh` makes a script executable.  

- `grep <pattern> <file>` — Searches for lines matching a pattern.  
  - Example: `grep "error" logfile.txt` shows lines containing *error*.  

- `sed 's/pattern/replacement/' <file>` — Stream editor for text transformations.  
  - Example: `sed 's/foo/bar/g' file.txt` replaces all *foo* with *bar*.  

- `awk '{action}' <file>` — Text processing and pattern scanning language.  
  - Example: `awk '{print $1, $3}' data.txt` prints the 1st and 3rd column.  

- `wc <file>` — Counts lines, words, and characters.  
  - Example: `wc -l file.txt` counts lines only.  

- `tail <file>` — Shows the last lines of a file (default 10).  
  - Example: `tail -n 20 logfile.txt` shows the last 20 lines.  
  - Option `-f` keeps following new content (useful for logs).  

- `while read line; do ...; done < file` — Reads a file line by line inside a loop.  
  - Example:  
    ```bash
    while read line; do
        echo "Line: $line"
    done < file.txt
    ```  


### Useful System Commands

- `hostname` — Shows the name of the current machine (host).  
  - Example: `hostname`  

- `whoami` — Prints the username of the current user.  
  - Example: `whoami`  

- `du` — Displays disk usage of files and directories.  
  - Example: `du -sh folder/` (human-readable summary of a folder).  

- `df` — Shows available and used disk space on mounted filesystems.  
  - Example: `df -h` (human-readable format, e.g. GB/MB).  


Il simbolo \\$ serve ad accedere alle variabili. In Bash, puoi usare sia le parentesi \\${i} che l'accesso diretto \\$i, ma la sintassi con le parentesi è preferibile quando vuoi evitare ambiguità.

comandi da aggiungere:
* chmod
* awk
* while read

### ECHO
echo -n stampa il valore di result senza aggiungere una nuova riga alla fine (questa è la funzione di -n).

### INPUT
per prendere un input dall'utente (immesso da terminale runtime) basta scrivere nel nostro script bash:

    read nome_input

In questo modo la shell chiederà un input all'utente e tale input verrà automaticamente salvate come variabile dal nome scelto.

```bash
#this is a comment
whoami      # who am I? I.e. which account am I using?
sudo -l       # Am I a superuser=administator? (SUperuser DO)
hostname      # what's the name of the computer
# 'pwd' returns the content of the global variable $PWD, see later 
# the current directory is aliased as ".", instead ".." is the one above
pwd         # in which folder am I?
# 'cd' stands for 'change directory'
cd name_directory        # go to a given directory
cd ..                  # go to the directory above
cd -                   # get back to the previous directory
cd $HOME              # go to your home directory 
# make a new directory:
mkdir test
cd test
mkdir -p tmp/foo       # l'opzione '-p' evita errori e sovrascrizioni
rm -r tmp/foo  # delete that last directory, the "-r" option is needed for directories

# check the Disk Usage in your home
du -h $HOME
# check the memory usage for the main folders
df -h

# check the content of a directory
touch tmp_file #create a file just for the sake of it (see later)
ls -latrh 
# where: -l -> list, -a -> include hidden directories, -t -> time ordered, -r -> reversed, h -> size in Bytes 
```

### SPAZIATURA
Spazi obbligatori nei comandi:

Ci sono casi in cui lo spazio è obbligatorio per separare gli elementi in Bash. Ad esempio:

    Nei test con [ ]: [ $a -lt $b ]. Errore se non metti spazi: if [$a -lt $b]

Nelle assegnazioni di variabili, non ci deve essere spazio intorno al simbolo =:

    var=10  # Corretto
    var = 10  # Errore!
Gli spazi prima del # sono arbitrari, cosi come le indentazioni

### REGEX (REGULAR EXPRESSIONS)
"Regex" è l'abbreviazione di "regular expression" (in italiano, "espressione regolare"). È uno strumento potente per la ricerca, la corrispondenza e la manipolazione di testo basata su modelli.
Definizione: Una regex è una sequenza di caratteri che definisce un modello (o pattern) da utilizzare per identificare stringhe o insiemi di stringhe in un testo. Le regex vengono usate ad esempio con comandi come grep, sed...

Ad esempio:

    La regex cat cerca esattamente la parola "cat" in un testo.
    La regex [0-9] cerca qualsiasi singola cifra tra 0 e 9.
    La regex .* corrisponde a qualsiasi cosa (zero o più caratteri).

Componenti principali di una regex:

    Caratteri letterali:
        Sono esattamente quello che rappresentano. Esempio: dog corrisponde solo alla stringa "dog".

    Metacaratteri (caratteri speciali):
        Hanno significati specifici e non rappresentano il loro valore letterale.
        Esempio:
            .: corrisponde a qualsiasi carattere (eccetto il ritorno a capo).
            *: corrisponde a zero o più occorrenze del carattere precedente.
            +: corrisponde a una o più occorrenze del carattere precedente.

    Classi di caratteri:
        Definiscono un insieme di caratteri validi per una corrispondenza.
        Esempio:
            [abc]: corrisponde ad a, b o c.
            [0-9]: corrisponde a qualsiasi cifra tra 0 e 9.

    Ancore:
        Specificano l'inizio o la fine di una stringa.
        Esempio:
            ^: corrisponde all'inizio di una stringa.
            $: corrisponde alla fine di una stringa.

    Gruppi e catture:
        Consentono di raggruppare porzioni della regex.
        Esempio:
            (abc)+: cerca una o più ripetizioni della stringa "abc".

### TAIL
Il comando tail in Bash è utilizzato per visualizzare le ultime righe di un file o di un flusso di dati. Sintassi base: tail [opzioni] [file]

Opzioni principali:
* -n numero: Specifica quante righe visualizzare. Ad esempio, tail -n 10 file.txt mostra le ultime 10 righe di file.txt. Se non viene specificato un numero, tail per default mostra le ultime 10 righe. Se usi una notazione negativa, come tail -n -10 file.txt, otterrai tutte le righe tranne le ultime 10.
* -n +numero: Visualizza il file a partire da una determinata riga. Ad esempio: tail -n +2 file.txt, Mostra tutte le righe a partire dalla seconda (salta la prima).

*\b* è un metacarattere che indica un confine di parola. Serve per assicurarsi che stiamo catturando numeri "isolati" e non parti di altri numeri.
Ad esempio:

    Nel testo 1234 34, la regex con \b trova 34 come numero isolato, ma non 234 all'interno di 1234.

### GREP
Con grep:
* -v: Inverte la ricerca, cioè mostra le righe che non contengono la stringa o il pattern
* -c: Conta il numero di righe che corrispondono al pattern.
* -i: Ignora la distinzione tra maiuscole e minuscole durante la ricerca.
* -o: Print only the matched (non-empty) parts of a matching line, with each such part on a separate output line

### SED
sed (Stream EDitor) è uno strumento potente utilizzato in Bash per eseguire trasformazioni su flussi di testo. Con esso si può:
* Sostituzione (s/old/new/): La funzione di sostituzione è una delle operazioni più comuni di sed. Sintassi: sed 's/pattern/replacement/' file.txt
* Cancellazione (d): sed può essere utilizzato anche per eliminare righe che corrispondono a un pattern. Sintassi: sed '/pattern/d' file.txt, oppure sed '5d' file.txt cancella la quinta riga del file
* Comando p (print): Il comando p è utilizzato per stampare righe specifiche che corrispondono a un pattern: sed -n '/pattern/p' file.txt
* Comando g (global): indica che l'operazione deve essere applicata a tutte le occorrenze del pattern nella riga, anziché solo alla prima.

Opzioni principali di sed:
* -n: Sopprime l'output predefinito. Senza -n, sed stampa ogni riga del file (a meno che non venga specificato un comando di modifica che cambierà o eliminerà la riga). L'opzione -n impedisce a sed di stampare tutte le righe, quindi può essere usata per stampare solo righe specifiche (ad esempio, con p). Esempio: sed -n '3p' file.txt. Questo comando stampa solo la terza riga del file.
* -e: Consente di specificare più comandi di sed (quindi omettibile se ne stai mettendo uno solo). Con -e, puoi fornire comandi multipli da eseguire in sequenza. Ogni comando può essere separato da un'opzione -e. Esempio: sed -e 's/old/new/' -e 's/foo/bar/' file.txt. Questo comando esegue due sostituzioni: prima sostituisce old con new, poi sostituisce foo con bar.

### PIPELINE '|'
La pipeline (|) è usata in Bash (e altre shell Unix) per passare l'output di un comando come input di un altro. Funzionamento: Il comando a sinistra della pipeline genera un output. Questo output viene passato direttamente al comando a destra come input.

### WC
Il comando wc (word count) in Bash viene utilizzato per contare il numero di righe, parole e caratteri in un file o in un input fornito. L'opzione -l dice a wc di contare solo le righe nel file.

Esempio: total_lines=$(wc -l < file.txt).  L'operatore < redirige il contenuto del file a wc

### VIRGOLETTE
in Bash le virgolette singole (') e le virgolette doppie (") non sono equivalenti. Hanno comportamenti diversi quando si tratta di interpretare variabili e caratteri speciali. 

Virgolette singole ('):

    Tutto ciò che è racchiuso all'interno delle virgolette singole è trattato letteralmente.
    Nessuna espansione di variabili, comandi o caratteri speciali avviene.
Esempio:
```bash
a=10
echo 'Il valore di a è $a'  # Output: Il valore di a è $a 
```
Come puoi vedere, $a non è stato interpretato come variabile, ma è stato stampato letteralmente.

Virgolette doppie ("):

    Consentono l'espansione di variabili ($var), comandi ($(command)), e sequenze speciali come \n per una nuova riga.
    Alcuni caratteri speciali, come $, \, e `, vengono elaborati.
    Esempio:
```bash
a=10
echo "Il valore di a è $a"  # Output: Il valore di a è 10 
```

### EXIT
Il comando exit in Bash serve a terminare l'esecuzione di uno script o di una shell. Quando viene utilizzato, exit restituisce un "codice di uscita" che indica se il programma è terminato correttamente o se si è verificato un errore.

Cosa significano i codici di uscita?

    exit 0: Indica che lo script è stato eseguito correttamente senza errori. Questo è il valore di uscita predefinito.
    exit 1 (o un altro valore diverso da zero): Indica che si è verificato un errore. Il codice di uscita 1 è comunemente usato per rappresentare un errore generico, ma puoi usare numeri diversi per differenziare i tipi di errori.

### WGET
Quando usi wget per scaricare un file, viene automaticamente creato un file di log chiamato wget-log. Questo file di log contiene informazioni dettagliate sul processo di download. Se non desideri che venga creato il file di log, puoi usare l'opzione -q (quiet mode), che riduce al minimo l'output di wget: wget -q URL

### BC
bc è un programma da riga di comando utilizzato per eseguire calcoli aritmetici in Unix/Linux. È una calcolatrice arbitraria che supporta numeri interi e numeri in virgola mobile, espressioni matematiche complesse, funzioni e operazioni più avanzate.

Aritmetica di base: puoi eseguire operazioni come addizione, sottrazione, moltiplicazione e divisione. Esempio:

    echo "5 + 3" | bc
    # Output: 8

Numeri in virgola mobile: Se vuoi lavorare con numeri decimali, devi usare bc -l. In questo caso, puoi usare funzioni come sqrt() per calcolare radici quadrate. Esempio:

    echo "scale=2; sqrt(16)" | bc -l
    # Output: 4.00

Con scale imponiamo il numero di decimali da mostrare.

### PARENTESI QUADRE E GRAFFE
* Parentesi quadre [ ]: usate per pattern matching (grep, find...)

    Impo: usano il trattino in mezzo
    Scopo principale: Definire un insieme di caratteri o un intervallo per il pattern matching in comandi come grep, find, ls, ecc.
    Non espandono una sequenza direttamente, quindi non possono essere usate in contesti iterabili come i cicli for.
    Utilizzo tipico: Confronti in grep o find, oppure con il globbing per file.
    Esempi:

Cerca righe che contengono una qualsiasi lettera tra a e z:
grep "[a-z]" file.txt  

Trova file che iniziano con una lettera maiuscola:
find . -name "[A-Z]*"

Globbing per file nella directory corrente:
echo [a-c]*  # Trova file che iniziano con a, b o c

* Parentesi graffe { }: usate per generare sequenze iterabili (for, echo...)

    Impo: usano i due puntini in mezzo
    Scopo principale: Generare sequenze espanse di valori, come intervalli di numeri o lettere.
    Sono iterabili, quindi possono essere usate in contesti come for o con echo.
    Utilizzo tipico:
        Creazione di liste statiche o intervalli per iterazione o output.

Esempi:

Espande direttamente una lista di valori:
echo {a..c}      # Output: a b c
echo {1..5}      # Output: 1 2 3 4 5
echo {1..10..2}  # Output: 1 3 5 7 9

Iterazione in un ciclo for:
for i in {A..C}; do
    echo "Letter: $i"
done
Output:
Letter: A
Letter: B
Letter: C

### VARIABILI POSIZIONALI E SET
Le variabili posizionali in bash sono variabili speciali che vengono utilizzate per riferirsi agli argomenti passati a uno script o a una funzione. Quando scrivi uno script bash e passi dei parametri, questi parametri vengono automaticamente associati alle variabili posizionali. Ad esempio, se esegui uno script come:

./myscript.sh arg1 arg2 arg3

    $1 sarà arg1,
    $2 sarà arg2,
    $3 sarà arg3.

Il comando set è utilizzato per assegnare valori alle variabili posizionali (o sovrascriverle se già erano state date come input). La sintassi è:
    set [options] [--] [-] [arguments …]
Ad esempio scrivendo 'set -- a b c' stiamo assegando dei valori alle variabili posizionali. I due puntini (--) sono necessari in questo caso per indicare che quello che stiamo dando sono proprio gli arguments e non qualche option.

Esempio: scrivendo 'set -- \\$line' in un ciclo 'while read -r line' sto assegnando ciascun elemento della riga line ad una variabile posizionale (\\$1, \\$2, \$3 e così via)

Set has also many more uses, see [here](https://www.baeldung.com/linux/set-command).

Se desideri mantenere gli argomenti originari e usare set senza sovrascrivere, dovresti utilizzare altre variabili, ad esempio $@ che è una variabile speciale che contiene tutti gli argomenti passati al comando:

    original_args=("$@")



### WHILE e READ
Il comando while e read in Bash sono comunemente usati insieme per leggere riga per riga un file o un input e processare ogni riga.

Il ciclo while esegue un blocco di comandi finché una condizione risulta vera. Ogni volta che la condizione è vera, il blocco di comandi dentro il ciclo while viene eseguito. Quando la condizione diventa falsa, il ciclo termina. La sintassi di base è la seguente:

    while [condizione]; do
        # blocco di comandi
    done

Il comando read legge una riga di input e la assegna a una variabile. Dopo aver eseguito questo comando, variabile conterrà la riga letta. Se usato con un ciclo while, può leggere ogni riga di un file. Ad esempio:

    read variabile

La combinazione di while e read viene utilizzata per leggere il contenuto di un file riga per riga e processarlo. La sintassi è la seguente:

    while read -r line; do
        # Operazioni con "$line"
    done < file.txt

Dettaglio:

    read -r line: Il comando read legge una riga e la memorizza nella variabile line. L'opzione -r evita che i caratteri di escape (come il backslash \) vengano interpretati. Senza -r, read potrebbe trattare i backslash come caratteri speciali.
    line è il nome della variabile (che abbiamo scelto noi) che conterrà ogni riga mano a mano
    done < file.txt: La redirezione < file.txt indica che il ciclo while deve leggere riga per riga dal file file.txt.

Un altro modo più verboso sarebbe usare cat per inviare l'output di un file al ciclo while:

    cat data.txt | while read -r line; do
        echo $line
    done

NOTA: da aggiungere cosa fa IFS