# Introduzione

Questo testo rappresenta un corso generale di linguaggio C, con però annotazioni pensate in modo particolare per sviluppatori Java.
Insegnare il C a chi conosce un linguaggio come Java, significa mostrare il linguaggio attraverso le differenze, sintattiche e strutturali, del primo rispetto al secondo.
La sintassi di entrambi i linguaggi ha la stessa radice (quella, appunto del linguaggio C), per questo motivo gli elementi di base del linguaggio si imparano velocemente. Le differenze maggiori sono però quelle strutturali, senza dimenticare, e non lo faremo, che i due linguaggi seguono paradigmi di programmazione diversi: paradigma a oggetti per Java, paradigma procedurale per il C.

Imparare il C dopo Java permette di dare uno sguardo al passato, di rivedere alcuni concetti di programmazione che si sono evoluti nel tempo e sono in seguito sfociati in linguaggi di più nuova generazione.
La gestione della memoria, con le strutture dinamiche e l’aritmetica dei puntatori caratteristici di C, è probabilmente il primo aspetto che viene in mente a chi conosce entrambi i linguaggi: gestione a basso livello nel primo caso, comodità di avere a disposizione il meccanismo di garbage collection nel secondo caso.
La duttilità di un linguaggio come il C permette però anche di verificare l’evoluzione avvenuta in linguaggi come Java di alcune caratteristiche della programmazione a oggetti. Mi riferisco a polimorfismo e programmazione generica, che ritroviamo, anche se in uno stato embrionale, nei puntatori a funzione e nei puntatori generici.
Questi e altri elementi apparentemente meno significativi verranno sottolineati nel testo man mano che si tratteranno le varie caratteristiche del linguaggio C, la cui comprensione rimane comunque l’aspetto essenziale di questo corso.


<style>
//change background settings {}
div.slide-background {
	border-top: 30px crimson solid;
	border-bottom: 30px crimson solid;
}
</style>

# 1. Primi elementi



## 1.1. Primo programma

Il primo programma in linguaggio C consiste nella funzione principale *main()*, che è quella che viene chiamata per prima durante l'esecuzione, e la chiamata a *printf()*, funzione della libreria standard di input/output.



Ogni volta che un programma utilizza una funzione di libreria, è necessario specificare all'inizio del programma il nome della libreria in cui si trova la dichiarazione della funzione (header). In questo caso la dichiarazione si trova nel file "stdio.h", che viene copiato dal preprocessore nel file del programma prima della compilazione.

La presenza di parentesi angolari indica che il file si trova in una directory standard nota al preprocessore, specificata durante la chiamata o definita attraverso una variabile di ambiente. Per includere un header (di solito creato dal programmatore) presente nella stessa cartella dove si trova il file da compilare si usano invece le virgolette, come vedremo nel capitolo sulla modularizzazione.



### Programma "Hello World"

In [None]:
#include <stdio.h>

void main()
{
   printf("Hello world\n");
}

La funzione principale main() può essere di qualsiasi tipo, ma alcuni compilatori richiedono, attraverso un warning (avviso), che la funzione sia di tipo intero. Questo serve a comunicare il valore di exit del processo. In C++ la funzione main() può essere unicamente di tipo intero (int). 
Da una funzione di tipo intero ci si aspetta però un valore di return, cioè il risultato che la funzione restituisce verso l’esterno. Un processo, quando termina in modo corretto, restituisce il valore zero. Siccome la funzione main() rappresenta il processo, quando termina correttamente si deve farle restituire il valore zero.

In [None]:
#include <stdio.h>

int main()
{
   printf("Hello world\n");
   return 0;
}

### Ripetizione senza ciclo

Se desideriamo visualizzare più volte la stessa frase contenuta nel programma, la soluzione più semplice è quella di ripetere più volte l'istruzione di stampa:

    printf("Hello world\n");
    printf("Hello world\n");
    ...

### Ripetizione con il ciclo "While"

Se però il numero di ripetizioni aumenta, è impensabile riscrivere molte volte la stessa istruzione. Si ricorre in questo caso alla struttura del ciclo, ovvero la possibilità di determinare in anticipo la ripetizione di un intero blocco, cioè di una o più istruzioni.
Per questo primo esempio ricorriamo al ciclo "while" (e altri ne vedremo in seguito, tutti presenti anche in Java).



### Esempio 1:

In [None]:
#include <stdio.h>

int main()
{
   int count=0;
   while (count < 10){
      printf("Hello world\n");
      count = count + 1;
   }
    
    return 0;
}

## 1.2. Standard

Dal 1990 per il linguaggio C è stato definito uno standard internazionale (ISO), che ha valore maggiore dello standard americano (ANSI). A parte il diverso riconoscimento internazionale, i due standard sono identici, per cui le denominazioni ISO C, ANSI C e standard C si riferiscono tutte allo stesso linguaggio.
Su questo standard, anche chiamato C89 e poi C90, sono state applicate alcune modifiche, con emendamento sullo stesso standard, fino al 1995.
Lo standard è stato ulteriormente adattato durante gli anni 90. Questi adattamenti hanno portato allo standard C99 prima, ufficialmente riconosciuto nel 2000, e allo standard C11, riconosciuto nel 2011. 
Il C18, ultimo standard del 2018, non introduce nuove caratteristiche a livello di linguaggio, ma è mirato a risolvere problemi interpretativi dello standard precedente. Il suo fine ultimo di ogni standard è quello di promuovere la portabilità, affidabilità, manutenibilità ed efficienza.
La maggior parte dei compilatori più importanti supporta questi standard. È però utile conoscere alcuni aspetti particolari, soprattutto di C99, che tratteremo, perché non tutti i compilatori disponibili su microcontrollori sono in grado di riconoscere tutte le novità. 
In particolare, con alcuni compilatori, è necessario specificare lo standard che si desidera utilizzare.
Esempio di chiamata: 

gcc -std=c99 file.c


### Alcuni elementi caratteristici di C99

Di seguito un breve elenco di alcune delle caratteristiche più importanti introdotte con C99. Ne tratteremo alcune più avanti, magari semplicemente attraverso esempi o esercizi.

- Funzioni inline: funzioni il cui corpo viene copiato dal compilatore nel codice ogni volta che viene trovata una chiamata.

- Alcune strutture di dati: in particolare tipi per interi molto grossi, tipi per numeri complessi, ecc.

- Array di lunghezza variabile (VLA, variable-length arrays): array locali, la cui lunghezza può essere decisa a runtime, specificandola attraverso una variabile, invece che a compile time, come si è obbligati a fare con compilatori che non supportano C99.

- Dichiarazione di variabili locali non più limitata all’inizio di una funzione.

- Commenti su una linea, tipici di C++.

- Più libertà nella scelta dei caratteri per un identificatore.

- Utilizzo di bool come tipo di dato booleano, con i valori costanti true (1) e false (0), attraverso l'inclusione della libreria standard stdbool.h


### Standard C11

Nel 2007 è iniziata un’ulteriore revisione dello standard, sfociata in C11, nome derivato dalla data della sua pubblicazione, nel dicembre 2011.
Sono state aggiunte alcune novità legate alla gestione della memoria in ambiente multi-threading, con funzioni delle librerie <threads.h> e <stdatomic.h>. 
Inoltre sono state aggiunte la tipizzazione di macro generiche e le strutture anonime, già parte di C++, che tratteremo nel capitolo dedicato alle strutture.



## 1.3. Elementi Lessicali

Vediamo quali sono i caratteri che possono apparire in un programma in C (richiesti da ISO C):

1.	I 52 caratteri (maiuscoli e minuscoli) dell'alfabeto (A..Z,a..z)

2.	Le 10 cifre decimali (0..9)

3.	Caratteri vuoti (spazi, tabulatori, fine linea, form feed)

4.	Lista di 29 caratteri contenuti nella tabella seguente:

![image.png](attachment:image.png)

Altri caratteri grafici possono essere usati (@,$,ecc.), ma solo in commenti, valori di caratteri, o stringhe.



Il programma viene suddiviso in linee. Una riga di codice può continuare sulla linea di testo successiva, senza per questo essere considerata una nuova riga, utilizzando il carattere backslash (\).
Le linee seguenti:

    if (a==b) x=1; el\
    se x=2;

corrispondono esattamente a quanto segue:

    if (a==b) x=1; else x=2;



In [None]:
#include <stdio.h>

int main()
{
   int count=0;
   while (count < 10){
      printf("Hello world\n");
      count = count + 1;
   }
    
    return 0;
}

## 1.2. Standard

Dal 1990 per il linguaggio C è stato definito uno standard internazionale (ISO), che ha valore maggiore dello standard americano (ANSI). A parte il diverso riconoscimento internazionale, i due standard sono identici, per cui le denominazioni ISO C, ANSI C e standard C si riferiscono tutte allo stesso linguaggio.
Su questo standard, anche chiamato C89 e poi C90, sono state applicate alcune modifiche, con emendamento sullo stesso standard, fino al 1995.
Lo standard è stato ulteriormente adattato durante gli anni 90. Questi adattamenti hanno portato allo standard C99 prima, ufficialmente riconosciuto nel 2000, e allo standard C11, riconosciuto nel 2011. 
Il C18, ultimo standard del 2018, non introduce nuove caratteristiche a livello di linguaggio, ma è mirato a risolvere problemi interpretativi dello standard precedente. Il suo fine ultimo di ogni standard è quello di promuovere la portabilità, affidabilità, manutenibilità ed efficienza.
La maggior parte dei compilatori più importanti supporta questi standard. È però utile conoscere alcuni aspetti particolari, soprattutto di C99, che tratteremo, perché non tutti i compilatori disponibili su microcontrollori sono in grado di riconoscere tutte le novità. 
In particolare, con alcuni compilatori, è necessario specificare lo standard che si desidera utilizzare.
Esempio di chiamata: 

gcc -std=c99 file.c


### Alcuni elementi caratteristici di C99

Di seguito un breve elenco di alcune delle caratteristiche più importanti introdotte con C99. Ne tratteremo alcune più avanti, magari semplicemente attraverso esempi o esercizi.

- Funzioni inline: funzioni il cui corpo viene copiato dal compilatore nel codice ogni volta che viene trovata una chiamata.

- Alcune strutture di dati: in particolare tipi per interi molto grossi, tipi per numeri complessi, ecc.

- Array di lunghezza variabile (VLA, variable-length arrays): array locali, la cui lunghezza può essere decisa a runtime, specificandola attraverso una variabile, invece che a compile time, come si è obbligati a fare con compilatori che non supportano C99.

- Dichiarazione di variabili locali non più limitata all’inizio di una funzione.

- Commenti su una linea, tipici di C++.

- Più libertà nella scelta dei caratteri per un identificatore.

- Utilizzo di bool come tipo di dato booleano, con i valori costanti true (1) e false (0), attraverso l'inclusione della libreria standard stdbool.h


### Standard C11

Nel 2007 è iniziata un’ulteriore revisione dello standard, sfociata in C11, nome derivato dalla data della sua pubblicazione, nel dicembre 2011.
Sono state aggiunte alcune novità legate alla gestione della memoria in ambiente multi-threading, con funzioni delle librerie <threads.h> e <stdatomic.h>. 
Inoltre sono state aggiunte la tipizzazione di macro generiche e le strutture anonime, già parte di C++, che tratteremo nel capitolo dedicato alle strutture.



## 1.3. Elementi Lessicali

Vediamo quali sono i caratteri che possono apparire in un programma in C (richiesti da ISO C):

1.	I 52 caratteri (maiuscoli e minuscoli) dell'alfabeto (A..Z,a..z)

2.	Le 10 cifre decimali (0..9)

3.	Caratteri vuoti (spazi, tabulatori, fine linea, form feed)

4.	Lista di 29 caratteri contenuti nella tabella seguente:

![image.png](attachment:image.png)

Altri caratteri grafici possono essere usati (@,$,ecc.), ma solo in commenti, valori di caratteri, o stringhe.



Il programma viene suddiviso in linee. Una riga di codice può continuare sulla linea di testo successiva, senza per questo essere considerata una nuova riga, utilizzando il carattere backslash (\).
Le linee seguenti:

    if (a==b) x=1; el\
    se x=2;

corrispondono esattamente a quanto segue:

    if (a==b) x=1; else x=2;



### Commenti

Un commento in un programma in C inizia con la sequenza di due caratteri /* e termina con la sequenza inversa */.
I commenti possono contenere un qualsiasi numero di caratteri. Il compilatore li considera tutti come un unico carattere vuoto.
Alcuni compilatori accettano e riconoscono commenti nidificati. Questa implementazione non è però standard, perciò un programma, per essere portabile, non dovrebbe contenere questo tipo di commenti.
Durante lo sviluppo di programmi, durante il test, capita di voler eliminare provvisoriamente una parte di codice. Lo si può fare inserendo la sequenza di linee da eliminare in un commento. Se però le stesse a loro volta già contengono un commento, si creano commenti nidificati. Per evitare questa situazione si può ricorrere alla seguente istruzione di preprocessore:

#if 0
... codice da eliminare
#endif

A partire dallo standard C99, inoltre, c'è la possibilità di usare il commento sun una linea come in C++, usando il doppio slash (//) all'inizio del commento, che termina con il primo fine linea.

### Identificatori

Un identificatore, o nome, è una sequenza di lettere, cifre e "underscore". Un identificatore deve avere il primo carattere che non sia una cifra e non deve corrispondere a una parola riservata del linguaggio.

identifier 	::= (letter|_){(letter|digit|_)}

Il linguaggio C distingue tra lettera maiuscola e lettera minuscola. Questo significa che i due identificatori abc e aBc sono considerati diversi.


### Parole riservate

Le parole riservate sono gli identificatori che fanno parte del linguaggio, i simboli che formano il vocabolario di base. Quando il compilatore, durante l'analisi lessicale, incontra queste parole, dà loro il significato definito nel linguaggio.
Alcune le abbiamo appena viste (void, int, while), altre le vedremo in seguito. Le parole chiave sono tutte minuscole.




## 1.4. Variabili

Una variabile serve ad identificare attraverso un nome una locazione di memoria. Questa locazione contiene valori che possono essere modificati e aggiornati durante l'esecuzione del programma. 

![Variabili.png](attachment:Variabili.png)

Il nome di una variabile è un identificatore e come tale può essere composto da lettere, cifre e "underscore". Poiché le lettere maiuscole e quelle minuscole sono distinte, x e X rappresentano due caratteri diversi. Nella prassi di C si adottano lettere minuscole per i nomi delle variabili.
I nomi interni (identificatori utilizzati solo all'interno del programma) possono essere composti da almeno 31 caratteri significativi. Per nomi esterni lo standard garantisce l'unicità dei primi 6 caratteri.
È buona abitudine scegliere nomi legati allo scopo delle diverse variabili.

### Tipi scalari

    char               1 byte   [-128...127]

    unsigned char      1 byte   [0...255]

    int                4 byte (o 2)	[-2'147'483'648...2'147'483'647]

    unsigned int       4 byte (o 2)	[0...4'294'967'295]

    long, long int     4 byte 	[-2'147'483'648...2'147'483'647]

    unsigned long      4 byte	[0...4'294'967'295]

    short, short int   2 byte	[-32'768...32'767]

    unsigned short     2 byte	[0..65'535]

    float              4 byte 	[0.29x10-38, 1.7x10+30] 
    (7 cifre decimali)
    
    double             8 byte 	[0.29x10-38, 1.7x10+30] 
    (16 cifre dec.)

Esistono, come visto, alcuni qualificatori che possono essere applicati ai tipi.
Lo scopo è quello di fornire delle lunghezze diverse per gli interi. L'attributo short indica un intero di 16 bit, mentre long uno di 32. Il tipo int occuperà 16 o 32 bit.
Ogni implementazione definisce l'ampiezza dei tipi di base e i loro valori limite. Questi valori possono essere letti nel file header <limits.h> per i valori interi, e nel file <float.h> per i numeri a virgola mobile.

Abbiamo inoltre visto che dal C99, includendo la libreria standard stdbool.h è possibile simulare l'utilizzo di dati booleani con il tipo di dato bool e i suoi valori true (1) e false (0)


In [None]:
#include <stdio.h>

int main()
{
    int risultato = 10;
    int contatore = 20;
    
    printf("Valori delle variabili: %d %d\n", risultato, contatore);
    
    return 0;
}

### Valori in limits.h

ISO C richiede che i valori limite dell'implementazione dei numeri interi vengano documentati nel file header <limits.h> attraverso una lista di costanti. Ogni implementazione avrà i suoi valori. Lo standard definisce quali devono essere i valori minimi.

![Valori-limits.png](attachment:Valori-limits.png)

I valori di CHAR_MIN e CHAR_MAX variano a dipendenza del tipo associato a char. Solitamente il default è signed char, quindi vale il primo valore nella tabella.

### Valori in float.h

Analogamente esiste un file header per i valori limite dei numeri a virgola mobile.
Una rappresentazione dei numeri a virgola mobile utilizzata da parecchi microprocessori è quella definita da IEEE Standard for Binary Floating-Point Arithmetic. Definisce i modelli per i numeri a singola (32 bit) e doppia (64 bit) precisione.
Alcuni valori di <float.h> corrispondenti a questi tipi sono mostrati nella tabella seguente:

![Valori-float.png](attachment:Valori-float.png)

### Dichiarazioni

Tutte le variabili, prima di poter essere utilizzate, devono essere dichiarate.

    int a,b,c;
    char ch;

Le variabili possono anche essere inizializzate.

    int a= 30;

### Tipo bool

Da C99 sono state definite costanti che permettono di simulare in C l’utilizzo di variabili booleane.



In [None]:
#include <stdbool.h>
#include <stdio.h>

int main()
{
   bool acceso = false;
   
   if (acceso) {
      printf("Acceso\n");
      printf("Valore reale: %d\n", acceso);
   } else {
      printf("Spento\n");
      printf("Valore reale: %d\n", acceso);
   }
}





## 1.5. Valori costanti

Esistono 4 tipi diversi di valori costanti: interi, floating-point, caratteri e stringhe (sequenze di caratteri).

### Valori interi

Un valore qualsiasi 1234 sarà considerato int, mentre per essere long dovrà essere seguito da una l (elle) o L. I valori costanti privi di segno (unsigned) devono terminare con una u o U. UL significa unsigned long.
Ci sono alcune regole di interpretazione:

1.	Se un valore intero è preceduto dalle lettere 0x o 0X (zero x) allora significa che viene espresso in notazione esadecimale, con i caratteri a..f (oppure A..F) a rappresentare i valori da 10 a 15.

2.	Se un valore intero inizia con la cifra 0 (zero), allora significa che viene espressa in notazione ottale (cifre da 0 a 7).

3.	Nei rimanenti casi il valore sarà considerato espresso in notazione decimale.

Il valore di una costante intera è sempre positivo, a meno che ci sia overflow. Se il valore è preceduto da un segno meno (-), l'operazione unaria viene applicata alla costante, ma non fa parte della costante stessa.


### Valori floating-point

Un valore costante floating-point può essere espresso con il punto decimale, con un esponente o con entrambi. Viene sempre interpretato con valore in base 10.
I suffissi sono due: f (oppure F) per esprimere float, l (oppure L) per esprimere double.
Gli esempi seguenti rappresentano valori costanti numerici validi:

0.
3e1
3.14159
.0
1.0E-3
1e-3
1.0
.00034
2e+9
1.0f
1.0e67L

### Caratteri

Un carattere si esprime utilizzando gli apici semplici, in questo modo: 'a'.
Esiste un meccanismo che fa uso di caratteri escape che serve a esprimere caratteri particolari o valori numerici che sarebbe scomodo o impossibile inserire direttamente nel codice del programma, come vedremo più avanti.
Un valore costante carattere in C viene considerato tipo int. La conseguenza più diretta è che sizeof('c') è diversa da sizeof(char).
Tipicamente si esprime con un carattere semplice o un codice escape, e il valore è il codice intero corrispondente al carattere. 
Ecco alcuni esempi di caratteri singoli con i loro valori nella tabella ASCII espressi in decimale:

    'a'	97
    ' '	32
    '\r'	13
    '"'	34
    '%'	37
    '8'	56
    'A'	65
    '?'	63
    '\0'	0
    '\377'	255
    '\23'	19
    '\\'	92



### Stringhe

Il valore di una stringa viene circondato da doppi apici. Lo stesso meccanismo di escape possibile nei caratteri può essere utilizzato per ogni singolo carattere della stringa. È buona cosa fare uso della sequenza di escape per ogni carattere particolare che potrebbe verificarsi poco leggibile nel testo del programma.

Ecco alcuni esempi di stringa:

""
"\""
"Buona giornata"
"Ogni commento inizio con '/*' e termina con '*/'.\n"

Ad ogni stringa costante di n caratteri verrà associato, durante l'esecuzione, un blocco statico contiguo di n+1 caratteri in memoria. I primi n corrisponderanno ai caratteri della stringa, l'ultimo conterrà il carattere nullo di fine stringa '\0'.


### Caratteri di escape

Come già anticipato, i caratteri di escape possono essere utilizzati per rappresentare caratteri particolari che sarebbe altrimenti scomodo o impossibile inserire nel sorgente del programma. Ce ne sono di due tipi: "codici escape carattere", usati per rappresentare caratteri particolari, e "codici escape numerici", che permettono a un carattere di essere rappresentato attraverso il suo codice numerico corrispondente.
Ecco alcuni codici escape carattere:

    \a	allarme
    \b	backspace
    \f	form feed
    \n	newline
    \r	carriage return
    \t	horizontal tab
    \v	vertical tab
    \\	backslash
    \'	apice
    \"	virgolette
    \?	punto esclamativo


I codici escape numerici permettono ad ogni valore di tipo unsigned char di essere espresso scrivendo il valore direttamente in notazione ottale o esadecimale.
Ad esempio, nella codifica ASCII, il carattere 'a' può essere espresso con '\141' (codice 97 in decimale) e il carattere '?' con '\77' (codice 63 in decimale).




## 1.6. Costanti

Si distinguono due modi per far uso di costanti in C: costante simbolica e uso del qualificatore const.

### Costante simbolica

Viene chiamato costante simbolica il caso di sostituzione all'inizio del programma di un valore con un simbolo. L'associazione viene fatta dal preprocessore attraverso l'istruzione #define. Il preprocessore stesso si occupa di sostituire il simbolo con il valore corrispondente ad ogni sua apparizione nel codice del programma prima della compilazione vera e propria.
È un caso particolare (semplice) di macro, che tratteremo più avanti. Non c'è nessuna allocazione di memoria, proprio perché si tratta di una sostituzione effettuata dal preprocessore.
Proprio perché si tratta di una sostituzione, per evitare problemi,è prassi utilizzare le lettere maiuscole per definire il nome di una costante.

    #define MAX 100
    #define PI 3.14159

### Qualificatore const

La parola chiave riservata const essere applicata alla dichiarazione di qualsiasi variabile, per specificare che qual valore non verrà mai alterato.

    const int step = 10;

Un elemento dichiarato con questo qualificatore viene appunto chiamato costante, perché, tranne che nella dichiarazione, non potrà mai apparire come lvalue, cioè non potrà mai essere utilizzato nella parte sinistra di un'espressione di assegnamento.
Il compilatore controlla che questo non avvenga. Ecco alcuni esempi in cui il compilatore accetta l'espressione, oppure segnala un errore:

    const int fine = 100;	/* corretto */
    ...
    max = fine;					/* corretto */
    fine = 200;					/* errore */
    fine++;						/* errore */

In [None]:
#include <stdio.h>

#define MAX 100

int main()
{
    const int step = 10;
    
    printf("Valori delle costanti: %d %d\n", MAX, step);
    
    return 0;
}


## 1.7. Ridefinizione

Un nuovo tipo può essere semplicemente definito uguale a un tipo già esistente con l'utilizzo della parola chiave typedef, come segue:

    typedef  tipo_esistente  nuovo_tipo;

L'elemento tipo_esistente può essere sia un tipo built-in (cioè predefinito nel linguaggio C, come ad esempio int), oppure un tipo definito in precedenza dall'utente.

    typedef  int  Tipo1;
    typedef  char  Tipo2;
    typedef  tipo1 Tipo3;

Questo è un primo esempio di una caratteristica importante presente nella costruzione di tipi: un nuovo tipo può essere costruito a partire da un tipo già definito dall'utente. Sulla base di questo, nuovi tipi possono essere definiti, e così via.


In [None]:
#include <stdio.h>

typedef int MioIntero;

int main()
{
    MioIntero mio = 10;
    
    printf("Valore della variabile: %d\n", mio);
    
    return 0;
}