## Appunti e Documentazione per Esercitazioni di Reti Logiche A.A. 2025/26

Raffaele Zippo

1 ottobre 2025

## **Indice**

| _ | 1.1 Chi tiene il corso                                      | 7                    |
|---|-------------------------------------------------------------|----------------------|
| 2 | Introduzione 2.1 Perché compilare, testare, debuggare       | 9                    |
| 3 | Ambienti di sviluppo  3.1 Editor                            | 11<br>12<br>12<br>13 |
| 4 | Essere efficienti con VS Code 4.1 Le basi elementari        | 17                   |
| I | Assembler                                                   | 19                   |
| 5 | Ambiente di sviluppo  5.1 Struttura dell'ambiente           |                      |
| I | Esercitazioni 2                                             | 25                   |
|   |                                                             | 3C<br>34             |
| 7 | Esercitazione 2 7.1 Soluzioni passo-passo esercizi per casa | 48                   |
| 8 | Esercitazione 3 8.1 Soluzioni esercizi per casa             | 53                   |

INDICE 3

| 9  | Esercitazione 4                                                    | 55              |
|----|--------------------------------------------------------------------|-----------------|
|    | <ul> <li>9.1 Esercizio 4.1: esercizio d'esame 2023-01-10</li></ul> |                 |
|    |                                                                    |                 |
| П  | Documentazione                                                     | 57              |
| 10 | Architettura x86                                                   | 59              |
|    | 10.1 Registri                                                      |                 |
|    | 10.2 Memoria                                                       |                 |
|    | 10.3 Spazio di I/O                                                 |                 |
|    | 10.4 Condizioni ai reset                                           | 60              |
| 11 | Istruzioni processore x86                                          | 61              |
|    | 11.1 Spostamento di dati                                           |                 |
|    | 11.2 Aritmetica                                                    |                 |
|    | 11.4 Traslazione e Rotazione                                       |                 |
|    | 11.5 Controllo di flusso                                           |                 |
|    | 11.6 Operazioni condizionali                                       | 64              |
|    | 11.7 Istruzioni stringa                                            |                 |
|    | 11.8 Altre istruzioni                                              | 66              |
| 12 | Sottoprogrammi di utility                                          | 67              |
|    | 12.1 Terminologia                                                  | 67              |
|    | 12.2 Caratteri speciali                                            | 67              |
|    | 12.3 Sottoprogrammi                                                | 67              |
| 13 | Debugger gdb                                                       | 69              |
|    | 13.1 Controllo dell'esecuzione                                     | 69              |
|    | 13.2 Ispezione dei registri                                        |                 |
|    | 13.3 Ispezione della memoria                                       |                 |
|    | 13.4 Gestione dei breakpoints                                      | 71              |
| 14 | Tabella ASCII                                                      | 73              |
| 15 | Ambiente d'esame e i suoi script                                   | 75              |
|    | 15.1 Aprire l'ambiente                                             | 75              |
|    | 15.2 Il terminale Powershell                                       | 76              |
|    | 15.3 Eseguire gli script                                           | 76              |
|    |                                                                    |                 |
| Ш  | Appendice                                                          | 79              |
| 16 | Problemi comuni                                                    | 81              |
|    | 16.1 Setup dell'ambiente                                           | 81              |
|    | 16.2 Uso dell'ambiente                                             | 82              |
|    |                                                                    |                 |
| II | Verilog                                                            | 83              |
| IV | Esercitazioni                                                      | 85              |
| 47 | Facusitariana 4                                                    | 07              |
| 1/ | <b>Esercitazione 1</b> 17.1 Da schemi circuitali a codice          | <b>87</b><br>87 |
|    | 17.2 Concetto di testbench                                         |                 |

4 INDICE

|    | 17.3 Full adder, descrizione e sintesi di reti combinatorie                                                                                                                                                                                                                                                                                  | 92                                                                               |
|----|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|----------------------------------------------------------------------------------|
| 18 | Esercitazione 2  18.1 Errori comuni: i corto circuiti  18.2 Uso efficiente di VS Code  18.3 Esercizi d'esame                                                                                                                                                                                                                                 | 99<br>99<br>99                                                                   |
| 19 | Esercitazione 3 19.1 Reti sincronizzate                                                                                                                                                                                                                                                                                                      | <b>109</b> 109                                                                   |
| 20 | Esercitazione 4  20.1 Esercizio 4.1: Descrizione                                                                                                                                                                                                                                                                                             | 123                                                                              |
| 21 | Esercitazione 5         21.1 Esercizio 5.1: esame 2023-07-18                                                                                                                                                                                                                                                                                 |                                                                                  |
| 22 | Esercitazione 6         22.1 Esercizio 6.1: esame 2024-07-16                                                                                                                                                                                                                                                                                 |                                                                                  |
| ٧  | Documentazione                                                                                                                                                                                                                                                                                                                               | 139                                                                              |
|    |                                                                                                                                                                                                                                                                                                                                              |                                                                                  |
| 23 | Introduzione                                                                                                                                                                                                                                                                                                                                 | 141                                                                              |
|    | Introduzione  Operatori 24.1 Valori letterali ( literal values ) 24.2 Operatori aritmetici                                                                                                                                                                                                                                                   | 143<br>143<br>143<br>144<br>144                                                  |
| 24 | Operatori 24.1 Valori letterali ( literal values )                                                                                                                                                                                                                                                                                           | 143<br>143<br>143<br>144<br>144<br>145<br>147<br>147<br>147<br>148<br>148<br>149 |
| 24 | Operatori 24.1 Valori letterali ( literal values ) 24.2 Operatori aritmetici 24.3 Operatori logici e bitwise 24.4 Operatore di selezione [] 24.5 Operatore di concatenazione {} 24.6 Operazioni comuni  Sintassi per reti combinatorie 25.1 module 25.2 wire 25.3 Usare un module in un altro module 25.4 Tabelle di verità 25.5 Multiplexer | 143 143 143 144 144 145 147 147 148 149 150 151 151 152 152                      |

INDICE 5

|    | 27.1 Compilazione e simulazione                        |     |
|----|--------------------------------------------------------|-----|
| VI | Appendice                                              | 159 |
|    | Simulatore processore sEP8  28.1 Lancio di simulazioni |     |

## 1. Esercitazioni di Reti Logiche

Questa dispensa contiene appunti e materiali per le esercitazioni del corso di Reti Logiche, Laurea Triennale di Ingegneria Informatica dell'Università di Pisa, A.A. 2025/26.

Il contenuto presume conoscenza degli aspetti teorici già discussi nel corso, ricordando alla bisogna solo gli aspetti direttamente collegati con gli esercizi trattati.

#### Materiale in costruzione

Questa dispensa contiene materiale in via di stesura, è messa a disposizione per essere utile quanto prima.

Potrebbero esserci inesattezze o errori. Siete pregati, nel caso, di segnalarlo.

Il contenuto di partenza è quello dell'anno precedente, e verrà sostituito man mano in base a quello che viene svolto a lezione. Aspettativi quindi che cambi *molto* durante il trimeste del corso.

#### 1.1 Chi tiene il corso

Il corso è tenuto dal Prof. Giovanni Stea 🖾. Le esercitazioni sono tenute dal Dott. Raffaele Zippo 🖾. La pagina ufficiale del corso è http://docenti.ing.unipi.it/~a080368/Teaching/RetiLogiche/index\_RL.html.

## 2. Introduzione

#### 2.1 Perché compilare, testare, debuggare

If debugging is the process of removing bugs, then programming must be the process of putting them in. Edsger W. Dijkstra

Si parta dal presupposto che fare errori succede. Meno è banale il progetto o esercizio, più è facile che da qualche parte si sbagli. La parte importante è riuscire a cogliere e rimuovere questi errori prima che sia troppo tardi, sia che si tratti di rilasciare un software in produzione o di consegnare l'esercizio a un esame. In queste esercitazioni vedremo questo processo in contesti specifici (software scritto in assembler e reti logiche descritte in Verilog) ma la linea si applica in generale in tutti gli altri ambiti dell'ingegneria informatica.

Dunque il codice, di qualunque tipo sia, non va solo scritto, va provato. Come identificare, trovare e rimuovere gli errori è invece una capacità pratica che va esercitata.

#### 2.2 Ambienti utilizzati

Gli strumenti a disposizione per provare e testare il codice, così come la loro praticità d'uso possono cambiare molto in base ad architettura, sistema operativo, e generale potenza delle macchine utilizzate.

Dato che il corso è collegato a un esame, ci si concentrerà sullo stesso ambiente che sarà disponibile all'esame, che è dunque basato su PC desktop con Windows 11 e architettura x86. Il software e le istruzioni a disposizione riguarderanno questa combinazione.

Per altre architetture e sistemi operativi, il supporto è sporadico e *best effort*, con nessuna garanzia da parte dei docenti che funzioni. Dovrete, con molta probabilità, litigare con il vostro computer per far funzionare il tutto.

Una introduzione generale alle opzioni è in Ambienti software.

#### 2.3 Domande e ricevimenti

Siamo a disposizione per rispondere a domande, spiegare esercizi, colmare lacune. Gli orari ufficiali di ricevimento sono comunicati durante il corso e tenuti aggiornati sulle pagine personali. È sempre una buona idea scrivere prima, via email o Teams, per evitare impegni concomitanti o risolvere più rapidamente in via testuale. In caso di dubbi su esercizi, aiuta molto allegare il testo dell'esercizio (foto o pdf) e il codice sorgente (sempre e solo file testuale, non foto o file binari).

Non è raro che gli studenti si sentano in imbarazzo o comunque evitino di fare domande, quindi ci spendo qualche parola in più. Fuori dall'esame, è nostro *compito* insegnare, e questo include rispondere alle domande. È un *diritto* degli studenti chiedere ricevimenti e avere risposte. Avere dubbi o lacune è in questo contesto *positivo*, perché sapere di non sapere qualcosa è un primo passo per imparare.

## 3. Ambienti di sviluppo

In questo corso, scriveremo codice per programmi assembler e per descrivere reti logiche in Verilog. Per entrambi, utilizziamo un ambiente software che è lo stesso (o estremamente simile) a quello che si troverà all'esame.

#### 3.1 Editor

Nelle esercitazioni e nella documentazione faremo riferimento a VS Code, che è l'unico editor che si potrà utilizzare all'esame.

Non c'è però nessun obbligo a usare VS Code per le esercitazioni personali, qualunque editor di file di testo andrà bene. Anche un editor da terminale come nano o vim.

#### 3.2 Ambiente assembler

Programmare in assembler vuol dire programmare per una specifica architettura di processori. L'architettura x86 è stata rimpiazzata nel tempo da x64, a 64 bit, che è del tutto retrocompatibile. Altre architetture (in particolare, ARM) hanno istruzioni, registri e funzionamento completamente diversi e non sono compatibili con x86. Usare una macchina con architettura diversa è inevitabilmente fonte di problemi.

L'ambiente fornito funziona con Linux x86 (o x64 o amd64, che significano la stessa cosa). Non funziona invece per processori arm64, come quelli usati da MAC o Windows on ARM.

Da una parte, si potrebbe pensare di esercitarsi scrivendo assembler per la propria architettura, anziché quella usata nel corso. Sorgono diversi problemi:

- dover imparare sintassi, meccanismi, registri completamente diversi;
- dover fare a meno o reingegnerizzarsi la libreria usata per l'input-output a terminale;
- dover comunque imparare l'assembler mostrato nel corso, perché quella sarà richiesta all'esame e supportata dalle macchine in laboratorio.

La seconda opzione è usare strumenti di virtualizzazione capaci di far girare un sistema operativo con architettura diversa. Sorge come principale problema l'ergonomicità ed efficienza di questa soluzione, che dipende molto dagli strumenti che si trovano e dalle caratteristiche hardware della macchina, che potrebbero essere non sufficienti.

Per chi ha una macchina ARM, sarà necessario trovare soluzioni di virtualizzazione o usare un'altra macchina dedicata (va bene qualunque cosa di qualunque potenza, purché x86). In ogni caso, non offriamo nessun supporto diretto a tali macchine. Lo ribadisco in rosso, perché chiesto spesso.

#### Nessun supporto diretto per MAC con ARM

Non testiamo né supportiamo ambienti per MAC con ARM, che non abbiamo a disposizione. *Ci è stato detto* che UTM può emulare l'architettura x86, affermazione che riportiamo senza alcuna garanzia. Non risponderemo a ulteriori domande a riguardo, soprattutto se parte delle domande frequenti.

Oltre a questioni di architettura, abbiamo anche il sistema operativo, che è rilevante per gestire input e output da terminale. I programmi che scriveremo ed eseguiremo, così come quelli utilizzati per assemblare, gireranno in un terminale Linux. Nei pacchetti forniti e in sede di esame, si usa in particolare Ubuntu 24.04.

#### Perché Linux?

Perché è molto più facile virtualizzare un ambiente Linux moderno in Windows o MAC che il contra-

rio. In precedenza si usava MS-DOS, un sistema del 1981 facilmente emulabile, ma molto limitante data l'età.

Per assemblare, si usa gcc, per debuggare gdb. Per usarli però sono necessari comandi *lunghi*, che semplifichiamo usando script Powershell assemble.ps1 e debug.ps1.

#### Perché Powershell?

Perché Powershell (2006) è object-oriented, e permette di scrivere script leggibili e manutenibili, in modo semplice. Bash (1989) è invece text-oriented, con una lunga lista di trappole da saper evitare.

#### 32 vs 64 bit

In realtà, i processori x86 a *soli* 32 bit non sono più in commercio da vent'anni. I processori che si trovano oggi sono x64, a 64 bit, e sono in grado di eseguire codice a 32 bit per retrocompatibilità. Nel corso, continuiamo ad usare l'istruction set a 32 bit perché

- 1. è di complessità ridotta e sufficiente per i nostri scopi didattici,
- 2. il vecchio ambiente DOS, che qualcuno può trovare ancora utile, supporta solo x86.

#### 3.3 Ambiente Verilog

L'ambiente Verilog non ha i problemi di quello assembler, perché quel che compiliamo (una rete simulabile) non è legato sistema operativo o all'architettura della CPU. Basta che si riescano ad installare

- iverilog e vvp
- GTKWave

#### 3.4 Versioni dell'ambiente e alternative

L'ambiente dell'A.A. 2025/26 è leggermente diverso da quello degli anni precedenti. Le differenze riguardano solo aspetti di installazione e configurazione, il modo di utilizzo rimane pressoché invariato.

Se si ha già un ambiente funzionante, non c'è bisogno di fare nulla.

L'ambiente è fornito in due versioni:

- Windows 11 + WSL2
- Linux nativo o devcontainer

Questi contengono sia istruzioni per installazione e configurazione, sia le cartelle assembler e verilog con i file necessari per scrivere codice.

Tenere presente che non c'è bisogno di utilizzare lo stesso tipo di pacchetto o macchina per assembler e Verilog, le due scelte sono indipendenti.

#### 3.5 Ambiente per Windows 11 + WSL2

#### **Download**

Questo pacchetto supporta macchine Windows  $11 \times 64$ , utilizza WSL2 per virtuallizare un sistema Ubuntu 24.04 per assembler, e applicazioni native per Verilog.

WSL2 è un sottosistema di Windows che permette di virtualizzare macchine Linux in modo semplice, e l'integrazione con VS Code tramite l'estensione WSL permette di scrivere codice *fuori* dalla macchina virtuale ed assemblare ed eseguire *dentro* la macchina virtuale. Questo ci permette di mantenere un ambiente grafico moderno mentre si lavora con un terminare Linux virtualizzato.



Figura 3.1: Schema dell'ambiente usato all'esame.

Il pacchetto dell'ambiente contiene le istruzioni passo passo per installare e configurare la macchina virtuale su una macchina Windows 11 con architettura x86.

Per l'ambiente Verilog, invece, ci sono sia installer precompilati qui che codice sorgente qui e qui.

#### 3.6 Ambiente per Linux nativo o devcontainer

#### **Download**

Questo pacchetto supporta due scenari: una macchina con Linux x64, oppure devcontainers tramite Docker

Il pacchetto contiene le cartelle assembler e verilog con i file necessari per scrivere codice.

#### Utilizzo nativo

Per assembler, l'ambiente Linux deve essere in grado di

- Eseguire gli script powershell dell'ambiente
- Assemblare, usando gcc, programmi x86 scritti con sintassi GAS
- Eseguire programmi x86
- Debuggarli usando gdb

Per far questo su Ubuntu 24.04, i pacchetti da installare sono

- build-essential
- gcc-multilib
- gdb
- powershell (guida)

Per Verilog, l'ambiente Linux deve essere in grado di

- Compilare simulazioni con iverilog
- Eseguire simulazioni con vvp
- Visualizzare waveform con gtkwave

Per far questo su Ubuntu 24.04, i pacchetti da installare sono

- iverilog
- gtkwave

Script e istruzioni si basano anche su due altri programmi: `wget` e `file`. Di solito sono inclusi di default per installazioni Desktop, ma su installazioni minime → (come l'immagine Docker di Ubuntu 24.04) vanno installati manualmente.

Una volta installato il software richiesto, per sviluppare basterà aprire le cartelle con VS Code.

#### Utilizzo tramite devcontainer

I devcontainer sono un'altra forma di virtualizzazione integrata in VS Code, basata su Docker anziché WSL. Il pacchetto include, nelle cartelle .devcontainer, i Dockerfile che installano il software necessario su immagini Ubuntu 24.04.

Una volta aperta la cartella con VS Code, usare il comando "Riapri in devcontainer".

#### 3.7 Alternative fai da te

Un'altra opzione molto utile di VS Code è lo sviluppo remoto tramite SSH usando questa estensione. In questo caso, invece di collegarsi a un ambiente di sviluppo virtualizzato, questo risiede su un'altra macchina a cui ci si collega aprendo un terminale SSH.



Figura 3.2: Schema di un ambiente che usa SSH.

Da notare che le macchine sono distinte "concettualmente": niente ci vieta di avere una macchina virtuale (e.g. VirtualBox) al posto di una macchina fisicamente distinta.

#### 3.8 Testare gli ambienti

I pacchetti includono dei file per testare che l'ambiente sia utilizzabile.

#### **Assembler**

Il file test-ambiente.s contiene il codice di un semplice programma che si limita a stampare 0k.. Provare ad assemblarlo, eseguirlo e debuggarlo.

```
PS /workspaces/assembler> ./assemble.ps1 ./test-ambiente.s
PS /workspaces/assembler> ./test-ambiente
Ok.
PS /workspaces/assembler> ./debug.ps1 ./test-ambiente
GNU gdb (Ubuntu 15.0.50.20240403-Oubuntu1) 15.0.50.20240403-git
[output di poca utilità]
Breakpoint 1, _main () at /workspaces/assembler/test-ambiente.s:7
7     _main: nop
(gdb) qq
PS /workspaces/assembler>
```

#### Verilog

Il file test-ambiente.v contiene il codice di una semplice testbench con registro da 1 bit che cambia valore, e stampa Ok. a terminale prima di terminare. Provare a compilare ed eseguire la simulazione, e poi osservarne la waveform.

```
PS /workspaces/verilog> iverilog -o sim ./test-ambiente.v
PS /workspaces/verilog> vvp ./sim
VCD info: dumpfile waveform.vcd opened for output.
Ok.
```

./test-ambiente.v:10: \$finish called at 20 (1s)
PS /workspaces/verilog> gtkwave ./waveform.vcd
[output di poca utilità]
PS /workspaces/verilog>

## 4. Essere efficienti con VS Code

VS Code è l'editor disponibile in sede d'esame e mostrato a lezione. Come ogni strumento di lavoro, è una buona idea imparare ad usarlo bene per essere più rapidi ed efficaci. Questo si traduce, in genere, nel prendere l'abitudine di usare meno il mouse e più la tastiera, usando le dovute scorciatoie e combinazioni di tasti.

In questa documentazione ci focalizziamo sulle combinazioni per Windows, che sono quelle che troverete all'esame. Evidenzierò con una  $\mbox{\ensuremath{\nwarrow}}$  le combinazioni più importanti e probabilmente meno note.

#### Salvare i file

Fra le cause dei vari errori per cui riceviamo richieste d'aiuto, una delle più frequenti è che i file modificati non sono stati salvati. Un file modificato ma non salvato è indicato da un pallino nero nella tab in alto, e le modifiche non saranno visibili a altri programmi come gcc e iverilog. Si consiglia di salvare spesso e abitualmente, usando ctrl + s.

#### 4.1 Le basi elementari

Quando si scrive in un editor, il testo finisce dove sta il cursore (in inglese *caret* ). È la barra verticale che indica dove stiamo scrivendo. Si può spostare usando le frecce, non solo destra e sinistra ma anche su e giù. Usando font monospace, infatti, il testo è una matrice di celle delle stesse dimensioni, ed è facile prevedere dove andrà il caret anche mentre ci si sposta tra le righe.

Vediamo quindi le combinazioni più comuni.

|                           | Tasti                | Cosa fa                                               |
|---------------------------|----------------------|-------------------------------------------------------|
|                           | Tenere premuto shift | Seleziona il testo seguendo il movimento del cursore. |
|                           | ctrl + c             | Copia il testo selezionato.                           |
|                           | ctrl + v             | Incolla il testo selezionato.                         |
|                           | ctrl + x             | Taglia (cioè copia e cancella) il testo selezionato.  |
|                           | ctrl + f             | Cerca all'interno del file.                           |
|                           | ctrl + h             | Cerca e sostituisce all'interno del file.             |
| $\stackrel{\frown}{\Box}$ | ctrl + s             | Salva il file corrente.                               |
|                           | ctrl + shift + p     | Apre la Command Palette di VS Code.                   |

#### 4.2 Le basi un po' meno elementari

Si può spostare il cursore in modo ben più rapido che un carattere alla volta.

|                                                                                   | Tasti                       | Cosa fa                                                                        |
|-----------------------------------------------------------------------------------|-----------------------------|--------------------------------------------------------------------------------|
| $\Box$                                                                            | ctrl + freccia sx o dx      | Sposta il cursore di un token (in genere una parola, ma dipende dal contesto). |
| home (inizio in italiano, più spesso 🚺 ) Sposta il cursore all'inizio della riga. |                             | Sposta il cursore all'inizio della riga.                                       |
| end (fine in italiano) Sp                                                         |                             | Sposta il cursore alla fine della riga.                                        |
|                                                                                   | ctrl + shift + f            | Cerca all'interno della cartella/progetto/                                     |
|                                                                                   | ctrl + shift + h            | Cerca e sostituisce all'interno della cartella/progetto/                       |
|                                                                                   | alt + freccia su/giù        | Sposta la riga corrente (o le righe selezionate) verso l'alto/basso.           |
|                                                                                   | crtl + alt + freccia su/giù | Copia la riga corrente (o le righe selezionate) verso l'alto/basso.            |

#### 4.3 Editing multi-caret

Normalmente c'è un cursore, e ogni modifica fatta viene applicata dov'è quel singolo cursore.

Negli esempi che seguono, userò | per indicare un cursore, e coppie di \_ come delimitatori del testo selezionato.

Contenu|to dell'editor

#### Premendo A

```
ContenuA|to dell'editor
```

L'idea del multi-caret è di avere più di un cursore, per modificare più punti del testo allo stesso tempo. Questo è utile se abbiamo più punti del testo con uno stesso *pattern*.

|        | Tasti    | Cosa fa                                                                        |
|--------|----------|--------------------------------------------------------------------------------|
| $\Box$ | ctrl + d | Aggiunge un cursore alla fine della prossima occorrenza del testo selezionato. |
|        | esc      | Ritorno alla modalità con singolo cursore.                                     |

#### Vediamo un esempio.

```
Prima |riga dell'editor
Seconda riga dell'editor
Terza riga dell'editor
```

Si comincia selezionando del testo.

```
Prima _riga_| dell'editor
Seconda riga dell'editor
Terza riga dell'editor
```

Usiamo ora ctrl + d per mettere un nuovo caret dopo la prossima occorrenza di "riga".

```
Prima _riga_| dell'editor
Seconda _riga_| dell'editor
Terza riga dell'editor
```

Abbiamo ora due caret e se facciamo una modifica verrà fatta in tutti e due i punti. Premendo per esempio e, andremo a sovrascrivere la parola "riga" in entrambi i punti.

```
Prima e| dell'editor
Seconda e| dell'editor
Terza riga dell'editor
```

Entrambi i cursori seguiranno indipendentemente anche gli altri comandi: movimento per caratteri, movimento per token, selezione, copia e incolla.

Per sfruttare questo, conviene scrivere codice secondo pattern in modo da facilitare questo tipo di modifiche. Per esempio, è utile avere cose che vorremmo poi modificare contemporaneamente su righe diverse, in modo da sfruttare home e end in modalità multi-cursore.

Vedremo in particolare come la sintesi di reti sincronizzate diventa molto più semplice se si sfrutta appieno l'editor.

# Book I Assembler

## 5. Ambiente di sviluppo

In questo corso, programmeremo assembler per architettura x86, a 32 bit. Useremo la sintassi GAS (anche nota come AT&T), usando la linea di comando in un sistema Linux. Utilizzeremo degli script appositi per assemblare, testare e debuggare. Questi script non fanno che chiamare, semplificandone l'uso, gcc e gdb. Per istruzioni per installare e configurare il proprio ambiente, vedere qui. Qui vedremo più da vicino il sistema utilizzato all'esame, basato su Windows 11 + WSL.

#### Informazione a rischio aggiornamento

Fino all'A.A. 2024/25, *nei laboratori* si è utilizzato Windows + WSL come spiegato qui. Ciò è ancora da confermare per l'A.A. 2025/26. Ogni eventuale cambiamento sarà a impatto pratico minimo.

#### 5.1 Struttura dell'ambiente

I programmi che scriveremo ed eseguiremo, così come quelli utilizzati per assemblare, gireranno in un terminale Linux.

Nell'ambiente d'esame, si usa un Ubuntu 24.04 virtualizzato tramite WSL su macchina Windows 11. Come editor usiamo Visual Studio Code con l'estensione per lo sviluppo in WSL.



Figura 5.1: Schema dell'ambiente usato all'esame.

Questo ci permette di mantenere un ambiente grafico moderno mentre si lavora con un terminale Linux virtualizzato.

#### 5.2 Lanciare l'ambiente e primo programma

Una volta eseguiti i passi dell'installazione, avremo una cartella C:/reti\_logiche con contenuto come da figura.



Ma così:

Il file assembler-workspace.code-workspace lancerà VS Code, collegandosi alla macchina virtuale WSL e la cartella di lavoro C:/reti\_logiche/assembler.

Questo file è configurato per l'ambiente Windows + WSL, per automatizzare l'avvio. Se si usa un ambiente diverso, il file andrà modificato di conseguenza.

La finestra VS Code che si aprirà sarà simile alla seguente.



Nell'angolo in basso a sinistra, WSL: reti-logiche-assembler sta a indicare che l'editor è correttamente connesso alla macchina virtuale (compare una dicitura simile se si usa SSH).

I file e cartelle mostrati nell'immagine sono quelli che ci si deve aspettare dall'ambiente vuoto. Il file test-ambiente.s è un semplice programma per verificare che l'ambiente funzioni.

```
.include "./files/utility.s"
.data
messaggio: .ascii "Ok.\r"

.text
_main:
    nop
    lea messaggio, %ebx
    call outline
    ret
```

Apriamo quindi un terminale in VS Code (Terminale > Nuovo Terminale). Per poter lanciare gli script, il terminale deve essere Powershell, non bash. Non così:



Per cambiare shell si può usare il bottone + sulla destra, o lanciare il comando pwsh senza argomenti.

Se si preferisce, in VS Code si può aprire un terminale anche come tab dell'editor, o spostandolo al lato anziché in basso.

A questo punto possiamo lanciare il comando per assemblare il programma di test.

```
./assemble.ps1 ./test-ambiente.s
```

Dovremmo adesso vedere, tra i file, il binario test-ambiente. Lo possiamo eseguire con ./test-ambiente, che dovrebbe stampare 0k..

```
PROBLEMS OUTPUT DEBUGCONSOLE TERMINAL PORTS pwsh-assembler + VPS /mnt/c/reti_logiche/assembler> ./assemble.ps1 ./test-ambiente ./test-ambiente
```

# Parte I Esercitazioni

## 6. Esercitazione 1

La caratteristica principale del programmare in assembler è che le operazioni a disposizione sono solo quelle messe a disposizione dal processore. Infatti, l'assemblatore fa molto poco: dopo aver sostituito le varie label con indirizzi, traduce ciascuna istruzione, nell'ordine in cui sono presenti, nel diretto corrispettivo binario (il cosiddetto linguaggio macchina). Questo binario è poi eseguito direttamente dal processore. Dato un algoritmo per risolvere un problema, i passi base di questo algoritmo devono essere istruzioni comprese dal processore, e siamo quindi limitati dall'hardware e le sue caratteristiche.

Per esempio, dato che il processore non supporta mov da un indirizzo di memoria a un'altro indirizzo di memoria, non possiamo fare questa operazione con una sola istruzione: dobbiamo invece scomporre in mov src, %eax mov %eax, dest, assicurandoci nel frattempo di non aver perso alcun dato importante prima contenuto in %eax.

Per svolgere gli esercizi, bisogna quindi imparare a scomporre strutture di programmazione già note (come if-then-else, cicli, accesso a vettore) nelle operazioni elementari messe ad disposizione dal processore, usando il limitato numero di registri a disposizione al posto di variabili, e tenendo presente quali operazioni da fare con quali dati, senza un sistema di tipizzazione ad aiutarci.

#### 6.1 Premesse per programmi nell'ambiente del corso

Unica eccezione alla logica di cui sopra sono i sottoprogrammi di ingresso/uscita, forniti tramite utility.s: questi interagiscono con il terminale tramite il *kernel* usando il meccanismo delle *interruzioni*, concetti che avrete il tempo di esplorare in corsi successivi. Qui ci limiteremo a seguirne le specifiche per leggere o stampare a video numeri, caratteri, o stringhe. Per esempio, parte di queste specifiche è l'uso del carattere di ritorno carrello \r come terminatore di stringa. Per usarli, però, va istruito l'assemblatore di aggiungere questi sottoprogrammi al nostro codice, con

```
.include "./files/utility.s"
```

Un altro aspetto importante è dove comincia e finisce il nostro programma: *nell'ambiente del corso*, il punto di ingresso è la label \_main e quello di uscita è la corrispendente istruzione ret. Per motivi di debugging, che saranno chiari più avanti, si tende a cominciare il programma con una istruzione nop.

Inoltre, la distinzione tra zona .data e .text è importante. Dato che durante l'esecuzione sono entrambi caricati in memoria, per motivi di sicurezza il kernel Linux ci impedirà di eseguire indirizzi in .data o di scrivere in indirizzi in .text. Dimenticarsi di dichiararli porta ad eccezioni durante l'esecuzione.

Infine, l'assemblatore non vede di buon occhio la mancanza di una riga vuota alla fine del file. Per evitare messaggi di warning inutili, meglio aggiungerla.

Detto ciò, possiamo quindi comprendere il programma di test, che non fa che stampare "Ok." a terminale e poi termina:

```
.include "./files/utility.s"
1
2
3
    .data
    messaggio: .ascii "Ok.\r"
4
5
6
    .text
7
    _main:
8
        nop
9
        lea messaggio, %ebx
10
        call outline
        ret
11
```

#### Non generalità

Le istruzioni di questa sezione sono relative all'ambiente del corso. La direttiva .include "./ |

files/utility.s" ricopia il codice del file utility.s, fornito nell'ambiente del corso. Le specifiche dei sottoprogrammi (uso dei registri, \r come carattere di terminazione, etc.) sono conseguenza di come è scritto questo codice, che ha a che fare con scelte del corso, tra cui la retrocompatibilità con il vecchio ambiente DOS. L'uso di \_main e ret (peraltro, senza alcun valore di ritorno), così come il comportamento del terminale, sono anche questi relativi all'ambiente usato.

Non sono assolutamente concetti validi in generale, per altri assembler e altri ambienti.

#### **6.2** Esercizio **1.1**

Partiamo da un esercizio con le seguenti specifiche

```
    Leggere messaggio da terminale.
    Convertire le lettere minuscole in maiuscolo.
    Stampare messaggio modificato.
```

I passi 1 e 3 sono da svolgersi usando i sottoprogrammi inline e outline. Cominciamo riservando in memoria, nella sezione data, spazio per le due stringhe.

```
.data
msg_in: .fill 80, 1, 0
msg_out: .fill 80, 1, 0
```

Per la lettura useremo

```
mov $80, %cx
lea msg_in, %ebx
call inline
```

Per la scrittura invece useremo

```
lea msg_out, %ebx
call outline
```

Quel che manca ora è il punto 2. Dobbiamo (capire come) fare diverse cose:

- ricopiare msg\_in in msg\_out carattere per carattere
- controllare tale carattere, per capire se è una lettera minuscola
- se sì, cambiare tale carattere nella corrispondente maiuscola

Partiamo dal primo di questi punti, e per semplicità, scriviamone il codice ignorando i restanti due punti, ossia ricopiando il carattere indipendentemente dal fatto che sia minuscolo o maiuscolo.

Come scorrere i due vettori? Abbiamo due opzioni: usare un indice per accesso indicizzato, o due puntatori da incrementare. Anche sulla condizione di terminazione abbiamo due opzioni: fermarsi dopo aver processato il carattere di ritorno carrello \r, o dopo aver processato 80 caratteri.

Per questo esercizio, scegliamo la prima opzione per entrambe le scelte. Se usassimo C, scriveremmo questo:

```
char[] msg_in, msg_out;
...
int i = 0;
char c;
do {
    c = msg_in[i];
    msg_out[i] = c;
    i++;
} while (c != '\r')
```

In assembler, questo si può scrivere così:

```
lea msg_in, %esi
  lea msg_out, %edi
  mov $0, %ecx
loop:
```

6.2. ESERCIZIO 1.1 29

```
movb (%esi, %ecx), %al
movb %al, (%edi, %ecx)
inc %ecx
cmp $0x0d, %al
jne loop
```

Ci sono diversi aspetti da sottolineare. Il primo è che nell'accesso con indice, a differenza del C, abbiamo completo controllo sia di come è calcolato l'indirizzo di accesso, sia sulla dimensione della lettura in memoria. Prendiamo il caso di movb (%esi, %ecx), %al. Ricordiamo che il formato dell'indirizzazione con indice è offset(%base, %indice, scala), dove l'indirizzo è calcolato come offset + %base + (%indice \* scala). Dunque (%esi, %ecx) è, implicitamente, 0(%esi, %ecx, 1), dove l'1 indica il fatto che ci spostiamo di un un byte alla volta. Dato l'indirizzo, però, in abbiamo controllo di quanti byte leggere, questa volta tramite il suffisso b o, implicitamente, tramite la dimensione del registro di destinazione %al.

In C, questi aspetti sono legati al fatto di usare il tipo char, che è appunto di 1 byte. In assembler, dobbiamo starci attenti noi.

Prima di passare al resto del punto 2, vale la pena provare a comporre il programma così com'è, testarlo ed eseguirlo. Infatti, è sempre una buona idea trovare i bug quanto prima, e quanto più è semplice il codice scritto tanto più lo è trovare la fonte del bug.

Ci rimane ora da controllare che il carattere letto sia una minuscola, e nel caso cambiarla in maiuscola. Per il primo punto, ci basta ricordare che i caratteri ASCII hanno una codifica binaria ordinata: char c è minuscola se c >= 'a' && c <= 'z'.

Per cambiare invece una minuscola e maiuscola, notiamo sempre dalla tabella ASCII che la distanza tra 'a' e 'A', è la stessa di qualunque altra coppia di maiuscola-minuscola; ci basta infatti sottrarre 32 ad una minuscola per ottenere la corrispondente maiuscola, e aggiungere 32 per fare il contrario. Guardando alla rappresentazione in base 2, notiamo che l'operazione è ancora più semplice: essendo  $32 = 2^5$ , si tratta di mettere il bit in posizione 5 a 0 o 1, usando and, or o xor con maschere appropriate.

Detto ciò, il codice C diventa:

Dove 0xdf corrisponde a 1101 1111, ossia l'and resetta il bit in posizione 5.

#### Il controllo non è opzionale

Domanda: se vogliamo che tutte le lettere siano maiuscole, non basta resettare il bit 5 a prescindere, e non fare il controllo?

Risposta: no, perché ci sono altri caratteri ASCII con il bit 5 a 1 che non sono affatto lettere. Per esempio, il carattere spazio di codifica 0x20.

Questo si traduce nel seguente assembler:

```
lea msg_in, %esi
lea msg_out, %edi
mov $0, %ecx
loop:
   movb (%esi, %ecx), %al
   cmp $'a', %al
   jb post_check
   cmp $'z', %al
   ja post_check
and $0xdf, %al # 1101 1111 -> l'and resetta il bit 5
```

```
post_check:
    movb %al, (%edi, %ecx)
    inc %ecx
    cmp $0x0d, %al
    jne loop
```

Notiamo che le due condizione nell'if vanno rimaneggiate per essere tradotte, infatti saltiamo a dopo la conversione se le condizioni *non* sono verificate.

Il codice finale è quindi il seguente, scaricabile qui come file sorgente.

```
.include "./files/utility.s"
1
   .data
3
  msg_in: .fill 80, 1, 0
   msg_out: .fill 80, 1, 0
7
   .text
8
   main:
9
      nop
10 punto_1:
11
      mov $80, %cx
       lea msg_in, %ebx
12
       call inline
13
14
       nop
  punto_2:
15
     lea msg_in, %esi
16
       lea msg_out, %edi
17
       mov $0, %ecx
18
   loop:
19
     movb (%esi, %ecx), %al
20
       cmp $'a', %al
21
       jb post_check
22
       cmp $'z', %al
23
       ja post_check
24
       and $0xdf, %al
25
   post_check:
26
27
       movb %al, (%edi, %ecx)
       inc %ecx
28
29
       cmp $0x0d, %al
30
       jne loop
31
   punto_3:
32
       lea msg_out, %ebx
33
       call outline
34
       nop
35
   fine:
       ret
```

Le label punto\_1, punto\_2, punto\_3 e fine sono, come è facile verificare, del tutto opzionali. Sono però utili ai fini del debugging, che presentiamo ora.

Sono da notare le nop aggiunte prima tra le call alle righe 13 e 33 e le successive label: queste sono un workaround per ovviare ad un problema di gdb, che spiegherò più avanti.

#### 6.3 Uso del debugger

Debugging is like being the detective in a crime movie where you are also the murderer. Filipe Fortes

La parola debugger suggerisce da sé che sia uno strumento per rimuovere bug ma, purtroppo, questo non vuol dire che lo strumento li rimuove da solo. Infatti, quello in cui ci è utile il debugger è trovare i bug, seguendo l'esecuzione del programma passo passo e controllando il suo stato per capire dov'è che il

6.3. USO DEL DEBUGGER 31

suo comportamento differisce da quanto ci aspettiamo. Da lì, spesso indagando a ritroso e con un po' di intuito, si può trovare le istruzioni incriminate e correggerle.

#### Uno strumento per essere più efficienti

Domanda: sembra complicato, non è più facile rileggere il codice?

Risposta: sì, lo è. Ma, in genere, quando basta rileggere è perché si è fatto un errore di digitazione, non di ragionamento. Saper usare il debugger significa sapersi tirare fuori velocemente da errori che richiederebbero rileggere a fondo tutto il codice.

Il debugger che usiamo è gdb, che funziona da linea di comando. Questo parte da un binario eseguibile, che verrà eseguito passo passo come da noi indicato.

Per semplicità d'uso, l'ambiente ha uno script debug.ps1, da lanciare con

```
./debug.ps1 nome-eseguibile
```

Lo script fa dei controlli, tra cui assicurarsi che si sia passato *l'eseguibile* e non *il sorgente*, lancia il debugger con alcuni comandi tipici già inseriti (imposta un breakpoint a  $_{main}$  e lancia il programma), e ne definisce altri per comodità d'uso (  $_{rr}$  e  $_{qq}$ , per riavviare il programma o uscire senza dare conferma).

Vediamo come usarlo, lanciando il debugger sul programma realizzato nell'esercizio precedente. Dopo un sezione di presentazione del programma, abbiamo del testo del tipo

```
Breakpoint 1, _main () at /mnt/c/reti_logiche/assembler/lezioni/1/maiusc.s:9
9 nop
(gdb)
```

Un breakpoint è un punto del programma, in genere una linea di codice, dove si desidera che il debugger fermi l'esecuzione. Avendo impostato il primo breakpoint a \_main, vediamo infatti che il programma si ferma alla prima istruzione relativa, che è appunto la nop. Importante: il debugger si ferma prima dell'esecuzione della riga indicata.

Vediamo poi che il debugger richiede input: infatti possiamo interagire con il debugger solo quando il programma è fermo. Possiamo fare tre cose in particolare:

- Osservare il contenuto di registri e indirizzi di memoria (info registers e x),
- Impostare nuovi breakpoints (break),
- Continuare l'esecuzione in modo controllato ( step e next ) o fino al prossimo breakpoint ( continue
   )

Vediamoli in azione. Cominciamo con il proseguire fino alla riga 13.

Notiamo che gdb accetta sia comandi per esteso sia abbreviati, per esempio per step va bene anche s. Con questi 3 step, abbiamo eseguito le prime tre istruzioni ma *non* la call a riga 13. Possiamo controllare lo stato dei registri usando info registers, abbreviabile con i r.

```
(gdb) i r
                0x66
                                      102
eax
                0x50
                                      80
ecx
edx
                0x2d
                                      45
                0x56559066
                                      1448448102
ebx
                0xffffc06c
                                      0xffffc06c
esp
                0xffffc078
                                      0xffffc078
ebp
                0xf7fb2000
                                      -134537216
esi
edi
                0xf7fb2000
                                      -134537216
                0x5655676e
                                      0x5655676e <punto_1+10>
eip
```

```
0x282
                                         [SFIF]
eflags
cs
                 0x23
                                         35
SS
                 0x2b
                                         43
ds
                 0x2b
                                         43
                 0x2b
                                         43
es
fs
                 0x0
                                         0
                 0x63
                                        99
gs
(gdb)
```

Notare: è un caso trovare i registri già inizializzati a 0, come qui mostrato.

Questo ci da info su diversi registri, molti dei quali non ci interessano. Possiamo specificare quali registri vogliamo, anche di dimensioni minori di 32 bit.

```
(gdb) i r cx ebx
cx 0x50 80
ebx 0x56559066 1448448102
(gdb)
```

La prossima istruzione, se lasciamo il programma eseguire, è una call. In questo caso, abbiamo due scelte: proseguire *nella* chiamata al sottoprogramma (andando quindi alle istruzioni di inline, definite in utility.s), o *oltre* la chiamata, andando quindi direttamente alla riga 14. Questa è la differenza fra step e next: step prosegue dentro i sottoprogrammi, mentre next prosegue finché il sottoprogramma non ritorna.

È qui però che è rilevante la presenza della nop aggiunta a riga 14, prima di parte\_2. next infatti continua fino alla prossima istruzione della sezione corrente del codice, che è in questo caso punto\_1. Se però tale sezione termina subito dopo la call, e non esiste quindi una successiva istruzione nella stessa sezione, allora usando next il programma continuerà fino alla terminazione. Aggiungere la nop ovvia al problema essendo una successiva istruzione ancora parte di punto\_1.

```
13 call inline
(gdb) n
questo e' un test
14 nop
(gdb)
```

Da notare che "questo e' un test" è proprio l'input inserito da tastiera durante l'esecuzione di inline. Eseguire il programma un'istruzione alla volta può risultare molto lento. Per esempio, quando vogliamo osservare cosa succede ad una particolare iterazione di un loop. Per questo ci aiutano break e continue. Nell'esempio che segue, sono usati per raggiungere rapidamente la quarta iterazione.

```
(gdb) b loop
Breakpoint 2 at 0x56556785: file /mnt/c/reti_logiche/assembler/lezioni/1/maiusc.s, line 20.
(gdb) c
Continuing.
Breakpoint 2, loop () at /mnt/c/reti_logiche/assembler/lezioni/1/maiusc.s:20
20
            movb (%esi, %ecx), %al
(gdb) i r ecx
               0x0
                                    0
ecx
(gdb) c
Continuing.
Breakpoint 2, loop () at /mnt/c/reti_logiche/assembler/lezioni/1/maiusc.s:20
            movb (%esi, %ecx), %al
(gdb) i r ecx
                                    1
ecx
               0x1
(gdb) c
Continuing.
Breakpoint 2, loop () at /mnt/c/reti_logiche/assembler/lezioni/1/maiusc.s:20
20
            movb (%esi, %ecx), %al
(gdb) c
Continuing.
```

6.3. USO DEL DEBUGGER 33

```
Breakpoint 2, loop () at /mnt/c/reti_logiche/assembler/lezioni/1/maiusc.s:20
20 movb (%esi, %ecx), %al
(gdb) i r ecx
ecx 0x3 3
(gdb)
```

L'ultima operazione base da vedere è osservare valori in memoria. Il comando x sta per *examine memory* ma, a differenza degli altri comandi, esiste solo in forma abbreviata. Il comando ha 4 argomenti:

- N, il numero di "celle" consecutive della memoria da leggere;
- F, il formato con cui interpretare il contenuto di tali "celle", per esempio d per decimale e c per ASCII;
- U, la dimensione di ciascuna "cella": b per 1 byte, h per 2 byte, w per 4 byte;
- addr, l'indirizzo in memoria da cui cominciare la lettura.

Il formato del comando è x/NFU addr. Gli argomenti N, F e U sono, di default, gli ultimi utilizzati. Questo è infatti un comando con memoria. Quando non sono specificati, si dovrà omettere anche lo /. L'argomento addr si può passare come

- costante esadecimale, per esempio x 0x56559066;
- label preceduta da δ, per esempio x δmsg\_in;
- registro preceduto da \$, per esempio x \$esi;
- espressione basata su aritmetica dei puntatori, per esempio x (int\*)&msg\_in+\$ecx.

L'ultima opzione è abbastanza ostica da sfruttare, vedremo come evitarla con una tecnica alternativa. Vediamo degli esempi tornando al debugging del nostro primo programma:

```
(gdb) x/20cb &msg_in
                 113 'q' 117 'u' 101 'e' 115 's' 116 't' 111 'o' 32 ' ' 101 'e' 39 '\'' 32 ' ' 117 'u' 110 'n' 32 ' ' 116 't' 101 'e' 115 's'
0x56559066:
0x5655906e:
                  116 't' 13 '\r' 10 '\n' 0 '\000'
0x56559076:
(gdb) x/20cb &msg_out
                          85 'U'
0x565590b6:
                                    69 'E' 0 '\000'
                  81 'Q'
                                                               0 '\000'
                                                                                 0 '\000'
                                                                                                    0
                  0 '\000'
   '\000'
                  0 '\000'
0x565590be:
                                    0 '\000'
                                                      0 '\000'
                                                                        0 '\000'
                                                                                           0 '\000'
  0 '\000' 0 '\000'
                                0 '\000'
0x565590c6:
                  0 '\000'
                                    0 '\000'
                                                      0 '\000'
                                                                        0 '\000'
(gdb) x/20cb $esi
                  113 'q' 117 'u' 101 'e' 115 's' 116 't' 111 'o' 32 ' ' 101 'e'
0x56559066:
                  39 '\'' 32 ' ' 117 'u' 110 'n' 32 ' ' 116 't' 101 'e' 115 's'
0x5655906e:
                  116 't' 13 '\r' 10 '\n' 0 '\000'
0x56559076:
```

In questo programma usiamo un'indirizzazione con indice per leggere e scrivere lettere nei vettori. Infatti, vediamo che il registro esi punta sempre alla prima lettera del vettore, e abbiamo bisogno di usare anche ecx per sapere qual'è la lettera che il programma intende processare in questa iterazione del loop.

Per usare la sintassi menzionata sopra, dovremmo ricordarci come tradurre (%esi, %ecx) in un'espressione di aritmetica dei puntatori. Una alternativa molto agevole è invece la scomposizione dell'istruzione movb (%esi, %ecx), %al in due: una lea e una mov. Infatti, ricordiamo che la lea ci permette di calcolare un indirizzo, anche se con composto con indice, e salvarlo in un registro. Possiamo per esempio scrivere

```
lea (%esi, %ecx), %ebx
movb (%ebx), %al
```

In questo modo, l'indirizzo della lettera da leggere sarà contenuto in ebx, cosa che possiamo sfruttare nel debugger con il comando x/1cb \$ebx.

Come ultime indicazioni sul debugger, menzioniamo il comando layout regs, che mostra ad ogni passo i registri e il codice da eseguire, e i comandi r, per riavviare il programma e q, per terminare il debugger. Le versioni qq e rr, definite ad hoc nell'ambiente di questo corso, fanno lo stesso senza richiedere conferma.

#### 6.4 Esercizio 1.2: istruzioni stringa

L'esercizio precedente compie un'operazione ripetuta su vettori. Legge da un vettore, una cella alla volta, ne manipola il contenuto, poi lo scrive su un altro vettore. Questo genere di operazioni è adatto per l'uso delle istruzioni stringa.

#### Provare da sé

Provare a svolgere da sé l'esercizio, prima di andare oltre.

- 1. Leggere messaggio da terminale.
- 2. Convertire le lettere minuscole in maiuscolo, usando le istruzioni stringa.
- 3. Stampare messaggio modificato.

Le istruzioni stringa sono un esempio di set di istruzioni specializzate, cioè istruzioni che non sono pensate per impementare algoritmi generici, ma sono invece pensate per fornire supporto hardware efficiente ad uno specifico set di operazioni che alcuni algoritmi necessitano. Infatti, ci si può aspettare che tra due programmi equivalenti, uno scritto con sole istruzioni generali e l'altro scritto con istruzioni specializzate, il secondo sarà molto più performante del primo. Altri esempi comuni sono le istruzioni a supporto di crittografia, encoding e decoding di stream multimediali, e, più recentemente, neural networks.

Questi set di istruzioni sono però più "rigidi" delle istruzioni ad uso generale. Ci impongono infatti dei modi specifici di organizzare dati e codice, perché questi devono essere compatibili con il modo in cui l'algoritmo eseguito da un'istruzione è implementato in hardware.

Nell'esercizio precedente abbiamo considerato due modi di scorrere i due array. Nel primo, che è quello che abbiamo scelto, si carica l'indirizzo di inizio del vettore, e si usa un altro registro come indice, usando l'indirizzazione con indice. Nel secondo, si usa un registro come puntatore alla cella corrente, inizializzato all'indirizzo di inizio del vettore e poi incrementato (della quantità giusta) per passare all'elemento successivo. In entrambi i casi, siamo liberi di usare i registri che vogliamo, per esempio non abbiamo nessun problema se scriviamo il programma di prima come segue:

```
lea msg_in, %eax
lea msg_out, %ebx
mov $0, %edx
loop:
  movb (%eax, %edx), %cl
...
```

Infatti, usare esi ed edi come registri puntatori, ed ecx come registro di indice, è del tutto opzionale. Tutto questo cambia quando si vogliono esare istruzioni specializzate come le istruzioni stringa. Queste ci impongono di usare esi come puntatore al vettore sorgente, edi come puntatore al vettore destinatario, eax come registro dove scrivere o da cui leggere il valore da trasferire, ecx come contatore delle ripetizioni da eseguire, etc. Una volta scelte le istruzioni da usare, dobbiamo quindi assicurarci di seguire quanto imposto dall'istruzione.

Per questo esercizio siamo interessati alla lods, che legge un valore dal vettore e ne sposta il puntatore allo step successivo, e la stos, che scrive un valore nel vettore. Partiamo dal riscrivere il punto\_2 in modo da rendere l'algoritmo compatibile.

```
punto_2:
    lea msg_in, %esi
    lea msg_out, %edi
loop:
    movb (%esi), %al
    inc %esi
    cmp $'a', %al
    jb post_check
    cmp $'z', %al
    ja post_check
    and $0xdf, %al

post_check:
    movb %al, (%edi)
    inc %edi
```

6.5. ESERCIZI PER CASA 35

```
cmp $0x0d, %al
jne loop
...
```

Abbiamo dunque rimosso l'uso di ecx come indice, e usiamo esi ed edi come puntatori. Il fatto di usare la inc è legato alla dimensione dei dati, cioè 1 byte. Dovremmo invece scrivere add \$2, %esi o add \$4, %esi per dati su 2 o 4 byte. Altra nota è che incrementiamo i puntatori, anziché decrementarli, perché stiamo eseguendo l'operazione da sinistra verso destra.

Siamo pronti adesso a sostiture le istruzioni evidenziate con delle istruzioni stringa. Il sorgente finale è scaricabile qui.

```
punto_2:
   lea msg_in, %esi
   lea msg_out, %edi
    // highlight-start
    cld
    // highlight-end
loop:
    lodsb
    cmp $'a', %al
    jb post_check
    cmp $'z', %al
    ja post_check
    and $0xdf, %al
post_check:
   stosb
    cmp $0x0d, %al
    jne loop
```

L'istruzione cld serve a impostare a 0 il flag di direzione, che serve a indicare alle istruzioni stringa se andare da sinistra verso destra o il contrario. Dato che tutti i registri sono impliciti, dobbiamo sempre specificare la dimensione delle istruzioni, in questo caso b.

Come esercizio, può essere interessante osservare con il debugger l'evoluzione dei registri, osservando come si eseguono più operazioni con una sola istruzione.

#### 6.5 Esercizi per casa

Parte fondamentale delle esercitazioni è fare pratica. Per questo, vengono lasciati alcuni esercizi per casa.

#### Esercizi 1.3 e 1.4

Scrivere dei programmi che si comportano come gli esercizi 1.1 e 1.2, tranne che per il fatto di convertire da maiuscolo in minuscolo anziché il contrario.

#### Esercizio 1.5

Scrivere un programma che, a partire dalla sezione .data che segue (e scaricabile qui ), conta e stampa il numero di occorrenze di numero in array.

```
.include "./files/utility.s"

.data
array: .word 1, 256, 256, 512, 42, 2048, 1024, 1, 0
array_len: .long 9
numero: .word 1
```

#### Esercizio 1.6

Quello che segue (e scaricabile qui ) è un tentativo di soluzione dell'esercizio precedente. Contiene tuttavia uno o più bug. Trovarli e correggerli.

```
.include "./files/utility.s"
1
2
   .data
3
                .word 1, 256, 256, 512, 42, 2048, 1024, 1, 0
4
   array:
   array_len: .long 9
5
                .word 1
   numero:
6
7
8
    .text
9
    _main:
10
11
      nop
       mov $0, %cl
12
       mov numero, %ax
13
       mov $0, %esi
14
15
   comp:
16
17
       cmp array_len, %esi
        je fine
18
19
       cmpw array(%esi), %ax
20
        jne poi
21
        inc %cl
22
23
   poi:
24
       inc %esi
25
        jmp comp
26
27
        mov %cl, %al
28
29
        call outdecimal_byte
30
```

#### Esercizio 1.7

Scrivere un programma che svolge quanto segue.

```
# leggere 2 numeri interi in base 10, calcolarne il prodotto, e stampare il risultato.
# lettura:
# come primo carattere leggere il segno del numero, cioè un '+' o un '-'
# segue il modulo del numero, minore di 256
# stampa:
# stampare prima il segno del numero (+ o -), poi il modulo in cifre decimali
```

#### Esercizio 1.8

Quello che segue (e scaricabile qui ) è un tentativo di soluzione dell'esercizio precedente. Contiene tuttavia uno o più bug. Trovarli e correggerli.

```
.include "./files/utility.s"
1
2
   mess1: .asciz "inserire il primo numero intero:\r"
3
           .asciz "inserire il secondo numero intero:\r"
   mess3: .asciz "il prodotto dei due numeri e':\r"
           .word 0
6
   a:
   b:
           .word 0
8
9
   main:
10
11
       lea mess1, %ebx
12
   call outline
```

6.5. ESERCIZI PER CASA 37

```
call in_intero
13
14
        mov %ax, a
15
        lea mess2, %ebx
16
17
        call outline
        call in_intero
18
        mov %ax, b
19
20
        mov a, %ax
21
22
        mov b, %bx
        imul %bx
23
24
        lea mess3, %ebx
25
        call outline
26
        call out_intero
27
28
        ret
29
   # legge un intero composto da segno e modulo minore di 256
30
   # ne lascia la rappresentazione in complemento alla radice base 2 in ax
31
32 in_intero:
        push %ebx
33
        mov $0, %bl
34
   in_segno_loop:
35
       call inchar
36
37
        cmp $'+', %al
        je in_segno_poi
38
39
        cmp $'-', %al
40
        jne in_segno_loop
41
        mov $1, %bl
   in_segno_poi:
42
43
       call outchar
44
        call indecimal_word
45
        call newline
46
        cmp $1, %bl
47
        jne in_intero_fine
48
        neg %ax
   in_intero_fine:
49
50
        pop %ebx
51
        ret
   # legge la rappresentazione di un numero intero in complemento alla radice base 2 in eax
53
    # lo stampa come segno seguito dalle cifre decimali
   out_intero:
56
        push %ebx
        mov %eax, %ebx
57
        cmp $0, %ebx
58
        ja out_intero_pos
59
60
        jmp out_intero_neg
61
    out_intero_pos:
        mov $'+', %al
62
        call outchar
63
        jmp out_intero_poi
64
    out_intero_neg:
65
        mov $'-', %al
66
        call outchar
67
        neg %ebx
68
        jmp out_intero_poi
69
70
    out_intero_poi:
        mov %ebx, %eax
71
72
        call outdecimal_long
73
        pop %ebx
74
        ret
```

# 7. Esercitazione 2

# 7.1 Soluzioni passo-passo esercizi per casa

#### Esercizio 1.6: soluzione passo-passo

Ricordiamo la traccia dell'esercizio:

Scrivere un programma che, a partire dalla sezione .data che segue (e scaricabile qui ), conta e stampa il numero di occorrenze di numero in array.

```
.include "./files/utility.s"
.data
array:    .word 1, 256, 256, 512, 42, 2048, 1024, 1, 0
array_len:    .long 9
numero:    .word 1
```

Questa è invece la soluzione proposta dall'esercizio:

```
.include "./files/utility.s"
1
2
3
    .data
                 .word 1, 256, 256, 512, 42, 2048, 1024, 1, 0
    array:
5
    array_len: .long 9
6
    numero:
                 .word 1
8
    .text
9
10
    main:
11
        mov $0, %cl
12
        mov numero, %ax
13
        mov $0, %esi
14
15
16
    comp:
        cmp array_len, %esi
17
        je fine
18
        cmpw array(%esi), %ax
19
        jne poi
20
        inc %cl
21
22
23
    poi:
        inc %esi
24
25
        jmp comp
26
27
    fine:
28
        mov %cl, %al
29
        call outdecimal_byte
30
```

Come prima cosa, cerchiamo di capire, a grandi linee, cosa cerca di fare questo programma.

Notiamo l'uso di %cl : dall'inizializzazione a riga 12, l'incremento condizionato a righe 19-21, e la stampa a righe 28-29, si evince che %cl è usato come contatore dei successi, ossia di quante volte è stato trovato numero in array. Notiamo che %ax viene inizializzato con numero e, prima della stampa, mai aggiornato. Infine, %esi viene inizializzato a 0 e incrementato a fine di ogni ciclo, confrontandolo con array\_len per determinare quando uscire dal loop. Infine, a riga 19 notiamo il confronto tra un valore di array, indicizzato con %esi, e %ax, che contiene numero.

Si ricostruisce quindi questa logica: scorro valore per valore array, indicizzandolo con %esi, e lo confronto

con numero, che è appoggiato su %ax (perché il confronto tra due valori in memoria non è possibile con cmp ). Utilizzo %cl come contatore dei successi, e alla fine dello scorrimento ne stampo il valore.

Fin qui nessuna sorpresa, il programma sembra seguire lo schema che si seguirebbe con un normale programma in C:

```
int cl = 0;
for(int esi = 0; esi < array_len; esi++){
   if(array[esi] == numero)
        cl++;
}</pre>
```

Proviamo ad eseguire il programma: ci si aspetta che stampi 2. Invece, stampa 3. Dobbiamo passare al debugger.

Quello che ci conviene guardare è quello che succede ad ogni loop, in particolare alla riga 19, dove la cmpw confronta un valore di array con %ax, che contiene numero. Però, la cmpw utilizza un indirizzamento complesso che, abbiamo visto, richiede una sintassi più complicata nel debugger. Cambio quindi quella istruzione in una serie equivalente che sia più facile da osservare col debugger.

```
.include "./files/utility.s"
1
2
3
    .data
                  .word 1, 256, 256, 512, 42, 2048, 1024, 1, 0
4
    array:
    array_len:
5
                 .long 9
6
    numero:
                  .word 1
7
8
    .text
9
    main:
10
11
        nop
        mov $0, %cl
12
        mov numero, %ax
13
        mov $0, %esi
14
15
16
    comp:
17
        cmp array_len, %esi
18
         je fine
        movw array(%esi), %bx
19
        cmpw %bx, %ax
20
21
         jne poi
        inc %cl
22
23
24
    poi:
        inc %esi
25
26
        jmp comp
27
28
        mov %cl, %al
29
        call outdecimal_byte
30
31
        ret
```

Assemblo, avvio il debugger, e setto un breakpoint alla riga 20 con break 20. Lascio girare il programma con continue, che quasi immediatamente raggiunge la riga 20 e si ferma. Ricordiamo che il debugger si ferma prima di eseguire una istruzione.

Vediamo lo stato dei registri, con i r ax bx cl esi.

```
    (gdb) i r ax bx cl esi

    ax
    0x1
    1

    bx
    0x1
    1

    cl
    0x0
    0

    esi
    0x0
    0
```

Fin qui, tutto come ci si aspetta: %ax che contiene numero, %bx contiene il numero alla prima cella di array, i due contatori %cl e %esi sono a 0. Facciamo step per vedere l'esito del confronto: dopo la riga 21 l'esecuzione giunge alla riga 22, indicando che il salto non è stato fatto perché jne è stata eseguita dopo

un confronto tra valori uguali.

Continuiamo con step controllando che il comportamento sia quello atteso, fino a giungere di nuovo alla riga 20.

```
    (gdb) i r ax bx cl esi

    ax
    0x1
    1

    bx
    0x0
    0

    cl
    0x1
    1

    esi
    0x1
    1
```

Qui abbiamo la prima sorpresa. In %bx troviamo 0, ma il secondo valore di array è 256. Se continuiamo, vediamo che 256 compare come terzo valore, poi 1 come quarto, poi 256 come quinto. Abbiamo quindi dei valori aggiuntivi che compaiono nel vettore mentre lo scorriamo ma non nell'allocazione codice a riga 4. Continuando ancora, vediamo che i 9 valori coperti dal programma non sono affatto tutti e 9 quelli a riga 4, e che effettivamente il valore 1 compare 3 volte.

Abbiamo intanto confinato il problema: la lettura di valori da array.

Per capire cosa sta succedendo, dobbiamo ricordare come si comporta l'allocazione in memoria di valori su più byte: abbiamo infatti a che fare con *word*, composte da 2 byte ciascuna, e un indirizzo in memoria è l'indirizzo di un solo byte.

L'architettura x86 è little-endian, che significa little end first, un riferimento a l'viaggi di Gulliver. Questo si traduce nel fatto che quando un valore di n byte viene salvato in memoria a partire dall'indirizzo a, il byte meno significativo del valore viene salvato in a, il secondo meno significativo in a+1, e così via fino al più significativo in a+(n-1).

Possiamo quindi immaginare così il nostro array in memoria.



Figura 7.1: Layout di array in memoria.

La lettura di una word dalla memoria funziona quindi così: dato l'indirizzo a, vengono letti i byte agli indirizzi a e a+1 e contatenati nell'ordine (a+1,a). Una istruzione come movw a, %bx, quindi, salverà il contenuto di a+1 in %bh e il contenuto di a in %bl.

Per la lettura di più word consecutive, dobbiamo assicurarci di incrementare l'indirizzo di 2 alla volta: come mostrato in figura, il secondo valore è memorizzato a partire da array + 2, il terzo da array + 4, e così via. Tornando però al codice dell'esercizio, questo non succede:

```
comp:
    cmp array_len, %esi
    je fine
    movw array(%esi), %bx
    cmpw %bx, %ax
    jne poi
    inc %cl

poi:
    inc %esi
    jmp comp
```

Ecco quindi spiegato cosa legge il programma in memoria: quando alla seconda iterazione si esegue movb array(%esi), %bx, con %esi che vale 1, si sta leggendo un valore composto dal byte meno significativo

del secondo valore concatenato con il byte più significativo del primo. Questo valore è del tutto estraneo e privo di senso se confrontato con array così come è stato dichiarato e allocato, ma nell'eseguire le istruzioni il processore non controlla niente di tutto ciò.



Figura 7.2: Lettura erronea di array: sbagliando l'incremento dell'indirizzo, leggiamo dei byte senza alcuna relazione fra loro dalla memoria e li interpretiamo come parti di una word.

Abbiamo due strade per correggere questo errore. Il primo approccio è quello di incrementare %esi di 2 alla volta, così che l'indirizzamente array(%esi) risulti corretto. Questo però vuol dire che %esi non può più essere usato come contatore confrontabile con  $array_len$ , e si dovrà gestire tale confronto in altro modo (per esempio, usando un registro separato come contatore). La seconda strada è quella di usare il fattore di scala dell'indirizzamento, che è pensato proprio per questi casi. Infatti, array(, %esi, 2) calcolerà l'indirizzo array + 2 \* esi. Da notare la virgola subito dopo la parentesi, a indicare che non si sta specificando alcun registro base, mentre %esi è indice.

In ultimo, una riflessione sul codice C che abbiamo visto prima come modello di questo programma: in quel codice non vi è alcun errore perché array[esi], sfruttando la tipizzazione e l'aritmetica dei puntatori, applica sempre i fattori di scala corretti.

Il codice finale, scaricabile qui, è il seguente:

```
.include "./files/utility.s"
1
2
    .data
3
                  .word 1, 256, 256, 512, 42, 2048, 1024, 1, 0
4
    array:
    array_len:
                 .long 9
5
    numero:
                  .word 1
6
7
8
    .text
9
10
    main:
11
        nop
12
        mov $0, %cl
13
        mov numero, %ax
14
        mov $0, %esi
15
16
        cmp array_len, %esi
17
18
         je fine
         cmpw array(, %esi, 2), %ax
19
        jne poi
20
        inc %cl
21
22
23
    poi:
24
        inc %esi
25
         jmp comp
26
27
    fine:
```

```
28  mov %cl, %al
29  call outdecimal_byte
30  ret
```

#### Esercizio 1.8: soluzione passo-passo

Ricordiamo la traccia dell'esercizio:

```
Scrivere un programma che svolge quanto segue.

# leggere 2 numeri interi in base 10, calcolarne il prodotto, e stampare il risultato.

# lettura:

# come primo carattere leggere il segno del numero, cioè un '+' o un '-'

# segue il modulo del numero, minore di 256

# stampa:

# stampare prima il segno del numero (+ o -), poi il modulo in cifre decimali
```

Questa è invece la soluzione proposta dall'esercizio:

```
.include "./files/utility.s"
1
2
   mess1: .asciz "inserire il primo numero intero:\r"
3
   mess2: .asciz "inserire il secondo numero intero:\r"
   mess3: .asciz "il prodotto dei due numeri e':\r"
5
          .word 0
6
7
   b:
            .word 0
8
9
   _main:
10
       lea mess1, %ebx
11
12
       call outline
13
       call in_intero
14
       mov %ax, a
15
16
       lea mess2, %ebx
       call outline
17
18
       call in_intero
19
       mov %ax, b
20
       mov a, %ax
21
       mov b, %bx
22
       imul %bx
23
24
       lea mess3, %ebx
25
        call outline
26
27
        call out_intero
28
29
30
   # legge un intero composto da segno e modulo minore di 256
   # ne lascia la rappresentazione in complemento alla radice base 2 in ax
31
32
   in_intero:
33
       push %ebx
       mov $0, %bl
34
   in_segno_loop:
35
       call inchar
36
37
        cmp $'+', %al
        je in_segno_poi
38
        cmp $'-', %al
39
        jne in_segno_loop
40
41
       mov $1, %bl
42
   in_segno_poi:
43
       call outchar
       call indecimal_word
44
    call newline
45
```

```
cmp $1, %bl
46
        jne in_intero_fine
47
        neg %ax
48
    in_intero_fine:
49
        pop %ebx
50
51
        ret
52
   # legge la rappresentazione di un numero intero in complemento alla radice base 2 in eax
53
   # lo stampa come segno seguito dalle cifre decimali
   out_intero:
55
56
        push %ebx
        mov %eax, %ebx
57
        cmp $0, %ebx
58
59
        ja out_intero_pos
60
        jmp out_intero_neg
61
   out_intero_pos:
      _mov $'+', %al
62
        call outchar
63
        jmp out_intero_poi
64
   out_intero_neg:
65
      mov $'-', %al
66
        call outchar
67
        neg %ebx
68
        jmp out_intero_poi
69
   out_intero_poi:
70
71
        mov %ebx, %eax
        call outdecimal long
72
        pop %ebx
73
        ret
74
```

Per brevità, e vista la documentazione dei sottoprogrammi, lascio al lettore l'interpretazione a grandi linee del programma. Passeremo direttamente ai problemi incontrati testando il programma.

```
inserire il primo numero intero:
+30
Segmentation fault
```

L'errore, sicuramente già ben noto, è in realtà un risultato tipico di una *vasta* gamma di errori. Di per sé significa semplicemente "tentativo di accesso in una zona di memoria a cui non si può accedere per fare quello che si voleva fare". Non spiega, per esempio, cos'è che si voleva fare e perché è sbagliato. Vediamo tramite il debugger.

```
Program received signal SIGSEGV, Segmentation fault.
_main () at /mnt/c/reti_logiche/assembler/lezioni/2/imul_debug.s:14

mov %ax, a
```

Vediamo che il problema è il tentativo di scrivere all'indirizzo a, che è la word allocata poco più su. Il problema qui è che il programma non ha nessuna distinzione tra .data e .text : di default è tutto .text, dove non si può scrivere perché non ci è permesso, normalmente, di sovrascrivere le istruzioni del programma.

```
.include "./files/utility.s"
1
2
3
   .data
   mess1: .asciz "inserire il primo numero intero:\r"
4
            .asciz "inserire il secondo numero intero:\r"
5
   mess3: .asciz "il prodotto dei due numeri e':\r"
6
            .word 0
7
   a:
   b:
            .word 0
8
9
   .text
10
11
    _main:
12
```

Riproviamo il programma:

```
inserire il primo numero intero:
+30
inserire il secondo numero intero:
+20
il prodotto dei due numeri e':
+600
```

Fin qui, sembra andare bene. Ricordiamoci però di testare *tutti i casi di interesse*, in particolare i *casi limite*. Le specifiche dell'esercizio ci chiedono di considerare numeri interi di modulo inferiore a 256.

```
inserire il primo numero intero:
+255
inserire il secondo numero intero:
+255
il prodotto dei due numeri e':
+65025
```

#### Corretto.

```
inserire il primo numero intero:
-255
inserire il secondo numero intero:
+255
il prodotto dei due numeri e':
+511
```

Decisamente non corretto. Verifichiamo col debugger. Per prima cosa, ci assicuriamo che la lettura di numeri negativi sia corretta. Mettiamo un brekpoint a riga 16 (riga 14 prima dell'aggiunta di .data e .text), e verifichiamo cosa viene letto quando inseriamo -255.

```
(gdb) b 16
Breakpoint 2 at 0x56556774: file /mnt/c/reti_logiche/assembler/lezioni/2/imul_debug.s, line
    → 16.
(gdb) c
Continuing.
inserire il primo numero intero:
-255

Breakpoint 2, _main () at /mnt/c/reti_logiche/assembler/lezioni/2/imul_debug.s:16
16     mov %ax, a
(gdb) i r ax
ax     0xff01    -255
(gdb)
```

Fin qui è bene, il problema non sembra essere nella lettura di interi da tastiera. Proseguiamo quindi alla moltiplicazione, e controlliamone il risultato. La imul utilizzata è a 16 bit, che da documentazione vediamo usa %ax come operando implicito, %bx come operando esplicito, e %dx\_%ax come destinatario del calcolo.

```
Breakpoint 3, _main () at /mnt/c/reti_logiche/assembler/lezioni/2/imul_debug.s:25
            imul %bx
25
(gdb) i r ax bx
               0xff01
                                    -255
ax
               0xff
                                    255
bx
(gdb) s
            lea mess3, %ebx
27
(gdb) i r dx ax
               0xffff
dx
                                    -1
               0x1ff
                                    511
ax
(gdb)
```

 il numero di bit. Il risultato è -65025, che è quello che ci aspettiamo. Anche qui quindi è bene: resta la stampa di questo valore, cioè il sottoprogramma out\_intero.

```
# legge la rappresentazione di un numero intero in complemento alla radice base 2 in eax
# lo stampa come segno seguito dalle cifre decimali
```

Vediamo qui la prima discrepanza: il sottoprogramma si aspetta il risultato in %eax, ma noi sappiamo che la imul lo lascia in %dx\_%ax. Ci si può chiedere quale dei due correggere, se il sottoprogramma o il programma che lo usa: in generale, si cambiano le specifiche di un componente interno (il sottoprogramma) solo quando non hanno senso, mentre in questo caso abbiamo il componente esterno (il programma) che non rispetta le specifiche d'uso di quello interno.

Assicuriamoci quindi di lasciare il risultato nel registro giusto prima di call out\_intero.

```
mov a, %ax
mov b, %bx
imul %bx

shl $16, %edx
movw %ax, %dx
movl %edx, %eax

lea mess3, %ebx
call outline
call out_intero
```

#### Riproviamo ad eseguire:

```
inserire il primo numero intero:
-255
inserire il secondo numero intero:
+255
il prodotto dei due numeri e':
+4294902271
```

Ritorniamo al debugger, cominciando dalla call di out\_intero, verificando di avere il valore corretto in %eax.

Il valore è corretto. Proseguiamo quindi nel sottoprogramma, cercando di capire come funziona e dove potrebbe sbagliare. La prima cosa che notiamo è che il sottoprogramma ha due rami, out\_intero\_pos e out\_intero\_neg, dove stampa segni diversi e, in caso di numero negativo, usa la neg per ottenere l'opposto. Quando si giunge a out\_intero\_poi, stampa il modulo del numero usando outdecimal\_long (che, ricordiamo, supporta solo numeri naturali). Tuttavia, nella nostra esecuzione abbiamo un negativo che viene stampato come naturale.

Verifichiamo seguendo l'esecuzione con step, che entra nel sottoprogramma out\_intero:

```
(gdb) s
out_intero () at /mnt/c/reti_logiche/assembler/lezioni/2/imul_debug.s:62
62
            push %ebx
(gdb) s
63
            mov %eax, %ebx
(gdb) s
            cmp $0, %ebx
(gdb) i r ebx
               0xffff01ff
                                     -65025
ebx
(gdb) s
65
            ja out_intero_pos
(gdb) s
```

Effettivamente, nonostante %ebx sia un numero negativo, il salto a out\_intero\_pos viene eseguito. Guardiamo però meglio: l'istruzione di salto è ja, che interpreta il confronto come *tra numeri naturali*. In effetti, qualunque valore di %ebx diverso da 0, se interpretato come naturale, risulta maggiore di 0. Correggiamo quindi utilizzando jg, e ritestiamo.

```
cmp $0, %ebx
    jg out_intero_pos
    jmp out_intero_neg

inserire il primo numero intero:
    -255
inserire il secondo numero intero:
+255
il prodotto dei due numeri e':
-65025
```

Si dovrebbe continuare con altri test (combinazioni di segni, uso di 0) fino a convincersi che funzioni, per questa lezione ci fermiamo qui.

Il codice finale, scaricabile qui, è il seguente:

```
.include "./files/utility.s"
1
2
   .data
3
   mess1: .asciz "inserire il primo numero intero:\r"
4
  mess2: .asciz "inserire il secondo numero intero:\r"
   mess3: .asciz "il prodotto dei due numeri e':\r"
          .word 0
7
   a:
8
   b:
           .word 0
9
10
   .text
11
   _main:
12
       nop
       lea mess1, %ebx
13
14
       call outline
15
       call in_intero
16
       mov %ax, a
17
       lea mess2, %ebx
18
        call outline
19
        call in_intero
20
       mov %ax, b
21
22
23
        mov a, %ax
24
        mov b, %bx
        imul %bx
25
26
        shl $16, %edx
27
28
        movw %ax, %dx
29
        movl %edx, %eax
30
        lea mess3, %ebx
31
        call outline
32
        call out_intero
33
34
35
   # legge un intero composto da segno e modulo minore di 256
36
37
   # ne lascia la rappresentazione in complemento alla radice base 2 in ax
38
   in intero:
39
       push %ebx
       mov $0, %bl
40
41
   in_segno_loop:
```

```
call inchar
42
        cmp $'+', %al
43
        je in_segno_poi
44
        cmp $'-', %al
45
        jne in_segno_loop
46
        mov $1, %bl
47
   in_segno_poi:
48
        call outchar
49
        call indecimal_word
50
        call newline
51
52
        cmp $1, %bl
53
        jne in_intero_fine
54
       neg %ax
55
   in_intero_fine:
        pop %ebx
56
57
        ret
58
   # legge la rappresentazione di un numero intero in complemento alla radice base 2 in eax
59
   # lo stampa come segno seguito dalle cifre decimali
60
   out_intero:
61
        push %ebx
62
        mov %eax, %ebx
63
        cmp $0, %ebx
64
        jg out_intero_pos
65
        jmp out_intero_neg
66
   out_intero_pos:
67
       mov $'+', %al
68
        call outchar
69
70
        jmp out_intero_poi
   out_intero_neg:
71
72
        mov $'-', %al
73
        call outchar
74
        neg %ebx
75
        jmp out_intero_poi
76
   out_intero_poi:
77
        mov %ebx, %eax
78
        call outdecimal_long
79
        pop %ebx
80
        ret
```

#### 7.2 Esercizio 2.1: esercizio d'esame 2022-01-26

Vediamo ora un esercizio d'esame, del 26 Gennaio 2022. Il testo con soluzione si trova qui.

#### Provare da sé

Provare a svolgere da sé l'esercizio, prima di guardare la soluzione o andare oltre per la discussione.

La soluzione di questo esercizio ha alcuni spunti interessanti.

Il primo è che il set di dati è presentato come una matrice. Ma a differenza del C dove possiamo scrivere matrice[i][j] e lasciare che l'aritmetica dei puntatori faccia il resto, in assember dobbiamo gestire da noi la rappresentazione di una matrice tramite un vettore, associando indici su due dimensioni ad un solo indice. L'esercizio ci aiuta in questo indicando una associazione specifica, usata anche per il caricamento dello stato iniziale.

Da questa associazione osserviamo che: ogni lettera corrisponde a 4 celle consecutive, dove a corrisponde a [0,3], b a [4,7] e così via. Date le 4 celle consecutive, il numero determina una tra queste, dove 1 significa la prima, 2 la seconda e così via. Se traduciamo la lettera in un indice i e il numero in un indice j, entrambi  $\in [0,3]$ , possiamo esprimere quindi l'indice della cella nel vettore come i\*4+j.

Nella soluzione, i sottoprogrammi in\_lettera e in\_numero si occupano di leggere i due valori da tastiera (con la solita struttura ciclica per ignorare caratteri inattesi) e lasciare il relativo indice in %al. Dato che i caratteri utilizzati sono consecutivi nella tabella ASCII, questi indici sono calcolabili con una semplice sottrazione.

7.3. ESERCIZI PER CASA 49

```
# Sottoprogramma per la lettura della lettera, da 'a' a 'd'
# Lascia l'indice corrispondente (da 0 a 3) in AL
in_lettera:
    call inchar
    cmp $'a', %al
    jb in_lettera
    cmp $'d', %al
    ja in_lettera
    call outchar
    sub $'a', %al
    ret
```

Questi indici sono poi composti secondo la formula di cui sopra.

```
call in_lettera
mov %al, %cl
shl $2, %cl # cl = cl * 4, ossia la dimensione di ogni riga
call in_numero
add %al, %cl # cl contiene l'indice (da 0 a 15) della posizione bersagliata
```

Il secondo punto interessante è che non è necessario utilizzare un vettori di byte in memoria, perché per gestire un flag vero/falso basta un bit, e per gestirne 16 basta una word. Tuttavia, non abbiamo modo di interagire con i registri in modo diretto sul singolo bit: possiamo immaginare una sintassi come %ax[%cl] che testi o modifichi uno specifico bit, ma il processore non ha nulla del genere.

Possiamo però utilizzare istruzioni bit a bit, con delle *maschere* adeguate che vadano a testare o modificare solo ciò che ci interessa.

Per il test, possiamo usare una and con una maschera composta da soli 0 tranne che per la posizione che ci interessa testare. Se il risultato è diverso da 0, vuol dire che l'altro operando, alla posizione d'interesse, ha il bit 1.

```
mov $1, %ax shl %cl, %ax # ax contiene una maschera da 16 bit con 1 nella posizione bersagliata and %dx, %ax # se abbiamo colpito qualcosa, ax rimane invariato. altrimenti varra' 0 jz mancato
```

Similmente, quando intendiamo mettere un bit a 0 (in questo caso, a indicare che il bersaglio colpito non c'è più), possiamo usare una and con maschera opposta alla precedente, ossia con soli 1 tranne che per la posizione da azzerare, o una xor con la stessa maschera precedente, che causerà il cambio di valore (da 1 a 0 o da 0 a 1) solo del bit d'interesse. La soluzione, dato che a questo punto è già noto che il bit di interesse è a 1, utilizza la seconda opzione.

```
colpito:
    lea msg_colpito, %ebx
    call outline
    xor %ax, %dx # togliamo il bersaglio colpito
    jmp ciclo_partita_fine
```

Questo schema rende tralaltro molto più semplice la lettura dello stato iniziale, dato che tutto il necesario è fatto dal sottoprogramma di utility inword.

# 7.3 Esercizi per casa

#### Esercizio 2.2

Quello che segue (e scaricabile qui ) è un tentativo di soluzione per le seguenti specifiche:

```
# Leggere una riga dal terminale, che DEVE contenere almeno 2 caratteri '_'
# Identificare e stampa la sottostringa delimitata dai primi due caratteri '_'
```

Un esempio di output ( qui in formato txt) è il seguente

```
questa e' una _prova_ !!
prova
```

Contiene tuttavia uno o più bug. Trovarli e correggerli.

```
.include "./files/utility.s"
1
2
3
    .data
4
   msg_in: .fill 80, 1, 0
5
6
7
    .text
8
    _main:
9
        nop
        mov $80, %cx
10
11
        lea msg_in, %ebx
        call inline
12
13
        cld
14
        mov $'_', %al
lea msg_in, %esi
15
16
        mov $80, %cx
17
18
        repne scasb
19
        mov %esi, %ebx
20
        repne scasb
21
        mov %esi, %ecx
22
        sub %ebx, %ecx
23
        call outline
24
25
        ret
26
```

#### Esercizio 2.3

A partire dalla soluzione dell'esercizio precedente, estendere il programma per rispettare le seguenti specifiche:

```
# Leggere una riga dal terminale
# Identificare e stampa la sottostringa delimitata dai primi due caratteri '_'
# Se un solo carattere '_' e' presente, assumere che la sottostringa cominci
# ad inizio stringa e finisca prima del carattere '_'
# Se nessun carattere '_' e' presente, stampare l'intera stringa
```

# 8. Esercitazione 3

# 8.1 Soluzioni esercizi per casa

#### Esercizio 2.2: soluzione

Il programma usa repne scasb per scorrere il vettore finché non trova il carattere in %al, cioè \_. Dopo la prima scansione, salva l'indirizzo attuale per usarlo come indirizzo di partenza della sottostringa. Dopo la seconda scansione, fa una sottrazione di indirizzi per trovare il numero di caratteri che compongono la sottostringa. Usando indirizzo di partenza e numero caratteri, stampa quindi a terminale.

I bug da trovare sono i seguenti:

- Le istruzioni rep utilizzano %ecx, ma la riga 17 inizializza solo %cx. Questo funziona solo se, per puro caso, la parte alta di %ecx è a 0 ad inizio programma.
- L'istruzione scasb ha l'indirizzo del vettore come destinatario implicito in %edi, non %esi.
- La repne scasb termina *dopo* aver scansionato il carattere che rispetta l'equivalenza. Questo vuol dire che dopo la prima scansione abbiamo l'indirizzo del carattere dopo il primo \_ (corretto) ma dopo la seconda scansione abbiamo l'indirizzo del carattere dopo il secondo \_ : la sottrazione calcola una sottostringa che include il \_ di terminazione.
- Il sottoprogramma usato è quello sbagliato: outline stampa finché non incrontra \r, per indicare il numero di caratteri da stampare va usato outmess.

Il codice dopo le correzioni è quindi il seguente, scaricabile qui.

```
.include "./files/utility.s"
1
2
3
    .data
4
5
    msg_in: .fill 80, 1, 0
6
7
    .text
8
    _main:
9
         nop
         mov $80, %cx
10
11
         lea msg_in, %ebx
12
         call inline
13
14
        mov $'_', %al
lea msg_in, %edi
15
16
         mov $80, %cx
17
18
19
         repne scasb
         mov %edi, %ebx
20
21
         repne scasb
         mov %edi, %ecx
22
         sub %ebx, %ecx
23
         dec %ecx
24
         call outmess
25
26
27
```

Si sottolinea inoltre una debolezza della soluzione: la sottrazione fra puntatori funziona solo perché la scala è 1, cioè maneggiamo valori da 1 byte, per cui c'è corrispondenza fra la differenza di due indirizzi e il numero di elementi fra loro. Una soluzione più robusta è utilizzare la differenza del contantore %ecx anziché di puntatori. In alternativa, si può utilizzare shift a destra dopo la sottrazione per tener conto di una scala maggiore di 1, ma è un metodo che rende facile sbagliare (bisogna stare attenti all'ordine tra shift e decremento). Si può verificare come un simile esercizio basato su word, per esempio con serie di

valori decimali delimitati da 0.

#### Esercizio 2.3: soluzione

Il programma dell'esercizio 2.2 viene complicato dalla richiesta di gestire dei valori di default, in caso siano presenti uno o nessun delimitatore \_. Questo vuol dire gestire il caso in cui una repne scasb termina non perché ha trovato il carattere, ma perché %ecx è stato decrementato fino a 0.

Questo si implementa come dei semplici check su %ecx dopo ciascuna repne scasb, in caso sia 0 si va ad un branch separato: se succede alla prima scansione non è presente alcun \_ e saltiamo quindi a print\_all, se succede alla seconda scansione abbiamo solo un \_ e saltiamo quindi a print\_from\_start. Altrimenti, si prosegue con lo stesso codice dell'esercizio 2.2, che nomineremo print\_substr.

Per print\_all basta una semplice outline dell'intera stringa. Per print\_from\_start, si fa un ragionamento non dissimile da quanto visto per l'esercizio precedente, dove va usato come inizio l'indirizzo di msg\_in e il numero di caratteri può essere calcolato, come prima, usando l'indirizzo che troviamo in %edi dopo la prima repne scasb.

Il codice risultante è il seguente, scaricabile qui.

```
.include "./files/utility.s"
1
2
3
    .data
4
5
    msg_in: .fill 80, 1, 0
6
7
    .text
8
    _main:
9
        nop
10
        mov $80, %cx
11
        lea msg_in, %ebx
        call inline
12
13
        cld
14
        mov $'_', %al
15
        lea msg_in, %edi
16
        mov $80, %ecx
17
18
19
        repne scasb
        cmp $0, %ecx
20
21
        je print_all
22
        mov %edi, %ebx
23
24
        repne scasb
        cmp $0, %ecx
25
        je print_from_start
26
27
    print_substr:
28
        mov %edi, %ecx
29
        sub %ebx, %ecx
30
31
        dec %ecx
        call outmess
32
        ret
33
34
    print from start:
35
        mov %ebx, %ecx
36
        lea msg_in, %ebx
37
        sub %ebx, %ecx
38
        dec %ecx
39
        call outmess
40
41
        ret
42
43
    print all:
        lea msg_in, %ebx
44
        call outline
45
46
        ret
```

### 8.2 Esercizio 3.1: esercizio d'esame 2021-01-08

Il testo con soluzione si trova qui.

#### Provare da sé

Provare a svolgere da sé l'esercizio, prima di guardare la soluzione o andare oltre per la discussione.

Questo esercizio pone principalmente tre spunti.

Il primo è la gestione dell'input, da eseguire con un loop di inchar e controlli, facendo outchar solo quando il carattere è accettato. Questo è stato già visto, per esempio, nell'esercizio 1.8.

Il secondo spunto riguarda il *dimensionamento* dei dati da gestire. Infatti, dobbiamo scegliere se usare 8, 16 o 32 bit, e possiamo farlo solo cercando di capire su quanti bit sta il numero più grande che possiamo gestire.

Data la natura del problema, è facile intuire che questo si trova quando N=9 e k=9. Dovremmo stampare un triangolo 9 righe, ciascuna composta da 1 a 9 numeri, a partire da 1 e di passo 9. Da una parte, potremmo ricordarci questa è una sequenza nota: la somma di 1+2+...+n è  $\frac{n(n+1)}{2}$ , quindi abbiamo  $9\cdot 10/2=45$  elementi. Tuttavia, un approccio più semplice porta a un risultato simile: di sicuro il triangolo avrà meno elementi di un quadrato di lato 9, composto da  $9\cdot 9=81$  elementi e, dato che la diagonale è inclusa, avrà più della metà di questo, cioè 81/2. Possiamo quindi dire con questo ragionamento che sono più di 41 elementi e meno di 81, mentre usando la formula esatta troviamo che sono 45.

Dato che incrementiamo di passo 9 ogni volta, il numero di posizione j sarà  $(j-1)\cdot 9+1$ . Considerando per la stima di prima il 41-esimo elemento, abbiamo  $40\cdot 9+1=361$ , mentre l'81-esimo elemento (che non sarà mai presente) sarebbe  $80\cdot 9+1=721$ . Il valore esatto, se ci ricordiamo la formula di cui sopra, è invece  $44\cdot 9+1=397$ . Un tale numero deve essere rappresentato su più di 8 bit, ma sta senza problemi in 16 bit: svolgeremo quindi i nostri calcoli usando delle word di 16 bit.

Non resta quindi che fare la stampa del triangolo. Questo si può scrivere come un doppio loop, dove il loop interno usa il contatore esterno per determinare quando uscire stampando una nuova riga, mentre un registro contatore viene utilizzato durante ogni ciclo per calcolare il nuovo numero da stampare. In (pseudo) C, tale ciclo avrebbe una forma simile:

```
short c = 1; // word da 16 bit
for(int i = 0; i < n; i++) {
    for(int j = 0; j < i + 1; j++) {
        outdecimal_word(c);
        outchar(' ');
        c += k;
    }
    outline()
}</pre>
```

# 8.3 Esercizio 3.2: esercizio d'esame 2021-09-15

Il testo con soluzione si trova qui.

#### Provare da sé

Provare a svolgere da sé l'esercizio, prima di guardare la soluzione o andare oltre per la discussione.

Questo esercizio ci chiede di leggere una stringa e poi analizzarne i caratteri, contando le occorrenze di alcuni di questi.

La lettura si può svolgere con la inline. Dopodiché, viene la parte di scansione e stampa. Si possono individuare due strategie, entrambe accettate in sede d'esame.

Nella prima strategia, si mantiene un vettore di conteggio (16 celle da 1 byte inizializzate a 0) e si scansiona la stringa una volta sola. Ogni qualvolta si trova un carattere d'interesse, se ne calcola l'indice e si incrementa la cella corrispondente del vettore. Per il calcolo di tale indice, basta fare sottrazioni e somme ragionando sul valore numerico della codifica ASCII, come visto nell'esercizio 2.1. Per esempio, dato un carattere c di valore compreso tra 'a' e 'f', il valore corrispondente (e dunque l'indice del vettore) sarà c-'a'+10. Alla fine di questa scansione della stringa, si scansione il vettore di contatori stampando una

riga per contantore, facendo il processo inverso per la conversione da indice a cifra esadecimale.

Nella seconda strategia, si sfrutta il fatto che le stampe sono in ordine, e ciascuna su una riga separata. Possiamo quindi evitare il vettore di contatori, e scansionare la stringa una volta per cifra esadecimale contando le occorrenze di quella specifica cifra e stampandone la riga corrispondente immediatamente, anziché ad un passaggio successivo dopo aver salvato il conteggio in memoria.

In termini di complessità algoritmica, la prima strategia è  $O(n_{cifre})$  in memoria e  $O(n_{stringa}) + O(n_{cifre})$  in tempo, la seconda strategia è O(1) in memoria e  $O(n_{cifre} \cdot n_{stringa})$  in tempo. Questo è un esempio classico di trade-off tra cicli di calcolo e occupazione della memoria, che porta a differenti scelte ottime in base alle condizioni del problema. Mentre nelle condizioni semplici in cui operiamo la differenza è decisamente esigua, con i due n che sono soltanto 80 e 16, in casi più complessi vincerà una strategia sull'altra a seconda delle natura del problema.

In poche parole, per l'esame: vanno entrambe bene.

Va specificato però cosa <u>non</u> andrebbe bene: scrivere 16 o più blocchi di codice simile, dove cambia solo il carattere, inserito come letterale, usato per il confronto. Quale che sia la strategia utilizzata, <u>il codice va generalizzato</u> in modo da usare le stesse istruzioni per operazioni simili e minimizzare i punti da cui può scaturire un errore.

# 9. Esercitazione 4

## 9.1 Esercizio 4.1: esercizio d'esame 2023-01-10

Il testo con soluzione si trova qui.

#### Provare da sé

Provare a svolgere da sé l'esercizio, prima di guardare la soluzione o andare oltre per la discussione.

Per svolgere l'esercizio c'è bisogno di rammentare la teoria sulla moltiplicazione di numeri naturali, dal modulo di aritmetica. Lì si è visto che in una qualunque base  $\beta$  mi basta saper fare la moltiplicazione tra numeri di una sola cifra, e saper scomporre le moltiplicazioni su più cifre in moltiplicazioni a una sola cifra con shift e somme.

Rinfreschiamo il concetto a partire da numeri in base 10, che è quella a cui siamo abituati. In questa base, saper fare le moltiplicazioni tra numeri di una sola cifra equivale a sapere le tabelline. Scomporre la moltiplicazione su più cifre altro non è che fare la moltiplicazione in colonna

```
75 *
23 =
----
15 +
21 +
10 +
14 =
----
1725
```

Una parte importante della moltiplicazione in colonna è "spostare a sinistra" i prodotti tra cifre, che in forma più esplicita si fa mettendo degli zeri. Questo altro non è che moltiplicare il prodotto parziale per la giusta potenza di 10. Infine, partendo dal prodotto di numeri di 2 cifre ciascuno, si ha un risultato su 4 cifre. Questo procedimento è del tutto generalizzabile in qualunque base  $\beta$ .

Torniamo a noi: dobbiamo fare una moltiplicazione su 16 bit, usando solo istruzioni mul a 8 bit. Se consideriamo  $\beta = 2^8$ , questo è un prodotto tra numeri di due cifre e abbiamo tutti gli ingredienti necessari:

- il prodotto tra singole cifre lo sappiamo fare, perché è proprio la mul a 8 bit,
- sappiamo moltiplicare i prodotti parziali per potenze di  $\beta$ , ci basterà fare shl per 8 e 16 bit,
- sappiamo sommare i prodotti parziali, perché abbiamo la add a 32 bit che l'esercizio ci consente di usare.

Siano i due numeri x e y scritti come due cifre in base  $2^8$ , xh xl e yh yl. Allora si scompone la loro moltiplicazione come

```
xh xl *
yh yl =
-----
(xl * yl) +
(xh * yl) * 2^8 +
(xl * yh) * 2^8 +
(xh * yh) * 2^16 =
------
x * y
```

Da qui, l'implementazione che ne segue è molto semplice.

## 9.2 Esercizio 4.2: esercizio d'esame 2023-09-12

Il testo con soluzione si trova qui.

#### Provare da sé

Provare a svolgere da sé l'esercizio, prima di guardare la soluzione o andare oltre per la discussione.

Trovare numeri primi è un problema molto studiato, soprattutto per le varie ottimizzazioni algoritmiche possibili e necessarie se si vuole affrontare la ricerca di primi molto grandi. Per questo esercizio non serve nulla di complicato.

Un numero non è primo se è divisible per almeno uno dei numeri primi precedenti, altrimenti è primo. Quindi se è nota la lista di numeri primi  $p_1,...,p_k$  minori del numero corrente n, ci basterà scorrere questa lista testando la divisione tra naturali  $n/p_i$  e controllandone il resto. Se troviamo resto 0 per qualche  $p_i$  (ne basta uno) il numero non è primo. Se arriviamo alla fine della lista senza mai trovare la condizione di sopra, il numero è primo. Lo aggiungiamo quindi alla lista e continuiamo oltre.

L'algoritmo di sopra è facilmente implementabile in assembler con l'aiuto di alcune ipotesi date dall'esercizio:

- Sappiamo il numero massimo di primi da considerare, cioè 50. La lista può quindi essere implementata con un vettore di 50 elementi e un contatore che indichi quante delle sue celle sono state riempite.
- Sappiamo che il massimo numero primo da considerare è < 255, ergo ci basteranno 8 bit.
- I primi due numeri primi, 2 e 3, sono da considerarsi già noti. Questo ci evita diverse complicazioni per i primi passaggi. Per esempio, sarà vero che nessun altro numero pari potrà essere primo e che si può incrementare di 2 alla volta per saltare da un numero dispari al successivo.

Da qui, l'implementazione dell'esercizio è solo questione di scorrimento del vettore e controllo di flusso. Nella soluzione proposta, vediamo che la ricerca del successivo numero primo è implementata con il sottoprogramma apposito find\_next\_prime, che si occupa della ricerca del numero e l'aggiunta in coda al vettore. La logica principale si limita a chiamare find\_next\_prime finché il contatore dei numeri primi non raggiunge quanto richiesto dall'utente, per poi stampare il vettore con la formattazione desiderata.

# Parte II Documentazione

# 10. Architettura x86

Riportiamo qui una vista *semplificata* e *riassuntiva* dell'architettura x86 per la quale scriveremo programmi assembler.

L'architettura x86 è a 32 bit. Questo implica che i registri generali, così come tutti gli indirizzi per locazioni in memoria, sono a 32 bit. L'evoluzione di questa architettura, x64 a 64 bit, che è quella che troviamo nei processori in commercio, è del tutto retrocompatibile.

#### Importanti semplificazioni

La visione del processore che proponiamo è molto limitata, ed omette diversi importanti registri, flag e funzionalità che saranno esplorati in corsi successivi. Questi includono, per esempio, il registro ebp, la natura dei meccanismi di protezione, il significato di SEGMENTATION FAULT, e che cosa sia un kernel.

Quanto discutiamo è tuttavia sufficiente agli scopi didattici di questo corso.

# 10.1 Registri

I registri che utilizzeremo direttamente sono 6: eax, ebx, ecx, edx, esi, edi. Per i primi quattro di questi, è possibile operare sulle loro porzioni a 16 e 8 bit tramite ax, ah, al e così via. Per i registri esi ed edi è possibile operare solo sulle porzioni a 16 bit, tramite si e di. Tipicamente, i registri eax... edx sono utilizzati per processare dati, mentre esi ed edi sono utilizzati come registri puntatori. Questa divisione di utilizzo non è però affatto obbligatoria per la maggior parte delle istruzioni.

Altri registri sono invece utilizzati in modo indiretto:

- esp è il registro puntatore per la *cima* dello stack, viene utilizzato da pop / push per prelevare/spostare valori nella pila, e da call / ret per la chiamata di sottoprogrammi;
- eip è il registro puntatore verso la prossima istruzione da eseguire, viene incrementato alla fine del fetch di una istruzione e modificato da istruzioni che cambiano il flusso d'esecuzione, come call, ret e le varie jmp;
- eflags è il registro dei flag, una serie di booleani con informazioni sullo stato dell'esecuzione e sul risultato dell'ultima operazione aritmetica. I flag di nostro interesse sono il carry flag CF (posizione O), lo zero flag ZF (6), il sign flag SF (7), l'overflow flag OF (11). Sono tipicamente aggiornati dalle istruzioni aritmetiche, e testati indirettamente con istruzioni condizionali come jcon, set e cmov.

Di seguito uno schema funzionale dei registri del processore x86.



#### 10.2 Memoria

Lo spazio di memoria dell'architettura x86 è indirizzato su 32 bit. Ciascun indirizzo corrisponde a un byte, ma è possibile eseguire anche letture e scritture a 16 e 32 bit.

Per tali casi è importante ricordare che l'architettura x86 è *little-endian*, che significa **little end first**, un riferimento a I viaggi di Gulliver. Questo si traduce nel fatto che quando un valore di n byte viene salvato in memoria a partire dall'indirizzo a, il byte meno significativo del valore viene salvato in a, il secondo meno significativo in a+1, e così via fino al più significativo in a+(n-1).

Questo ordinamento dei byte in memoria non inficia sulla coerenza dei dati nei registri: eseguendo movl %eax, a e movl a, %eax il contenuto di eax non cambia, e l'ordinamento dei bit rimane coerente.

I meccanismi di protezione ci precludono l'accesso alla maggior parte dello spazio di memoria. Potremmo accedere senza incorrere in errori solo

- 1. allo stack
- 2. allo spazio allocato nella sezione .data
- 3. alle istruzioni nella sezione .text

Queste sezioni tipicamente non includono gli indirizzi "bassi", cioè a partire da 0x0.

È importante anche tenere presente che

- 1. non è possibile eseguire istruzioni dallo stack e da .data
- non è possibile scrivere nella sezione .text

Vanno quindi opportunamente dichiarate le sezioni, e vanno evitate operazioni di jmp, call etc. verso locazioni di .data così come le mov verso locazioni di .text.

In caso di violazione di questi meccanismi, l'errore più tipico è SEGMENTATION FAULT.

# 10.3 Spazio di I/O

Lo spazio di I/O, sia quello fisico (monitor, speaker, tastiera, etc.) sia quello virtuale (terminale, files su disco, etc.) ci è in realtà precluso tramite *meccanismi di protezione*. Tentare di eseguire istruzioni in o out porterà infatti al brusco arresto del programma. Il nostro programma può interagire con lo spazio di I/O solo tramite il *kernel* del *sistema operativo*.

Tutta questa complessità è astratta tramite i sottoprogrammi di input/output dell'ambiente, documentati qui.

#### 10.4 Condizioni al reset

Il reset iniziale e l'avvio del nostro programma sono concetti completamente diversi e scollegati. Non possiamo sfruttare nessuna ipotesi sullo stato dei registri al momento dell'avvio del nostro programma, se non che il registro eip punterà ad un certo punto alla prima istruzione di \_main.

Il fatto che \_main sia l'entrypoint del nostro programma, così come l'uso di ret senza alcun valore di ritorno, è una caratteristica di *questo* ambiente.

# 11. Istruzioni processore x86

Le seguenti tabelle sono per *riferimento rapido* : sono utili per la programmazione pratica, ma omettono molteplici dettagli che serve sapere, e che trovate nel resto del materiale.

Si ricorda che utilizziamo la sintassi GAS/AT&T, dove le istruzioni sono nel formato opcode source destination. Nella colonna notazione, indicheremo con [bwl] le istruzioni che richiedono la specifica delle dimensioni. Quando la dimensione è deducibile dai registri utilizzati, questi suffissi si possono omettere. Per gli operandi, useremo le seguenti sigle:

- r per un registro (come in mov %eax, %ebx);
- m per un indirizzo di memoria;
- i per un valore immediato (come in mov \$0, %eax).

Per gli indirizzi in memoria, abbiamo a disposizione tre notazioni:

- immediato, come in mov numero, %eax;
- tramite registro, come in mov (%esi), %eax;
- con indice, come in mov matrice(%esi, %ecx, 4), %eax.

Si ricorda che non tutte le combinazioni sono permesse nell'architettura x86: nessuna istruzione generale supporta l'indicazione di *entrambi* gli operandi in memoria (cioè, non si può scrivere movl x, y o mov (%eax), (%ebx)). Fanno eccezione le istruzioni stringa come la movs, usando operandi impliciti.

# 11.1 Spostamento di dati

| Istruzione | Nome esteso                     | Notazione              | Comportamento                                                                  |
|------------|---------------------------------|------------------------|--------------------------------------------------------------------------------|
| mov        | Move                            | mov[bwl] r/m/i,<br>r/m | Scrive il valore sorgente nel destinatario. Non modifica alcun flag.           |
| lea        | Load Effective Address          | lea m, r               | Scrive l'indirizzo m nel registro destinatario.                                |
| xchg       | Exchange                        | xchg[bwl] r/m,<br>r/m  | Scambia il valore del sorgente con quello del destinatario.                    |
| cbw        | Convert Byte to Word            | cbw                    | Estende il contenuto di %al su %ax, interpretandone il contenuto come intero.  |
| cwde       | Convert Word to Dou-<br>bleword | cwde                   | Estende il contenuto di %ax su %eax, interpretandone il contenuto come intero. |
| push       | Push onto the Stack             | push[wl] r/m/i         | Aggiunge il valore sorgente in cima allo stack (destinatario implicito).       |
| рор        | Pop from the Stack              | pop[wl] r/m            | Rimuove un valore dallo stack (sorgente implicito) lo scrive nel destinatario. |

## 11.2 Aritmetica

| Istruzione | Nome esteso         | Notazione       | Comportamento                                                                           |
|------------|---------------------|-----------------|-----------------------------------------------------------------------------------------|
| add        | Addition            | add[bwl] r/m/i, | Somma sorgente e destinatario, scrive il risultato sul destinatario. Valido sia per     |
| auu        | Addition            | r/m             | naturali che interi. Aggiorna SF, ZF, CF e 0F.                                          |
| sub        | Subtraction         | sub[bwl] r/m/i, | Sottrae il sorgente dal destinatario, scrive il risultato sul destinatario. Valido sia  |
| Sub        | Subtraction         | r/m             | per naturali che interi. Aggiorna SF, ZF, CF e 0F.                                      |
| adc        | Addition with Carry | adc[bwl] r/m/i, | Somma sorgente, destinatario e CF, scrive il risultato sul destinatario. Valido sia     |
| auc        | Addition with Carry | r/m             | per naturali che interi. Aggiorna SF, ZF, CF e 0F.                                      |
| sbb        | Subtraction with    | sub[bwl] r/m/i, | Sottrae il sorgente e CF dal destinatario, scrive il risultato sul destinatario. Valido |
| รมม        | Borrow              | r/m             | sia per naturali che interi. Aggiorna SF, ZF, CF e 0F.                                  |
| inc        | Increment           | inc[bwl] r/m    | Somma 1 (sorgente implicito) al destinatario. Aggiorna SF, ZF, e 0F, ma non CF.         |
| dec        | Decrement           | dec[bwl] r/m    | Sottrae 1 (sorgente implicito) al destinatario. Aggiorna SF, ZF, e 0F, ma non CF.       |
|            | Negation            | neg[bwl] r/m    | Sostituisce il destinatario con il suo opposto. Aggiorna ZF, SF e 0F. Modifica          |
| neg        | INEGALIOII          | lieg[nwi] [/III | CF.                                                                                     |

Le seguenti istruzioni hanno operandi e destinatari impliciti, che variano in base alla dimensione dell'operazione. Usano in oltre composizioni di più registri: useremo %dx\_%ax per indicare un valore i cui bit più significativi sono scritti in %dx e quelli meno significativi in %ax.

| Istruzione | Nome esteso             | Notazione    | Comportamento                                                                            |  |
|------------|-------------------------|--------------|------------------------------------------------------------------------------------------|--|
| mul        | Unsigned Multiply, 8    | mulb r/m     | Calcola su 16 bit il prodotto tra naturali del sorgente e %al, scrive il risultato su    |  |
| mui        | bit                     | IIIuib I/III | %ax. Se il risultato non è riducibile a 8 bit, mette CF e 0F a 1, altrimenti a 0.        |  |
| mul        | Unsigned Multiply, 16   | mulw r/m     | Calcola su 32 bit il prodotto tra naturali del sorgente e %ax, scrive il risultato su    |  |
| mui        | bit                     | IIIuiw I/III | %dx_%ax. Se il risultato non è riducibile a 16 bit, mette CF e 0F a 1, altrimenti a 0.   |  |
|            | Unsigned Multiply, 32   |              | Calcola su 64 bit il prodotto tra naturali del sorgente e %eax, scrive il risultato su   |  |
| mul        | bit                     | mull r/m     | %edx_%eax. Se il risultato non è riducibile a 32 bit, mette CF e 0F a 1, altrimenti      |  |
|            | DIL                     |              | a 0.                                                                                     |  |
| imul       | Signed Multiply, 8 bit  | imulb r/m    | Calcola su 16 bit il prodotto tra interi del sorgente e %al, scrive il risultato su %ax. |  |
| IIIIui     | Signed Multiply, 6 bit  |              | Se il risultato non è riducibile a 8 bit, mette CF e 0F a 1, altrimenti a 0.             |  |
|            |                         |              | Calcola su 32 bit il prodotto tra interi del sorgente e %ax, scrive il risultato su      |  |
| imul       | Signed Multiply, 16 bit | imulw r/m    | %dx_%ax. Se il risultato non è riducibile a 16 bit, mette CF e 0F a 1, altrimenti        |  |
|            |                         |              | a 0.                                                                                     |  |
|            |                         |              | Calcola su 64 bit il prodotto tra interi del sorgente e %eax, scrive il risultato su     |  |
| imul       | Signed Multiply, 32 bit |              | %edx_%eax. Se il risultato non è riducibile a 32 bit, mette CF e 0F a 1, altrimenti      |  |
|            |                         |              | a 0.                                                                                     |  |

| Istruzione | Nome esteso            | Notazione | Comportamento                                                                                                                                                                  |
|------------|------------------------|-----------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| div        | div Unsigned Divide, 8 | divb r/m  | Calcola su 8 bit la divisione tra naturali tra %ax (dividendo implicito) e il sorgento (divisore). Scrive il quoziente su %al e il resto su %ah. Se il quoziente non è rappre- |
|            | DIC .                  |           | sentabile su 8 bit, causa <i>crash del programma</i> .                                                                                                                         |
|            | Unsigned Divide, 16    |           | Calcola su 16 bit la divisione tra naturali tra %dx_%ax (dividendo implicito) e il sor-                                                                                        |
| div        | bit                    | divw r/m  | gento (divisore). Scrive il quoziente su %ax e il resto su %dx. Se il quoziente non è                                                                                          |
|            | DIC .                  |           | rappresentabile su 16 bit, causa crash del programma.                                                                                                                          |
|            | Unsigned Divide, 32    |           | Calcola su 32 bit la divisione tra naturali tra %edx_%eax (dividendo implicito) e il                                                                                           |
| div        | bit                    | divl r/m  | sorgento (divisore). Scrive il quoziente su %eax e il resto su %edx. Se il quoziente                                                                                           |
|            | Dit                    |           | non è rappresentabile su 32 bit, causa <i>crash del programma</i> .                                                                                                            |
|            |                        |           | Calcola su 8 bit la divisione tra interi tra %ax (dividendo implicito) e il sorgento (divi-                                                                                    |
| idiv       | Signed Divide, 8 bit   | idivb r/m | sore). Scrive il quoziente su %al e il resto su %ah. Se il quoziente non è rappresen-                                                                                          |
|            |                        |           | tabile su 8 bit, causa crash del programma.                                                                                                                                    |
|            |                        |           | Calcola su 16 bit la divisione tra interi tra %dx_%ax (dividendo implicito) e il sorgento                                                                                      |
| idiv       | Signed Divide, 16 bit  | idivw r/m | (divisore). Scrive il quoziente su %ax e il resto su %dx. Se il quoziente non è rappre-                                                                                        |
|            |                        |           | sentabile su 16 bit, causa crash del programma.                                                                                                                                |
|            |                        |           | Calcola su 32 bit la divisione tra interi tra %edx_%eax (dividendo implicito) e il sor-                                                                                        |
| idiv       | Signed Divide, 32 bit  | idivl r/m | gento (divisore). Scrive il quoziente su %eax e il resto su %edx. Se il quoziente non                                                                                          |
|            |                        |           | è rappresentabile su 32 bit, causa crash del programma.                                                                                                                        |

# 11.3 Logica binaria

Le seguenti istruzioni operano *bit a bit* : data per esempio la and, l'i-esimo bit del risultato è l'and logico tra gli i-esimi bit di sorgente e destinatario.

| Istruzione | Notazione      | Comportamento                                                                            |  |
|------------|----------------|------------------------------------------------------------------------------------------|--|
| not        | not[bwl] r/m   | Sostituisce il destinatario con la sua negazione.                                        |  |
| and        | and r/m/i, r/m | Calcola l'and logico tra sorgente e destinatario, scrive il risultato sul destinatario.  |  |
| or         | or r/m/i, r/m  | Calcola l'or logico tra sorgente e destinatario, scrive il risultato sul destinatario.   |  |
| xor        | xor r/m/i, r/m | Calcola lo xor logico tra sorgente e destinatario, scrive il risultato sul destinatario. |  |

# 11.4 Traslazione e Rotazione

| Istruzione | Nome esteso              | Notazione        | Comportamento                                                                                                                                                                                                                                                                                                                                                                                |
|------------|--------------------------|------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| shl        | Shift Logical Left       | shl[bwl] i/r r/m | Sia $n$ l'operando sorgente, esegue lo shift a sinistra del destinatario $n$ volte, impostando a 0 gli $n$ bit meno significativi. In ciascuno shift, il bit più significativo viene lasciato in CF. Come registro sorgente si può utilizzare solo %cl. Il sorgente può essere omesso, in quel caso $n=1$ .                                                                                  |
| sal        | Shift Arithmetic<br>Left | sal[bwl] i/r r/m | Sia $n$ l'operando sorgente, esegue lo shift a sinistra del destinatario $n$ volte, impostando a 0 gli $n$ bit meno significativi. In ciascuno shift, il bit più significativo viene lasciato in CF. Se il bit più significativo ha cambiato valore almeno una volta, imposta 0F a 1. Come registro sorgente si può utilizzare solo %cl. Il sorgente può essere omesso, in quel caso $n=1$ . |

| shr | Shift Logical Right                        | shr[bwl] i/r r/m | Sia $n$ l'operando sorgente, esegue lo shift a destra del destinatario $n$ volte, impostando a 0 gli $n$ bit più significativi. In ciascuno shift, il bit meno significativo viene lasciato in CF. Come registro sorgente si può utilizzare solo %cl. Il sorgente può essere omesso, in quel caso $n=1$ .                                                              |
|-----|--------------------------------------------|------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| sar | Shift Arithmetic<br>Right sar[bwl] i/r r/m |                  | Sia $n$ l'operando sorgente e $s$ il valore del bit più significativo del destinatario, esegue lo shift a destra del destinatario $n$ volte, impostando a $s$ gli $n$ bit più significativi. In ciascuno shift, il bit meno significativo viene lasciato in CF. Come registro sorgente si può utilizzare solo %cl. Il sorgente può essere omesso, in quel caso $n=1$ . |
| rol | Rotate Left                                | rol[bwl] i/r r/m | Sia $n$ l'operando sorgente, esegue la rotazione a sinistra del destinatario $n$ volte. In ciascuna rotazione, il bit più significativo viene $sia$ lasciato in CF $sia$ ricopiato al posto del bit meno significativo. Come registro sorgente si può utilizzare solo %cl. Il sorgente può essere omesso, in quel caso $n=1$ .                                         |
| ror | Rotate Right ror[bwl] i/r r/m              |                  | Sia $n$ l'operando sorgente, esegue la rotazione a destra del destinatario $n$ volte. In ciascuna rotazione, il bit meno significativo viene $sia$ lasciato in CF $sia$ ricopiato al posto del bit più significativo. Come registro sorgente si può utilizzare solo %cl. Il sorgente può essere omesso, in quel caso $n=1$ .                                           |
| rcl | Rotate with Carry<br>Left rcl[bwl] i/r r/m |                  | Sia $n$ l'operando sorgente, esegue la rotazione con carry a sinistra del destinatario $n$ volte. In ciascuna rotazione, il bit più significativo viene lasciato in CF, mentre il valore di CF viene ricopiato al posto del bit meno significativo. Come registro sorgente si può utilizzare solo %cl. Il sorgente può essere omesso, in quel caso $n=1$ .             |
| rcr | Rotate with Carry<br>Right                 | rcr[bwl] i/r r/m | Sia $n$ l'operando sorgente, esegue la rotazione con carry a destra del destinatario $n$ volte. In ciascuna rotazione, il bit meno significativo viene lasciato in CF, mentre il valore di CF viene ricopiato al posto del bit più significativo. Come registro sorgente si può utilizzare solo %cl. Il sorgente può essere omesso, in quel caso $n=1$ .               |

## 11.5 Controllo di flusso

| Istruzione | Nome esteso           | Notazione | Comportamento                                                                                                                                                          |
|------------|-----------------------|-----------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| jmp        | Unconditional<br>Jump | jmp m/r   | Salta incondizionatamente all'indirizzo specificato.                                                                                                                   |
| call       | Call Procedure        | call m/r  | Chiamata a procedura all'indirizzo specificato. Salva l'indirizzo della prossima istruzione nello stack, così che il flusso corrente possa essere ripreso con una ret. |
| ret        | Return from Procedure | ret       | Ritorna ad un flusso di esecuzione precedente, rimuovendo dallo stack l'indirizzo precedentemente salvato da una call.                                                 |

La tabella seguente elenca i salti condizionati. I salti condizionati usano i flag per determinare se la condizione di salto è vera. Per un uso sempre coerente, assicurarsi che l'istruzione di salto segua immediatamente una cmp, o altre istruzioni che non hanno modificano i flag dopo la cmp. Dati gli operandi della cmp ed una condizione c, per esempio c = "maggiore o uguale", la condizione è vera se destinatario c sorgente. Nella tabella che segue, quando ci si riferisce ad un confronto fra sorgente e destinatario si intendono gli operandi della cmp precedente.

| Istruzione | Nome esteso              | Notazione              | Comportamento                                                      |
|------------|--------------------------|------------------------|--------------------------------------------------------------------|
| cmp        | Compare Two Operands     | cmp[bwl] r/m/i,<br>r/m | Confronta i due operandi e aggiorna i flag di conseguenza.         |
| je         | Jump if Equal            | je m                   | Salta se destinatario == sorgente.                                 |
| jne        | Jump if Not Equal        | jne m                  | Salta se destinatario != sorgente.                                 |
| ja         | Jump if Above            | ja m                   | Salta se, interpretandoli come naturali, destinatario > sorgente.  |
| jae        | Jump if Above or Equal   | jae m                  | Salta se, interpretandoli come naturali, destinatario >= sorgente. |
| jb         | Jump if Below            | jb m                   | Salta se, interpretandoli come naturali, destinatario < sorgente.  |
| jbe        | Jump if Below or Equal   | jbe m                  | Salta se, interpretandoli come naturali, destinatario <= sorgente. |
| jg         | Jump if Greater          | jg m                   | Salta se, interpretandoli come interi, destinatario > sorgente.    |
| jge        | Jump if Greater or Equal | jge m                  | Salta se, interpretandoli come interi, destinatario >= sorgente.   |
| jl         | Jump if Less             | jl m                   | Salta se, interpretandoli come interi, destinatario < sorgente.    |
| jle        | Jump if Less or Equal    | jle m                  | Salta se, interpretandoli come interi, destinatario <= sorgente.   |
| jz         | Jump if Zero             | jz m                   | Salta se ZF è 1.                                                   |
| jnz        | Jump if Not Zero         | jnz m                  | Salta se ZF è 0.                                                   |
| jc         | Jump if Carry            | jc m                   | Salta se CF è 1.                                                   |
| jnc        | Jump if Not Carry        | jnc m                  | Salta se CF è 0.                                                   |
| jo         | Jump if Overflow         | jo m                   | Salta se 0F è 1.                                                   |

| jno | Jump if Not Overflow | jno m | Salta se 0F è 0. |
|-----|----------------------|-------|------------------|
| js  | Jump if Sign         | js m  | Salta se SF è 1. |
| jns | Jump if Not Sign     | jns m | Salta se SF è 0. |

# 11.6 Operazioni condizionali

Per alcune operazioni tipiche, sono disponibili istruzioni specifiche il cui comportamento dipende dai flag e, quindi, dal risultato di una precedente cmp. Anche qui, quando ci si riferisce ad un confronto fra sorgente e destinatario si intendono gli operandi della cmp precedente.

La famiglia di istruzioni loop supporta i cicli condizionati più tipici. Rimangono d'interesse didattico come istruzioni specializzate ma, curiosamente, nei processori moderni sono generalmente meno performanti degli equivalenti che usino dec, cmp e salti condizionati.

| Istruzione | Nome esteso              | Notazione          | Comportamento                                                                       |  |
|------------|--------------------------|--------------------|-------------------------------------------------------------------------------------|--|
| loop       | Unconditional            | loop m             | Decrementa %ecx e salta se il risultato è (ancora) diverso da 0.                    |  |
|            | Loop                     | loop III           | ·                                                                                   |  |
| loope      | Loop if Equal            | loope m            | Decrementa %ecx e salta se entrambe le condizioni sono vere: 1) %ecx è (ancora) di- |  |
| юоре       | Loop ii Equai            | loope III          | verso da 0, 2) destinatario == sorgente.                                            |  |
| looppo     | Loop if Not Equal        | ual loopne m       | Decrementa %ecx e salta se entrambe le condizioni sono vere: 1) %ecx è (ancora) di- |  |
| loopne     | loopne Loop II Not Equal |                    | verso da 0, 2) destinatario != sorgente.                                            |  |
| loonz      | Loop if Zero             | on if 7ore loons m | Decrementa %ecx e salta se entrambe le condizioni sono vere: 1) %ecx è (ancora) di- |  |
| loopz      | Loop ii Zeio             | loopz m            | verso da 0, 2) ZF è 1.                                                              |  |
| loonnz     | Loop if Not Zoro         | loopnz m           | Decrementa %ecx e salta se entrambe le condizioni sono vere: 1) %ecx è (ancora) di- |  |
| loopnz     | Loop ii Not Zero         |                    | verso da 0, 2) ZF è 0.                                                              |  |

La famiglia di istruzioni set permette di salvare il valore di un confronto in un registro o locazione di memoria. Tale operando può essere solo da 1 byte.

| Istruzione | Nome esteso                | Notazione | Comportamento                                                                                       |
|------------|----------------------------|-----------|-----------------------------------------------------------------------------------------------------|
| sete       | Set if Equal               | sete r/m  | Imposta l'operando a 1 se destinatario == sorgente, a 0 altrimenti.                                 |
| setne      | Set if Not Equal           | setne r/m | Imposta l'operando a 1 se destinatario != sorgente, a 0 altrimenti.                                 |
| seta       | Set if Above               | seta r/m  | Imposta l'operando a 1 se, interpretandoli come naturali, destinatario > sorgente, a 0 altrimenti.  |
| setae      | Set if Above or Equal      | setae r/m | Imposta l'operando a 1 se, interpretandoli come naturali, destinatario >= sorgente, a 0 altrimenti. |
| setb       | Set if Below               | setb r/m  | Imposta l'operando a 1 se, interpretandoli come naturali, destinatario < sorgente, a 0 altrimenti.  |
| setbe      | Set if Below or Equal      | setbe r/m | Imposta l'operando a 1 se, interpretandoli come naturali, destinatario <= sorgente, a 0 altrimenti. |
| setg       | Set if Greater             | setg r/m  | Imposta l'operando a 1 se, interpretandoli come interi, destinatario > sorgente, a 0 altrimenti.    |
| setge      | Set if Greater or<br>Equal | setge r/m | Imposta l'operando a 1 se, interpretandoli come interi, destinatario >= sorgente, a 0 altrimenti.   |
| setl       | Set if Less                | setl r/m  | Imposta l'operando a 1 se, interpretandoli come interi, destinatario < sorgente, a 0 altrimenti.    |
| setle      | Set if Less or Equal       | setle r/m | Imposta l'operando a 1 se, interpretandoli come interi, destinatario <= sorgente, a 0 altrimenti.   |
| setz       | Set if Zero                | setz r/m  | Imposta l'operando a 1 se ZF è 1, a 0 altrimenti.                                                   |
| setnz      | Set if Not Zero            | setnz r/m | Imposta l'operando a 1 se ZF è 0, a 0 altrimenti.                                                   |
| setc       | Set if Carry               | setc r/m  | Imposta l'operando a 1 se CF è 1, a 0 altrimenti.                                                   |
| setnc      | Set if Not Carry           | setnc r/m | Imposta l'operando a 1 se CF è 0, a 0 altrimenti.                                                   |
| seto       | Set if Overflow            | seto r/m  | Imposta l'operando a 1 se 0F è 1, a 0 altrimenti.                                                   |
| setno      | Set if Not Overflow        | setno r/m | Imposta l'operando a 1 se 0F è 0, a 0 altrimenti.                                                   |
| sets       | Set if Sign                | sets r/m  | Imposta l'operando a 1 se SF è 1, a 0 altrimenti.                                                   |
| setns      | Set if Not Sign            | setns r/m | Imposta l'operando a 1 se SF è 0, a 0 altrimenti.                                                   |

La famiglia di istruzioni cmov permette di eseguire, solo se il confronto ha avuto successo, una mov da memoria a registro o da registro. Gli operandi possono essere solo a 2 o 4 byte, non 1.

| Istruzione | Nome esteso       | Notazione           | Comportamento                                                       |
|------------|-------------------|---------------------|---------------------------------------------------------------------|
| cmove      | Move if Equal     | cmove[wl] r/m r     | Esegue la mov se destinatario == sorgente, altrimenti non fa nulla. |
| cmovne     | Move if Not Equal | cmovne[wl]<br>r/m r | Esegue la mov se destinatario != sorgente, altrimenti non fa nulla. |

| cmova       | Move if Above           | cmova[wl] r/m r     | Esegue la mov se, interpretandoli come naturali, destinatario > sorgente, altrimenti non fa nulla. |  |
|-------------|-------------------------|---------------------|----------------------------------------------------------------------------------------------------|--|
|             | Move if Above or        | cmovao[wl] r/m      | Esegue la mov se, interpretandoli come naturali, destinatario >= sorgente, altri-                  |  |
| cmovae      |                         | cinovae[wi] i/iii   |                                                                                                    |  |
|             | Equal                   | r                   | menti non fa nulla.                                                                                |  |
| cmovb       | Move if Below           | cmovb[wl] r/m       | Esegue la mov se, interpretandoli come naturali, destinatario < sorgente, altri-                   |  |
| CITIOVE     |                         | r                   | menti non fa nulla.                                                                                |  |
| ana ay da a | Move if Below or        | cmovbe[wl]          | Esegue la mov se, interpretandoli come naturali, destinatario <= sorgente, altri-                  |  |
| cmovbe      | Equal                   | r/m r               | menti non fa nulla.                                                                                |  |
|             | <u> </u>                | F 13 /              | Esegue la mov se, interpretandoli come interi, destinatario > sorgente, altrimenti                 |  |
| cmovg       | Move if Greater         | cmovg[wl] r/m r     | non fa nulla.                                                                                      |  |
|             | Move if Greater or      | cmovge[wl] r/m      | Esegue la mov se, interpretandoli come interi, destinatario >= sorgente, altri-                    |  |
| cmovge      |                         | cinovge[wij i/iii   | menti non fa nulla.                                                                                |  |
|             | Equal                   | Г                   |                                                                                                    |  |
| cmovl       | Move if Less            | cmovl[wl] r/m r     | Esegue la mov se, interpretandoli come interi, destinatario < sorgente, altrimenti                 |  |
|             |                         |                     | non fa nulla.                                                                                      |  |
| cmovle      | Move if Less or Equal   | cmovle[wl] r/m      | Esegue la mov se, interpretandoli come interi, destinatario <= sorgente, altri-                    |  |
| CITIOVIC    | IVIOVE II LESS OF Equal | r                   | menti non fa nulla.                                                                                |  |
| cmovz       | Move if Zero            | cmovz[wl] r/m r     | Esegue la mov se ZF è 1, altrimenti non fa nulla.                                                  |  |
|             |                         | cmovnz[wl] r/m      | F 1 75 0 11 11 11 11 11 11 11 11 11 11 11 11 1                                                     |  |
| cmovnz      | Move if Not Zero        | r                   | Esegue la mov se ZF è 0, altrimenti non fa nulla.                                                  |  |
| cmovc       | Move if Carry           | cmovc[wl] r/m r     | Esegue la mov se CF è 1, altrimenti non fa nulla.                                                  |  |
|             | interest earry          | cmovnc[wl] r/m      | -                                                                                                  |  |
| cmovnc      | Move if Not Carry       | cilioviic[wij i/iii | Esegue la mov se CF è 0, altrimenti non fa nulla.                                                  |  |
|             |                         | [                   |                                                                                                    |  |
| cmovo       | Move if Overflow        | cmovo[wl] r/m       | Esegue la mov se OF è 1, altrimenti non fa nulla.                                                  |  |
|             |                         | r                   |                                                                                                    |  |
| cmovno      | Move if Not Over-       | cmovno[wl]          | Esegue la mov se OF è O, altrimenti non fa nulla.                                                  |  |
| CITIOVITO   | flow                    | r/m r               | Lisegue la lilo Vise of le o, alci inferiti riori la riulia.                                       |  |
| cmovs       | Move if Sign            | cmovs[wl] r/m r     | Esegue la mov se SF è 1, altrimenti non fa nulla.                                                  |  |
|             |                         | cmovns[wl] r/m      |                                                                                                    |  |
| cmovns      | Move if Not Sign        | r                   | Esegue la mov se SF è 0, altrimenti non fa nulla.                                                  |  |
|             |                         |                     |                                                                                                    |  |

# 11.7 Istruzioni stringa

Le istruzioni stringa sono ottimizzate per eseguire operazioni tipiche su vettori in memoria. Hanno esclusivamente operandi impliciti, che rende la specifica delle dimensioni *non* opzionale.

| Istruzione | Nome esteso        | Notazione   | Comportamento                                                                              |
|------------|--------------------|-------------|--------------------------------------------------------------------------------------------|
| cld        | Clear Direction    | cld         | Imposta DF a 0, implicando che le istruzioni stringa procederanno per indirizzi cre-       |
| Ciu        | Flag               | Ciu         | scenti.                                                                                    |
| std        | Set Direction Flag | std         | Imposta DF a 1, implicando che le istruzioni stringa procederanno per indirizzi decre-     |
|            | Set Direction Flag | Sta         | scenti.                                                                                    |
| lods       | Load String        | lods[bwl]   | Legge 1/2/4 byte all'indirizzo in %esi e lo scrive in %al / %ax / %eax. Se DF è 0,         |
| 1003       | Load String        | lous[bwi]   | incrementa %esi di 1/2/4, se è 1 lo decrementa.                                            |
| stos       | Store String       | stos[bwl]   | Legge il valore in %al / %ax / %eax e lo scrive nei 1/2/4 byte all'indirizzo in %edi. Se   |
| 3103       |                    |             | DF è 0, incrementa %edi di 1/2/4, se è 1 lo decrementa.                                    |
| movs       | Move String to     | movs[bwl]   | Legge 1/2/4 byte all'indirizzo in %esi e lo scrive nei 1/2/4 byte all'indirizzo in %edi.   |
| 111043     | String             | IIIOV3[DWI] | Se DF è 0, incrementa %edi di 1/2/4, se è 1 lo decrementa.                                 |
| cmns       | Compare Strings    | cmps[bwl]   | Confronta gli 1/2/4 byte all'indirizzo in %esi (sorgente) con quelli all'indirizzo in %edi |
| cmps       | Compare Strings    |             | (destinatario). Aggiorna i flag così come fa cmp.                                          |
| scas       | Scan String        | scas[bwl]   | Confronta %al / %ax / %eax (sorgente) con gli 1/2/4 byte all'indirizzo in %edi (de-        |
| SCaS       | Jean Junig         | วเลวโทพป    | stinatario). Aggiorna i flag così come fa cmp.                                             |

# **Repeat Instruction**

Le istruzioni stringa possono essere ripetute senza controllo di programma, usando il prefisso rep.

| Istruzione |                             |               | Comportamento                                                                   |
|------------|-----------------------------|---------------|---------------------------------------------------------------------------------|
| ren        | Unconditional Repeat In-    |               | Dato n il valore in %ecx, ripete l'operazione opcode n volte, decrementando     |
| rep        | struction                   |               | %ecx fino a O. Compatibile con lods, stos, movs.                                |
|            |                             |               | Dato n il valore in %ecx, decrementa %ecx e ripete l'operazione opcode          |
| repe       | Repeat Instruction if Equal | repe [opcode] | finché 1) %ecx è (ancora) diverso da 0, e 2) gli operandi di questa ripetizione |
|            |                             |               | erano uguali. Compatibile con cmps e scas.                                      |
|            | Repeat Instruction if Not   |               | Dato n il valore in %ecx, decrementa %ecx e ripete l'operazione opcode          |
| repne      | Equal                       | de]           | finche 1) %ecx e (ancora) diverso da 0, e 2) gli operandi di questa ripetizione |
|            | Lyuai                       | ucj           | erano disuguali. Compatibile con cmps e scas.                                   |

# 11.8 Altre istruzioni

| Istruzione | Nome esteso  | Notazione | Comportamento                                                                   |
|------------|--------------|-----------|---------------------------------------------------------------------------------|
| nop        | No Operation | nop       | Non cambia lo stato del processore in alcun modo, eccetto per il registro %eip. |

Le seguenti istruzioni sono di interesse didattico ma non per le esercitazioni, in quanto richiedono privilegi di esecuzione.

| Istruzione | Nome esteso Notazi        |           | Comportamento                                                                                               |
|------------|---------------------------|-----------|-------------------------------------------------------------------------------------------------------------|
| in         | Input from Port           | in r/i r  | Legge da una porta di input ad un registro.                                                                 |
| out        | Output to Port            | out r r/i | Scrive da un registro ad una porta di output.                                                               |
| ins        | Input String from<br>Port | ins[bwl]  | Legge $1/2/4$ byte dalla porta di input indicata in %dx e li scrive nei $1/2/4$ byte all'indirizzo in %edi. |
| outs       | Output String to<br>Port  | outs[bwl] | Legge 1/2/4 byte all'indirizzo indicato da %esi e li scrive alla porta di output indicata in %dx.           |
| hlt        | Halt                      | hlt       | Blocca ogni operazione del processore.                                                                      |

# 12. Sottoprogrammi di utility

Nell'architettura del processore, menzioniamo registri, istruzioni e locazioni di memoria. Quando scriviamo programmi, sfruttiamo però il concetto di *terminale*, un'interfaccia dove l'utente legge caratteri e ne scrive usando la tastiera. Come questo possa avvenire è argomento di altri corsi, dove verranno presentate le *interruzioni*, il *kernel*, e in generale cosa fa un *sistema operativo*.

In questo corso ci limitiamo a sfruttare queste funzionalità tramite del codice ad hoc contenuto in utility.s. Queste funzionalità sono fornite come sottoprogrammi, che hanno i loro specifici comportamenti da tenere a mente.

Per utilizzare questi sottoprogrammi, utilizziamo la direttiva

.include "./files/utility.s"

# 12.1 Terminologia

Con leggere caratteri da tastiera si intende che il programma resta in attesa che l'utente prema un tasto sulla tastiera, inviando la codifica di quel tasto al programma.

Con mostrare a terminale si intende che il programma stampa un carattere a video.

Con fare eco di un carattere si intende che il programma, subito dopo aver letto un carattere da tastiera, lo mostra anche a schermo. Questo è il comportamento interattivo a cui siamo più abituati, ma non è automatico.

Con *ignorare caratteri* si intende che il programma, dopo aver letto un carattere, controlli che questo sia del tipo atteso: se lo è ne fa eco o comunque risponde in modo interattivo, se non lo è ritorna in lettura di un altro carattere, mostrandosi all'utente come se avesse, appunto, ignorato il carattere precedente.

# 12.2 Caratteri speciali

Avanzamento linea ( line feed, LF): carattere \n, codifica 0x0A.

Ritorno carrello (carriage return, RF): carattere \r, codifica 0x0D.

Il significato di questi ha a che vedere con le macchine da scrivere, dove avanzare alla riga successiva e riportare il carrello a sinistra erano azioni ben distinte.

# 12.3 Sottoprogrammi

| Nome                                         | Comportamento                                                                             |
|----------------------------------------------|-------------------------------------------------------------------------------------------|
| inchar                                       | Legge da tastiera un carattere ASCII e ne scrive la codifica in %al. Non mostra           |
| Inchai                                       | a terminale il carattere letto.                                                           |
| outchar                                      | Legge la codifica di un carattere ASCII dal registro %al e lo mostra a terminale.         |
|                                              | Legge dalla tastiera 2/4/8 cifre esadecimali (0-9 e A-F), facendone eco e igno-           |
| inbyte/inword/inlong                         | rando altri caratteri. Salva quindi il byte/word/long corrispondente a tali cifre         |
|                                              | in %al / %ax / %eax.                                                                      |
| outbyte / outword / outlong                  | Legge il contenuto di %al / %ax / %eax e lo mostra a terminale sottoforma di              |
| outbyte / outword / outtoing                 | 2/4/8 cifre esadecimali.                                                                  |
|                                              | Legge dalla tastiera fino a 3/5/10 cifre decimali (0-9), o finché non è inserito          |
| <pre>indecimal_byte / indecimal_word /</pre> | un $\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \$                                                |
| indecimal_long                               | di un numero naturale, e salva quindi il byte/word/long corrispondente in %al             |
|                                              | / %ax / %eax.                                                                             |
| outdecimal_byte / outdecimal_word /          | Legge il contenuto di %al / %ax / %eax, lo interpreta come numero naturale e              |
| outdecimal_long                              | lo mostra a terminale sottoforma di cifre decimali.                                       |
| outmess                                      | Dato l'indirizzo $v$ in %ebx e il numero $n$ in %cx, mostra a terminale gli $n$ caratteri |
| Ou cilie 33                                  | ASCII memorizzati a partire da $v$ .                                                      |

| outline | Dato l'indirizzo $v$ in %ebx, mostra a terminale i caratteri ASCII memorizzati a partire da $v$ finché non incontra un $r$ o raggiunge il massimo di 80 caratteri.                                                                                                                 |
|---------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|         | Dato l'indirizzo $v$ in %ebx e il numero $n$ in %cx, legge da tastiera caratteri ASCII e li scrive a partire da $v$ finché non è inserito un \r o raggiunge il massimo di $n-2$ caratteri. Pone poi in fondo i caratteri \r\n. Supporta l'uso di backspace per correggere l'input. |
| newline | Porta l'output del terminale ad una nuova riga, mostrando i caratteri $\r\$                                                                                                                                                                                                        |

# 13. Debugger gdb

gdb è un debugger a linea di comando che ci permette di eseguire un programma passo passo, seguendo lo stato del processore e della memoria.

Il concetto fondamentale per un debugger è quello di *breakpoint*, ossia un punto del codice dove l'esecuzione dovrà fermarsi. I breakpoints ci permettono di eseguire rapidamente le parti del programma che non sono di interesse e fermarsi ad osservare solo le parti che ci interessano.

Quella che segue è comunque una presentazione sintetica e semplificata. Per altre opzioni e funzionalità del debugger, vedere la documentazione ufficiale o il comando help.

## 13.1 Controllo dell'esecuzione

Per istruzione corrente si intende *la prossima da eseguire*. Quando il debugger si ferma ad un'istruzione, si ferma *prima* di eseguirla.

| Nome completo | Nome scorciato- | Formato | Comportamento                                                                                                                                                                                                                                                              |  |
|---------------|-----------------|---------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|--|
| frame         | f               | f       | Mostra l'istruzione corrente.                                                                                                                                                                                                                                              |  |
| list          | I               | I       | Mostra il sorgente attorno all'istruzione corrente.                                                                                                                                                                                                                        |  |
| break         | b               | b label | Imposta un breakpoint alla prima istruzione dopo label.                                                                                                                                                                                                                    |  |
| continue      | С               | С       | Prosegue l'esecuzione del programma fino al prossimo breakpoint.                                                                                                                                                                                                           |  |
| step          | S               | S       | Esegue l'istruzione corrente, fermandosi immediatamente dopo. Se l'istruzione corrente è una call, l'esecuzione si fermerà alla prima istruzione del sottoprogramma chiamato.                                                                                              |  |
| next          | n               | n       | Esegue l'istruzione corrente, fermandosi all'istruzione successiva del sottoprogramma corrente. Se l'istruzione corrente è una call, l'esecuzione si fermerà dopo il ret di del sottoprogramma chiamato. Nota: aggiungere una nop dopo ogni call prima di una nuova label. |  |
| finish        | fin             | fin     | Continua l'esecuzione fino all'uscita dal sottoprogramma corrente ( ret ). L'esecuzione si fermerà alla prima istruzione dopo la call.                                                                                                                                     |  |
| run           | r               | r       | Avvia (o riavvia) l'esecuzione del programma. Chiede conferma.                                                                                                                                                                                                             |  |
| quit          | q               | q       | Esce dal debugger. Chiede conferma.                                                                                                                                                                                                                                        |  |

I seguenti comandi sono definiti ad-hoc nell'ambiente del corso, e non sono quindi tipici comandi di gdb.

| Nome completo | Nome scorciatoia | Formato | Comportamento                                                          |
|---------------|------------------|---------|------------------------------------------------------------------------|
| rrun          | rr               | rr      | Avvia (o riavvia) l'esecuzione del programma, senza chiedere conferma. |
| qquit         | qq               | qq      | Esce dal debugger, senza chiedere conferma.                            |

#### Problemi con next

Si possono talvolta incontrare problemi con il comportamento di next, che derivano da come questa è definita e implementata. Il comando next distingue i *frame* come le sequenze di istruzioni che vanno da una label alla successiva. Il suo comportamento è, in realtà, di continuare l'esecuzione finché non incontra di nuovo una nuova istruzione nello stesso *frame* di partenza.

Questa logica può essere facilmente rotta con del codice come il seguente, dove *non esiste* una istruzione di punto\_1 che viene incontrata dopo la call. Quel che ne consegue è che il comando next si comporta come continue.

Per ovviare a questo problema, è una buona abitudine quella di aggiungere una nop dopo ciascuna call. Tale nop, appartenendo allo stesso *frame* punto\_1, farà regolarmente sospendere l'esecuzione.

# 13.2 Ispezione dei registri

| Nome completo  | Nome scorcia-<br>toia | Formato | Comportamento                                                                                                                                                                                                                |
|----------------|-----------------------|---------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| info registers | ir                    | ir      | Mostra lo stato di (quasi) tutti i registri. Non mostra separatamente i sotto-registri, come %ax.                                                                                                                            |
| info registers | ir                    | i r reg | Mostra lo stato del registro $reg$ specificato. $reg$ va specificato in minuscolo senza caratteri preposti, per esempio i $r$ eax. Si possono specificare anche sotto-registri, come %ax, e più registri separati da spazio. |

gdb supporta viste alternative con il comando layout che mettono più informazioni a schermo. In particolare, layout regs mostra l'equivalente di i r e l, evidenziando gli elementi che cambiano ad ogni step di esecuzione.

# 13.3 Ispezione della memoria

| Nome pleto | com- | Nome<br>toia | scorcia- | Formato     | Comportamento                                                                                                                                                                                                                                                                             |
|------------|------|--------------|----------|-------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| х          |      | x            |          | x/ NFU addr | Mostra lo stato della memoria a partire dall'indirizzo <i>addr</i> , per le <i>N</i> locazioni di dimensione <i>U</i> e interpretate con il formato <i>F</i> . Comando con memoria, i valori di <i>N</i> , <i>F</i> e <i>U</i> possono essere omessi (insieme allo / ) se uguali a prima. |

Il comando x sta per examine memory, ma differenza degli altri non ha una versione estesa.

Il parametro N si specifica come un numero intero, il valore di default (all'avvio di gdb ) è 1.

Il parametro F può essere

- x per esadecimale
- d per decimale
- c per ASCII
- t per binario
- s per stringa delimitata da 0x00

Il valore di default (all'avvio di gdb ) è x.

Il parametro *U* può essere

- b per byte
- h per word (2 byte)
- w per long (4 byte)

Il valore di default (all'avvio di gdb ) è h.

L'argomento *addr* può essere espresso in diversi modi, sia usando label che registri o espressioni basate su aritmetica dei puntatori. Per esempio:

- letterale esadecimale: x 0x56559066
- label: x &label
- registro puntatore: x \$esi
- registro puntatore e registro indice: x (char\*)\$esi + \$ecx

Notare che nell'ultimo caso, dato che ci si basa su aritmetica dei puntatori, il tipo all'interno del cast determina la *scala*, ossia la dimensione di ciascuna delle \$ecx locazioni del vettore da saltare. Si può usare (char\*) per 1 byte, (short\*) per 2 byte, (int\*) per 4 byte.

Un alternativa a questo è lo scomporre, anche solo temporaneamente, le istruzioni con indirizzamento complesso. Per esempio, si può sostituire movb (%esi, %ecx), %al con lea (%esi, %ecx), %ebx seguita da movb (%ebx), %al, così che si possa eseguire semplicemente x \$ebx nel debugger.

# 13.4 Gestione dei breakpoints

Oltre a crearli, i breakpoint possono anche essere rimossi o (dis)abilitati. Questi comandi si basano sulla conoscenza dell' id di un breakpoint: questo viene stampato quando un breakpoint viene creato o raggiunto durante l'esecuzione,oppure si possono ristampare tutti usando info b.

| Nome completo       | Nome scorciatoia | Formato          | Comportamento                                                                   |
|---------------------|------------------|------------------|---------------------------------------------------------------------------------|
| info breakpoints    | info b           | info b [ id ]    | Stampa informazioni sul breakpoint <i>id</i> , o tutti se l'argomento è omesso. |
| disable breakpoints | dis              | dis [ id ]       | Disabilita il breakpoint id, o tutti se l'argomento è omesso.                   |
| enable breakpoints  | en               | en [ <i>id</i> ] | Abilita il breakpoint id, o tutti se l'argomento è omesso.                      |
| delete breakpoints  | d                | d [ id ]         | Rimuove il breakpoint id, o tutti se l'argomento è omesso.                      |

## **Conditional Breakpoints**

In alcuni casi, la complessità del programma, l'uso intensivo di sottoprogrammi o lunghi loop possono rendere molto lungo trovare il punto giusto dell'esecuzione. A questo scopo, è possibile definire dei breakpoint condizionali, per far sì che l'esecuzione si interrompa a tale breakpoint solo se la condiziona è verificata.

| Nome completo | Nome scorciatoia | Formato      | Comportamento                                                   |
|---------------|------------------|--------------|-----------------------------------------------------------------|
| condition     | cond             | cond id cond | Imposta la condizione <i>cond</i> per il breakpoint <i>id</i> . |

La sintassi per una condizione è in "stile C", come il comando x. Alcuni esempi di questa sintassi:

- cond 2 \$al==5 per far sì che l'esecuzione si fermi al breakpoint 2 solo se il registro al contiene il valore 5;
- cond 2 (short \*)\$edi==-5 per far sì che l'esecuzione si fermi al breakpoint 2 solo se il registro edi contiene l'indirizzo di una word di valore -5;
- cond 2 (int \*)&count!=0 per far sì che l'esecuzione si fermi al breakpoint 2 solo se la locazione di 4 byte a partire da count contiene un valore diverso da 0.

Fare attenzione alle conversioni automatiche di rappresentazione: quando si usa la rappresentazione decimale, gdb interpreta automaticamente i valori come interi. Una condizione come cond 2 \$al==128, per quanto accettata dal debugger, sarà sempre falsa perché la codifica 0x80 è interpretata in decimale come l'intero -128, mai come il naturale 128. È quindi una buona idea usare la notazione esadecimale in casi del genere, cioè quando il bit più significativo è 1.

Una feature disponibile in molti IDE è quello di creare dipendenze tra breakpoint, cioè abilitare un breakpoint solo se è stato prima colpito un altro. Questo però è fin troppo ostico da fare in gdb.

#### Watchpoints

I watchpoint sono come dei breapoint ma per dati (registri e memoria), non per il codice. Si creano indicando l'espressione del dato da controllare. Si gestiscono con gli stessi comandi per i breakpoint.

| Nome completo      | Nome scorciatoia                                                                 | Formato          | Comportamento                                                                      |  |  |
|--------------------|----------------------------------------------------------------------------------|------------------|------------------------------------------------------------------------------------|--|--|
| watchpoint         | watch                                                                            | watch expr       | Imposta un watchpoint per l'espressione expr.                                      |  |  |
| info watchpoints   | info wat info wat [id] Stampa informazioni sul watchpoint id, o tutti se l'argor |                  | Stampa informazioni sul watchpoint <i>id</i> , o tutti se l'argomento è omesso.    |  |  |
| disable breakpoin- | dis                                                                              | dis [ id ]       | Disabilita il breakpoint o watchpoint <i>id</i> , o tutti se l'argomento è omesso. |  |  |
| ts                 | uis                                                                              |                  | Disabilità il breakpoint o wateripoint ia, o tutti se rai gomento e omesso.        |  |  |
| enable breakpoin-  | en                                                                               | en [ <i>id</i> ] | Abilita il breakpoint o watchpoint <i>id</i> , o tutti se l'argomento è omesso.    |  |  |
| ts                 |                                                                                  |                  | Abilità il breakpoint o Wateripoint Ia, o tatti se raigomento e omesso.            |  |  |
| delete breakpoin-  | Ь                                                                                | d [ <i>id</i> ]  | Rimuove il breakpoint o watchpoint <i>id</i> , o tutti se l'argomento è omesso.    |  |  |
| ts                 |                                                                                  | a [ la ]         | Transacte in breakpoint o wateripoint ia, o tatti se raigomento e omesso.          |  |  |

Un watchpoint richiede la specifica di un registro o locazione nella stessa notazione "stile C" del comando x, e interrompe l'esecuzione quando tale valore cambia. Per esempio, watch \$eax crea un watchpoint che interrompe l'esecuzione ogni volta che eax cambia valore.

# 14. Tabella ASCII

Dalla tabella seguente sono esclusi caratteri non-stampabili che non sono di nostro interesse.

| Codifica binaria | Codifica decimale | Codifica esadecimale | Carattere                              |
|------------------|-------------------|----------------------|----------------------------------------|
| 0000 0000        | 00                | 0x00                 | \0                                     |
| 0000 1000        | 08                | 0x08                 | backspace                              |
| 0000 1001        | 09                | 0x09                 | \t, Horizontal Tabulation              |
| 0000 1010        | 10                | 0x0A                 | \n, Line Feed                          |
| 0000 1101        | 13                | 0x0D                 | \r, Carriage Return                    |
| 0010 0000        | 32                | 0x20                 | space                                  |
| 0010 0001        | 33                | 0x21                 |                                        |
| 0010 0010        | 34                | 0x22                 | ·                                      |
| 0010 0011        | 35                | 0x23                 | #                                      |
| 0010 0110        | 36                | 0x24                 | \$                                     |
| 0010 0100        | 37                | 0x25                 | *   *                                  |
| 0010 0101        | 38                | 0x26                 | \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\ |
| 0010 0110        | 39                | 0x20<br>0x27         | 1                                      |
| 0010 0111        |                   |                      |                                        |
|                  | 40                | 0x28                 |                                        |
| 0010 1001        | 41                | 0x29                 | )                                      |
| 0010 1010        | 42                | 0x2A                 | *                                      |
| 0010 1011        | 43                | 0x2B                 | +                                      |
| 0010 1100        | 44                | 0x2C                 | ,                                      |
| 0010 1101        | 45                | 0x2D                 | -                                      |
| 0010 1110        | 46                | 0x2E                 | •                                      |
| 0010 1111        | 47                | 0x2F                 | /                                      |
| 0011 0000        | 48                | 0x30                 | 0                                      |
| 0011 0001        | 49                | 0x31                 | 1                                      |
| 0011 0010        | 50                | 0x32                 | 2                                      |
| 0011 0011        | 51                | 0x33                 | 3                                      |
| 0011 0100        | 52                | 0x34                 | 4                                      |
| 0011 0101        | 53                | 0x35                 | 5                                      |
| 0011 0110        | 54                | 0x36                 | 6                                      |
| 0011 0111        | 55                | 0x37                 | 7                                      |
| 0011 1000        | 56                | 0x38                 | 8                                      |
| 0011 1001        | 57                | 0x39                 | 9                                      |
| 0011 1010        | 58                | 0x3A                 | :                                      |
| 0011 1011        | 59                | 0x3B                 | :                                      |
| 0011 1100        | 60                | 0x3C                 | <                                      |
| 0011 1101        | 61                | 0x3D                 | =                                      |
| 0011 1110        | 62                | 0x3E                 | >                                      |
| 0011 1111        | 63                | 0x3F                 | ?                                      |
| 0100 0000        | 64                | 0x40                 | <br> a                                 |
| 0100 0000        | 65                | 0x41                 | A                                      |
| 0100 0001        | 66                | 0x41<br>0x42         | B                                      |
| 0100 0010        | 67                | 0x42<br>0x43         |                                        |
|                  |                   |                      | C                                      |
| 0100 0100        | 68                | 0x44                 | D                                      |
| 0100 0101        | 69                | 0x45                 | E                                      |
| 0100 0110        | 70                | 0x46                 | F                                      |
| 0100 0111        | 71                | 0x47                 | G                                      |
| 0100 1000        | 72                | 0x48                 | H                                      |
| 0100 1001        | 73                | 0x49                 | I                                      |
| 0100 1010        | 74                | 0x4A                 | J                                      |
| 0100 1011        | 75                | 0x4B                 | K                                      |
| 0100 1100        | 76                | 0x4C                 | L                                      |
| 0100 1101        | 77                | 0x4D                 | M                                      |
| 0100 1110        | 78                | 0x4E                 | N                                      |
| 0100 1111        | 79                | 0x4F                 | 0                                      |
| 0101 0000        | 80                | 0x50                 | Р                                      |
|                  | <u> </u>          | 1                    |                                        |

| 0101 0001 | 81  | 0x51         | 0      |
|-----------|-----|--------------|--------|
| 0101 0001 | 82  | 0x51<br>0x52 | Q<br>R |
| 0101 0010 | 83  | 0x52<br>0x53 | S      |
| 0101 0111 |     | 0x54         |        |
|           | 84  |              | T      |
| 0101 0101 | 85  | 0x55         | U      |
| 0101 0110 | 86  | 0x56         | V      |
| 0101 0111 | 87  | 0x57         | W      |
| 0101 1000 | 88  | 0x58         | X      |
| 0101 1001 | 89  | 0x59         | Υ      |
| 0101 1010 | 90  | 0x5A         | Z      |
| 0101 1011 | 91  | 0x5B         |        |
| 0101 1100 | 92  | 0x5C         | \      |
| 0101 1101 | 93  | 0x5D         |        |
| 0101 1110 | 94  | 0x5E         | ۸      |
| 0101 1111 | 95  | 0x5F         | _      |
| 0110 0000 | 96  | 0x60         | `      |
| 0110 0001 | 97  | 0x61         | a      |
| 0110 0010 | 98  | 0x62         | b      |
| 0110 0011 | 99  | 0x63         | С      |
| 0110 0100 | 100 | 0x64         | d      |
| 0110 0101 | 101 | 0x65         | e      |
| 0110 0110 | 102 | 0x66         | f      |
| 0110 0111 | 103 | 0x67         | g      |
| 0110 1000 | 104 | 0x68         | h      |
| 0110 1001 | 105 | 0x69         | i      |
| 0110 1010 | 106 | 0x6A         | j      |
| 0110 1011 | 107 | 0x6B         | k      |
| 0110 1100 | 108 | 0x6C         | i.     |
| 0110 1101 | 109 | 0x6D         | m      |
| 0110 1110 | 110 | 0x6E         | n      |
| 0110 1111 | 111 | 0x6F         | 0      |
| 0110 1111 | 112 | 0x70         |        |
| 0111 0000 | 113 | 0x70<br>0x71 | p      |
| 0111 0001 | 114 | 0x71<br>0x72 | q      |
| 0111 0010 | 115 | 0x72<br>0x73 | r      |
| 0111 0111 |     | 0x74         | S      |
|           | 116 |              | t      |
| 0111 0101 | 117 | 0x75         | u      |
| 0111 0110 | 118 | 0x76         | V      |
| 0111 0111 | 119 | 0x77         | W      |
| 0111 1000 | 120 | 0x78         | X      |
| 0111 1001 | 121 | 0x79         | У      |
| 0111 1010 | 122 | 0x7A         | Z      |
| 0111 1011 | 123 | 0x7B         | 1      |
| 0111 1100 | 124 | 0x7C         |        |
| 0111 1101 | 125 | 0x7D         | }      |
| 0111 1110 | 126 | 0x7E         | ~      |

From https://en.wikipedia.org/wiki/ASCII

# 15. Ambiente d'esame e i suoi script

Qui di seguito sono documentati gli script dell'ambiente. I principali sono assemble.ps1 e debug.ps1, il cui uso è mostrato nelle esercitazioni. Gli script run-test.ps1 e run-tests.ps1 sono utili per automatizzare i test, il loro uso è del tutto opzionale.

# 15.1 Aprire l'ambiente

Sulle macchine all'esame (o sulla propria, se si seguono tutti i passi indicati nel pacchetto di installazione) troverete una cartella C:/reti\_logiche con contenuto come da figura.



Facendo doppio click sul file assembler-workspace.code-workspace verrà lanciato VS Code, collegandosi alla macchina virtuale WSL e la cartella di lavoro C:/reti\_logiche/assembler.
La finestra VS Code che si aprirà sarà simile alla seguente.



Nell'angolo in basso a sinistra, WSL: reti-logiche-assembler sta a indicare che l'editor è correttamente connesso alla macchina virtuale.

I file e cartelle mostrati nell'immagine sono quelli che ci si deve aspettare dall'ambiente vuoto.

In caso si trovino file in più all'esame, si possono cancellare.

Il file test-ambiente.s è un semplice programma per verificare che l'ambiente funzioni. Il contenuto è il seguente:

```
.include "./files/utility.s"
.data
messaggio: .ascii "Ok.\r"

.text
_main:
    nop
    lea messaggio, %ebx
    call outline
    ret
```

# 15.2 II terminale Powershell

Per aprire un terminale in VS Code possiamo usare Terminale -> Nuovo Terminale. Per eseguire gli script dell'ambiente c'è bisogno di aprire un terminale *Powershell*. La shell standard di Linux, bash, non è in grado di eseguire questi script.

Non così:

Ma così:



Per cambiare shell si può usare il bottone + sulla sinistra, o lanciare il comando pwsh senza argomenti.

Se si preferisce, in VS Code si può aprire un terminale anche come tab dell'editor, o spostandolo al lato anziché in basso.

## Perché Powershell?

Perché Powershell (2006) è object-oriented, e permette di scrivere script leggibili e manutenibili, in modo semplice. Bash (1989) è invece text-oriented, con una lunga lista di trappole da saper evitare.

# 15.3 Eseguire gli script

Gli script forniti permettono di assemblare, debuggare e testare il proprio programma. È importante che vengano eseguiti senza cambiare cartella, cioè non usando il comando cd o simili. Ricordarsi anche dei ./, necessari per indicare al terminale che i file indicati vanno cercati nella cartella corrente.

Il tasto tab 🔄 della tastiera invoca l'autocompletamento, che aiuta ad assicurarsi di inserire percorsi corretti.

Si ricorda inoltre di salvare il file sorgente prima di provare ad eseguire script.

## assemble.ps1

```
PS /mnt/c/reti_logiche/assembler> ./assemble.ps1 mio_programma.s
```

Questo script assembla un sorgente assembler in un file eseguibile. Lo script controlla prima che il file passato non sia un eseguibile, invece che un sorgente. Poi, il sorgente viene assemblato usando gcc ed includendo il sorgente ./files/main.c, che si occupa di alcune impostazioni del terminale.

# debug.ps1

```
PS /mnt/c/reti_logiche/assembler> ./debug.ps1 mio_programma
```

Questo script lancia il debugger per un programma. Lo script controlla prima che il file passato non sia un sorgente, invece che un eseguibile. Poi, il debugger gdb viene lanciato con il programma dato, includendo le definizioni e comandi iniziali in ./files/gdb\_startup. Questi si occupano di definire i comandi qquit e rrun (non chiedono conferma), creare un breakpoint in \_main e avviare il programma fino a tale breakpoint (così da saltare il codice di setup di ./files/main.c).

## run-single-test.ps1

```
PS /mnt/c/reti_logiche/assembler> ./run-single-test.ps1 mio_programma input.txt output.txt
```

Lancia un eseguibile usando il contenuto di un file come input, e opzionalmente ne stampa l'output su file. Lo script fa ridirezione di input/output, con alcuni controlli. Tutti i caratteri del file di input verranno visti dal programma come se digitati da tastiera, inclusi i caratteri di fine riga.

## run-multiple-tests.ps1

```
PS /mnt/c/reti_logiche/assembler> ./run-multiple-tests.ps1 mio_programma cartella_test
```

Testa un eseguibile su una serie di coppie input-output, verificando che l'output sia quello atteso. Stampa riassuntivamente e per ciascun test se è stato passato o meno.

Lo script prende ciascun file di input, con nome nella forma in\_\*.txt, ed esegue l'eseguibile con tale input. Ne salva poi l'output corrispondente nel file out\_\*.txt. Confronta poi out\_\*.txt e out\_ref\_\*.txt : il test è passato se i due file coincidono. Nel confronto, viene ignorata la differenza fra le sequenze di fine riga \r\n e \n.

# Parte III Appendice

# 16. Problemi comuni

Questa sezione include problemi che è frequente incontrare.

Come regola generale, in sede d'esame rispondiamo a tutte le domande relative a problemi di questo tipo e aiutatiamo a proseguire - perché sono relative all'ambiente d'esame e non ai concetti *oggetto* d'esame. Per altre domande, si può sempre contattare per email o Teams.

# 16.1 Setup dell'ambiente

## 1. Ho trovato un ambiente assembler per Mac su Github, ma ho problemi ad usarlo

Non abbiamo fatto noi quell'ambiente, non sappiamo come funziona e non offriamo supporto su come usarlo.

# 2. Ho trovato un ambiente basato su DOS, usato precedentemente all'esame, ma ho problemi ad usarlo

Ha probabilmente incontrato uno dei tanti motivi per cui l'ambiente basato su DOS è stato abbandonato. Questi problemi sono al più *aggirabili*, non *risolvibili*.

# 3. Lanciando il file assemble.code-workspace, mi appare un messaggio del tipo Unknown distro: Ubuntu

Il file assemble.code-workspace cerca di lanciare via WSL la distro chiamata Ubuntu, senza alcuna specifica di versione. Nel caso la vostra installazione sia diversa, andrà modificato il file. Da un terminale Windows, lanciare wsl --list -v, dovreste ottenere una stampa del tipo

```
PS C:\Users\raffa> wsl --list -v
NAME STATE VERSION

* Ubuntu Stopped 2
Ubuntu-22.04 Stopped 2
```

La parte importante è la colonna NAME dell'immagine che vogliamo usare per l'ambiente assembler. Modificare il file assemble.code-workspace con un editor di testo (notepad o VS Code stesso, stando attenti ad aprirlo come file di testo e non come workspace) sostituendo tutte le occorrenze di wsl+ubuntu con wsl+NOME-DELLA-DISTRO. Per esempio, se volessi utilizzare l'immagine Ubuntu-22.04, sostituirei con wsl+Ubuntu-22.04.

#### 4. Sto utilizzando una sistema Linux desktop, come uso l'ambiente senza virtualizzazione?

II file assemble.code-workspace fa tre cose

- Aprire VS Code nella macchina virtuale WSL
- Aprire la cartella C:/reti\_logiche/assembler in tale ambiente
- Impostare pwsh come terminale default

È possibile fare manualmente gli step 2 e 3, o modificare assemble.code-workspace per non fare lo step 1. Per seguire questa seconda opzione, eliminare la riga con "remoteAuthority":, e modificare il percorso dopo "uri": perché sia semplicemente un percorso sul proprio disco, per esempio "uri": "/home/raff/\_reti\_logiche/assembler".

# 16.2 Uso dell'ambiente

## 5. Se premo Run su VS Code non viene lanciato il programma

Non è così che si usa l'ambiente di questo corso. Si deve usare un terminale, assemblare con ./assemble.ps1 programma.s e lanciare con ./programma.

# 6. Provando a lanciare ./assemble.ps1 programma.s ricevo un errore del tipo ./assemble.ps1: line 1: syntax error near unexpected token

State usando la shell da terminale sbagliata, bash invece che pwsh. Aprire un terminale Powershell da VS Code o utilizzare il comando pwsh.

# 7. Provando ad assemblare ricevo un warning del tipo warning: creating DT\_TEXTREL in a PIE

Sostituire il file assemble.ps1 con quello contenuto nel pacchetto più recente tra i file del corso. Oppure modificare manualmente il file, alla riga 29, da

```
gcc -m32 -o ...
a
gcc -m32 -no-pie -o ...
```

Riprovare quindi a riassemblare. Se il warning non sparisce, scrivermi. Allegando il sorgente.

# 8. Provando ad assemblare ricevo un warning del tipo missing .note.GNU-stack section implies executable stack

Sostituire il file assemble.ps1 con quello contenuto nel pacchetto più recente tra i file del corso. Oppure modificare manualmente il file, alla riga 29, da

```
gcc -m32 -no-pie -o ...
a
gcc -m32 -no-pie -z execstack -o ...
```

Riprovare quindi a riassemblare. Se il warning non sparisce, scrivermi. Allegando il sorgente.

# 9. Ho modificato il codice per correggere un errore, ma quando assemblo e eseguo il codice, continuo a vedere lo stesso errore.

Controllare di aver salvato il file. In alto, nella barra delle tab, VS Code mostra un pallino pieno, al posto della X per chiedere la tab, per i file modificati e non salvati.

#### 10. Dove trovo i file che scrivo nell'ambiente assembler?

La cartella assembler mostrata in VS Code corrisponde alla cartella C:/reti\_logiche/assembler su Windows. Troveremo qui sia i file sorgenti (estensione .s ) che i binari assemblati.

#### Windows può nascondere le estensioni dei file

Nella configurazione default, Windows nasconde le estensioni dei file "noti". Suggerisco di cambiare questa configurazione per mostrare sempre l'estensione, come indicato qui.

**Book II** 

**Verilog** 

# Parte IV Esercitazioni

# 17. Esercitazione 1

Per capire bene cos'è il Verilog è bene partire dal capire per cosa si usa. È un *Hardware Description Language*, cioè un linguaggio formalizzato per la progettazione e realizzazione di componenti hardware: da reti combinatorie a CPU, architetture avanzate e componenti dedicati a scopi specifici.

Lo scopo non è quindi *solo* descrivere dell'hardware con del codice anziché disegni, ma in generale supportare con strumenti utili l'ingegnere in tutte le fasi di progettazione di sistemi elettronici digitali, a partire dalla semplice prototizione dell'interfaccia (dove poco importa la realizzazione interna, ma solo l'algoritmo implementato), passando per la simulazione in testbench software, alla realizzazione fisica su FPGA e test in hardware.

Tutti questi scopi hanno richieste diverse, e *semantiche* relative diverse. Per questo non dovrebbe stupire il fatto che Verilog include molte diverse funzionalità e sintassi che hanno senso solo in specifici contesti e non altri, che spazia dalle porte logiche elementari a strutture di programmazione stile-C e funzionalità di stampa a terminale.

Questo è spesso fonte di confusione, visto che il compilatore Verilog non aiuta a fare queste distinzioni, anzi, supporta intenzionalmente diversi modi di usare le stesse keyword, come reg che può essere utilizzata sia come variabile di un programma che come un registro in una rete sincronizzata. Come vedremo, è importante tenere presente *cosa* si sta facendo e *perché* per poter capire quale forma e sintassi ha senso usare e quale no.

Noi vedremo 3 usi diversi, in particolare:

- descrizione e sintesi di reti combinatorie
- descrizione e sintesi di reti sincronizzate
- verifica con testbench simulativa

#### Argomenti d'esame

Saper leggere o scrivere testbench *non* è parte degli argomenti d'esame. È tuttavia estremamente utile per esercitarsi provando con mano l'hardware descritto e capire come si comporta. Per ogni esercizio, così come in sede d'esame, viene *fornita* una testbench adatta.

# 17.1 Da schemi circuitali a codice

La bussola fondamentale per scrivere Verilog è tenere sempre presente l'hardware che si vuole realizzare. Partiamo dall'idea di hardware che abbiamo tramite schemi, come nell'esempio in figura.



Questo schema mostra una generica rete combinatoria RC con ingressi x e y, e uscite z e w. Questa rete logica sarà implementata poi con componenti elettronici. Sappiamo che questi, in quanto componenti fisici reali, non hanno un concetto di ordine tra di loro, o sincronizzazione, o attesa: gli ingressi x e y variano indipendentemente, possono avere cambiamenti anche contemparei e fluttuanti, e la rete RC risponde sempre a questi cambiamenti tramite le uscite z e w, anche durante i transitori dove gli ingressi variano da uno stato ad un altro. Questa può sembrare una ripetizione banale se si pensa ai segnali elettrici che si propagano in un circuito, ma è facile dimenticarsene quando si guarda al codice Verilog. Vediamo come questo schema si può tradurre in codice.

```
1 module RC(x, y, z, w);
2
```

```
input x, y;
output z, w;

assign #1 z = x | y;
assign #2 w = x & y;

endmodule
```

In Verilog si dichiarano moduli in modo simile alle classi in linguaggi di programmazione: un modulo è un tipo di componente che altri moduli potranno poi usare. La riga 1 inizia la dichiarazione del modulo, che è composta dal nome del modulo (RC) e dalla lista di porte di questo modulo, anch'esse con nome (x, y, z, w). Queste porte possono essere di input e/o output, a uno o a più bit. Specifichiamo questo alle righe 3 e 4. Mancando indicazioni di dimensione, saranno tutte da 1 bit. Alle righe 6 e 7 specifichiamo il comportamento dei fili di uscita z e w. Lo statement assign indica che l'elemento a sinistra assume continuamente il valore indicato dall'espressione a destra. Con #1 si indica un fattore di ritardo nell'aggiornamento, di 1 unità di tempo. Ogni rete combinatoria che non sia un semplice filo ha un certo tempo di attraversamento non trascurabile, ed è importante rappresentarlo con un elemento di ritardo.

Nel codice, vediamo che l'assign di z precede quello di w. Questo però non ha nulla a che vedere con le proprietà temporali che li legano: con queste linee di codice rappresentiamo componenti hardware distinti che si evolvono continuamente, indipendentemente e contemporaneamente. L'ordine degli statement di un module ha lo stesso valore dell'ordine con cui si disegnano le linee di uno schema circuitale: completamente irrilevante ai fini del risultato finale. Questo rimarrà vero quando vedremo reti più complesse, dove dimenticarsi di questo porta a errori gravi.

## 17.2 Concetto di testbench

Abbiamo progettato il nostro hardware, la rete RC di cui sopra. Vogliamo sapere però come si comporta, e in particolare se fa quello che ci aspettiamo dalle specifiche. Per far questo, ho bisogno di mettere RC in un contesto in cui ne manipolo gli ingressi in un modo noto, così da conoscere quali output aspettarsi, e con della logica apposita misuro le uscite e verifico che corrispondano a quelle attese. Tale ambiente è quello che chiamamo testbench. Nell'esempio in figura, una rete checker controlla le uscite e con l'uscita ok indica se il test è andato a buon fine o no.



Il corrispettivo nel mondo software è un programma di test che prova i metodi e strutture dati di una libreria. Anche noto come *unit test*.

Una opzione è progettare questa testbench come un ulteriore componente hardware, e seguire tutti i passaggi necessari a realizzare con hardware vero la testbench con dentro la rete sopra descritta, per esempio con FPGA. Questo è sicuramente corretto, ma molto costoso, quantomeno nel tempo necessario a fare la verifica. Una opzione più interessante è usare la simulazione: si compila un programma eseguibile che simula il comportamento dell'hardware, almeno fino ad un certo livello di dettaglio. Questo ci da un responso in modo molto più efficiente, visto che si può modificare, ricompilare e rieseguire in pochi secondi vedendo il risultato direttamente a terminale.

Si può fare un passo in più: anziché progettare la testbench come dell'altro hardware con semplice uscita

ok, si sfrutta appieno la natura software della simulazione per scrivere qualcosa che è più simile ad un programma di test, dove abbiamo effettivamente ordine e temporazzazione tra gli statement, insieme ad altri concetti che sarebbero privi di senso al di fuori della simulazione. Questo ci fornisce un modo per fare debugging su descrizioni di hardware.

```
module testbench();
1
        reg x_t, y_t; // "variabili"
2
3
        wire z_t, w_t;
4
        RC rc (
5
             .x(x_t), .y(y_t),
6
7
             .z(z_t), .w(w_t)
        );
8
9
        initial begin
10
             $dumpfile("waveform.vcd");
11
             $dumpvars;
12
13
             x_t = 0;
14
             y_t = 0;
15
             #10;
16
             if (z_t == 0 && w_t == 0)
17
                 $display("0 0 -> 0 0 success");
18
19
                 $display("0 0 -> 0 0 fail");
20
21
22
             x_t = 0;
             y_t = 1;
23
             #10;
24
25
             if (z_t == 0 && w_t == 1)
26
                 $display("0 1 -> 0 1 success");
27
                 $display("0 1 -> 0 1 fail");
28
29
30
             x_t = 1;
31
             y_t = 0;
32
             #10;
             if (z_t == 0 && w_t == 1)
33
                 $display("1 0 -> 0 1 success");
34
35
                 $display("1 0 -> 0 1 fail");
36
37
             x_t = 1;
38
             y_t = 1;
39
             #10;
40
             if (z_t == 1 && w_t == 1)
41
                 $display("1 1 -> 1 1 success");
42
             else
43
                 $display("1 1 -> 1 1 fail");
44
45
46
        end
47
    endmodule
```

Le righe da 2 a 8 sono molto vicine a quello che vediamo nel disegno. Dichiariamo dei reg che useremo per pilotare gli ingressi della rete combinatoria, e dei wire che useremo per monitorarne le uscite. Dichiariamo poi la nostra rete combinatoria: lo statement a righe 5-8 è nella forma tipo\_modulo nome\_istanza([lista porte]);. Possiamo immaginare questo statement come equivalente dell'atto fisico di prendere un chip di tipo RC, che chiameremo con un nome d'istanza rc per distinguerlo dagli altri, e posizionarlo nella nostra rete collegandone i vari piedini con altri elementi: l'ingresso x al reg x\_t, l'uscita z al wire z\_t, e così via.

La notazione mostrata a righe 6-7 è con parametri nominati ( named parameters ), dove si indicano esplicitamente gli assegnamenti tra parametro del componente e componente esterno. Si può sempre utilizzare l'alternativa più nota - perché unica scelta in molti linguaggi, come C - ossia la notazione con

parametri posizionali (positional parameters), dove l'associazione è data dalla corrispondenza con l'ordine di dichiarazione dei parametri.

#### Evitare parametri posizionali

La notazione con parametri posizionali può sembrare meno prolissa, ma è anche più pericolosa. In primo luogo, si basa sul fatto di ricordarsi esattamente l'ordine dei parametri, quando è invece facile distrarsi e scambiarli di posto. In secondo luogo, non permette di saltare una posizione, mentre vedremo esempi dove collegare qualcosa ad una o più uscite di una rete è del tutto opzionale. Queste limitazioni possono sembrare semplici da aggirare, ma il vero problema è che ad una semplice svista su un assegnamento di parametri posizionali corrisponde una lunga e faticosa fase di debug in cui tutto sembra comportarsi in modo completamente casuale.

Guardando le righe successive, ci sono diversi concetti che hanno un senso *in questo contesto* mentre altrove o hanno un senso *diverso* o sono del tutto privi di senso. Iniziamo dall'uso di reg come variabili, assegnando valori in serie come in un programma C. Nelle reti sincronizzate, vedremo che reg viene usato con significato e comportamento completamente diverso. Vediamo poi che usiamo un blocco initial begin ... end: questo contiene degli statement, eseguiti come un programma uno alla volta, separati talvolta da delle attese esplicite come #10 che attende 10 unità di tempo. Il termine initial significa che il programma è eseguito "all'inizio della simulazione": questo è un esempio di concetto completamente insensato per dell'hardware, dove non esiste un tempo O. Altri statement che hanno senso solo in una simulazione sono \$display, che stampa a terminale, e \$dumpfile e \$dumpvars, che producono invece un file waveform.vcd che possiamo studiare con GTKWave.

Leggendo il codice come un programma, vediamo che questa testbench altro non fa che testare tutti e 4 i possibili stati di x e y, confrontando le uscite z e w con i valori attesi.

## Unità di tempo

Le unità temporali (sia di default che di volta in volta) si possono specificare, ma noi per semplicità non lo facciamo. Come vedremo dalle waveform, di conseguenza ogni valore viene interpretato di default come *secondi*, cosa decisamente poco realistica, ma comunque di nessun impatto per i nostri usi.

Per eseguire il test useremo tre programmi: iverilog e vvp, dalla suite Icarus Verilog, e GTKWave. A differenza dell'ambiente per Assembler, questi sono facilmente reperibili per ogni piattaforma, o compilabili dal sorgente. Qui si trovano installer per Windows.

iverilog è il programma che compila la nostra simulazione. La sintassi è la seguente:

```
iverilog -o nome_simulazione testbench.v mia_rete.v [altri file .v]
```

I file per questo test sono scaricabili qui e qui. Il file prodotto da iverilog non è direttamente eseguibile, ma va eseguito usando vvp :

```
vvp nome_simulazione
```

Otteniamo un output come il seguente:

```
VCD info: dumpfile waveform.vcd opened for output.
0 0 -> 0 0 success
0 1 -> 0 1 fail
1 0 -> 0 1 fail
1 1 -> 1 1 success
```

La prima riga è relativa ai comandi \$dumpfile e \$dumpvars, ci informa semplicemente che la simulazione sta effettivamente salvando i dati su waveform.vcd. Le righe successive sono invece quelle stampate dai nostri \$display: vediamo che alcuni test sono falliti.

#### Stampe a fine simulazione

Alcune versioni di iverilog aggiungono di default una stampa del tipo "\$finish called at ..." al termine della simulazione, altre no.

#### Chi ha ragione?

Un test che fallisce indica soltanto che il codice di test e il codice testato sono in disaccordo. La maggior parte delle volte, se fatto bene, il test rappresenta la specifica desiderata, mentre ciò che è testato ne indica solo l'implementazione. Per questo, di solito, ha ragione il test e va cambiato ciò che è testato.

Cerchiamo di capire perché il test fallisce, e quindi in cosa la rete RC non segue la specifica. Le stampe ci indicano i valori attesi e il fatto che non corrispondono con quelli prodotti da RC, non quali valori sono stati trovati in z e w. Potremmo cambiare le stampe per includerlo, ma è facile intuire che questo approccio non scala bene: non possiamo stampare a schermo tutte le variabili in tutte le situazioni. È per questo che si usa la waveform. Lanciamo GTKWave con il comando

gtkwave waveform.vcd

Si dovrebbe aprire quindi una finestra dal quale possiamo analizzare l'evoluzione della rete, filo per filo, nel tempo. Espandiamo le reti nel menu a sinistra, selezioniamo la rete rc e quindi gli input x e y e gli output z e w, clicchiamo poi Append. Otteniamo una schermata come quella in figura.



La schermata mostra l'evoluzione nel tempo dei fili selezionati, in particolare nel momento selezionato (la linea verticale rossa).

## Significato delle waveform

GTKWave usa linee verdi con valore alto o basso per elementi da un singolo bit che hanno valore logico 0 o 1. In caso di elemento da più bit, utilizza linee verdi sopra e sotto il valore corrente dell'elemento (si può cambiare come sono interpretati i bit usando il menu contestuale).

Le aree di colore rosso indicano punti in cui il valore logico è non specificato, 'bx, tipicamente perché uno o più bit dell'elemento non sono unicamente determinabili. Una linea in mezzo di colore giallo vuol dire invece alta impedenza, 'bz, che non è un valore logico e vuol dire che, elettricamente, il filo non è connesso. Sia 'bx che 'bz hanno contesti ed usi utili in cui è normale che compaiano, ma molto spesso sono sintomo di un errore e un buon punto di partenza per il debug.

Vediamo dalla waveform i valori di w e z in corrispondenza dei test falliti: in entrambi i casi il test richiede z a 0 e lo trova a 1, w a 1 e lo trova a 0. Notiamo quindi che il test si aspetta che z si comporti come un AND e w come un OR, mentre vediamo che succede il contrario. Dobbiamo quindi scambiare gli assign delle due uscite.

module RC(x, y, z, w);

```
input x, y;
output z, w;
assign #1 z = x & y;
assign #2 w = x | y;
endmodule
```

#### Usare il reload in GTKWave

Una volta cambiato il codice, vorremmo ricompilare e rieseguire la simulazione. Ma il comando gtkwave waveform.vcd blocca il terminale finché non chiudiamo la finestra. Potremmo chiudere GTKWave e riavvarlo dopo, ma questo significa rifare daccapo tutto il setup per analizzare le waveform

È per questo una buona idea utilizzare una delle seguenti strategie:

- usare due terminali, uno dedicato a iverilog e vvp, l'altro a gtkwave
- lanciare il comando in background. Nell'ambiente Windows all'esame, questo si può fare con un 8 in fondo: gtkwave waveform.vcd 8

In entrambi i casi, otteniamo di poter rieseguire la simulazione mentre GTKWave è aperto. Possiamo quindi sfruttare il pulsante Reload, che caricherà le nuove waveform dall'ultima simulazione senza dover reimpostare l'interfaccia.

#### Se l'operatore & non funziona

In alcune installazioni di Powershell l'operatore & non funziona. L'operatore è un semplice alias per Start-Job, e si può ovviare al problema usando questo comando per esteso:

```
Start-Job { gtkwave waveform.vcd }
```

L'operatore è documentato qui.

# 17.3 Full adder, descrizione e sintesi di reti combinatorie

In generale, la differenza tra descrizione e sintesi è la seguente: una descrizione si limita a dire cosa una rete fa, senza scendere oltre nei dettagli implementativi; una sintesi mostra invece come si implementa questo comportamento. Una sintesi è un modo di realizzare una rete che si comporta come indicato dalla descrizione, e ci possono essere diversi modi (seguendo diversi modelli, algoritmi, criteri di costo) per sintetizzare una descrizione.

Per il caso delle reti combinatorie, vediamo l'esampio del *full adder*, partendo dal caso a 1 bit ( testbench, descrizione, sintesi ).

```
module full_adder(
1
2
        x, y, c_in,
3
        s, c_out
    );
5
        input x, y;
6
        input c_in;
        output s;
7
        output c_out;
8
9
        assign #5 \{c_{out}, s\} = x + y + c_{in};
10
    endmodule
11
```

#### Sintassi: raggruppamento

Le parentesi graffe, come in  $\{c_{out}, s\}$ , si può usare per raggruppare elementi sia a destra che a sinistra di un assegnamento. Bisogna stare però attenti alle dimensioni in bit, e cosa viene assegnato a cosa.

Questa è una descrizione del full adder: ci spiega cosa fa questo modulo, indicando le porte e la relazione tra ingressi e uscite, ma non ci dice nulla su come è implementata questa relazione. Infatti, la riga 10

utilizza l'operatore + del linguaggio Verilog, non ci spiega *come si fa* la somma. Quando si usano espressioni in questo modo, il compilatore Verilog non le traduce in hardware, ma ne calcola direttamente il risultato usando la nostra CPU a tempo di simulazione.

```
module full_adder(
1
2
        x, y, c_in,
3
        s, c_out
    );
4
5
        input x, y;
        input c_in;
6
7
        output s;
8
        output c_out;
9
        assign #5 s = x ^ y ^ c_in;
10
        assign #5 c_out = ( x & y ) | ( y & c_in) | ( x & c_in );
11
    endmodule
12
```

Questa invece è una sintesi : ci mostra come realizzare il sommatore usando operatori logici elementari. Un altro modo per definire sintesi è il fatto che siamo in grado, a partire dalla sintesi, di produrre lo schema circuitale corrispondente. Infatti, dal codice sopra possiamo ricavare il seguente schema.



Vediamo ora il caso di un full adder a 3 bit (testbench, descrizione, sintesi).

Per una descrizione, ci basta seguire l'esempio del caso a 1 bit, con l'aggiunta delle diverse dimensioni dei fili.

```
module full_adder_3(
1
2
        x, y, c_in,
3
        s, c_out
4
    );
        input [2:0] x, y;
5
        input c_in;
6
        output [2:0] s;
7
        output c_out;
8
9
        assign #5 \{c_{out}, s\} = x + y + c_{in};
10
    endmodule
11
```

## Sintassi: elementi di più bit

La dichiarazione con [2:0] indica che l'elemento è composto da 3 bit, indicizzati da 0 a 2. Questi indici possono poi essere utilizzati per selezionare uno più di componenti. Per esempio, con x[2:1] si selezionano i bit 2 e 1 di x, con x[1] solo il bit 1.

Come prima, questa è una descrizione perché non ci dice affatto come realizzare il sommatore, e non possiamo disegnare uno schema circuitale a partire da questo codice senza sapere già, da un'altra fonte,

come realizzare un full adder a 3 bit.

Passiamo invece alla sintesi. Sappiamo che il full adder è un esempio di rete componibile, nel senso che possiamo realizzare un full adder a N bit usando N full adder a 1 bit. Vediamo come partendo, questa volta, dallo schema circuitale.



Da questo schema, si evince che sappiamo realizzare un full adder a 3 bit se sappiamo già realizzare un full adder a 1 bit. Questa relazione si conserva anche nel codice Verilog: nella sintesi di una rete combinatoria si possono utilizzare altre reti combinatorie di cui, a loro volta, si conosce la sintesi.

```
module full_adder_3(
1
2
        x, y, c_in,
        s, c_out
3
4
    );
        input [2:0] x, y;
5
6
        input c_in;
7
        output [2:0] s;
8
        output c_out;
9
        wire c_in_1;
10
        full_adder fa_0 (
11
             .x(x[0]), .y(y[0]), .c_in(c_in),
12
             .s(s[0]), .c_out(c_in_1)
13
14
        );
15
        wire c_in_2;
16
        full_adder fa_1 (
17
             .x(x[1]), .y(y[1]), .c_in(c_in_1),
18
             .s(s[1]), .c_out(c_in_2)
19
        );
20
21
        full_adder fa_2 (
22
             .x(x[2]), .y(y[2]), .c_in(c_in_2),
23
             .s(s[2]), .c_out(c_out)
24
25
        );
26
    endmodule
```

In questo codice riutilizziamo la rete full\_adder che abbiamo sintetizzato prima. Notiamo come per farlo dobbiamo instanziare la rete tre volte, dandogli nomi diversi ( $fa_0$ ,  $fa_1$ ,  $fa_2$ ), e dichiarare dei nuovi wire per collegarli,  $c_{in_1}$  e  $c_{in_2}$ . Infine, utilizziamo indici per indicare le componenti di x e y da collegare a

ciascun full\_adder, così come quale componente di s è collegata a quale uscita.

Di nuovo, possiamo vedere la corrispondenza tra il codice Verilog e lo schema circuitale: questo non è un caso, anzi è <u>fondamentale</u>. Tolto il caso limite delle testbench simulative, ogni cosa che scriviamo in Verilog ha senso <u>solo</u> se ci è chiaro che tipo di hardware corrisponde a ciò che scriviamo e come si può realizzare.

Questo vale anche quando si fa una descrizione. Per esempio, abbiamo prima visto come si può descrivere un full adder scrivendo  $\{c_{\text{out}}, s\} = x + y + c_{\text{in}}$ . Questo ci permette di essere meno prolissi, a patto che si sa come si fa un sommatore. Vedremo più avanti, nelle reti sincronizzate, esempi di cose che sono semplici da scrivere in descrizione, affidandosi al simulatore per eseguirne la logica, ma che si rivelano poi molto difficili da sintetizzare.

# 18. Esercitazione 2

# 18.1 Errori comuni: i corto circuiti

Vediamo ora un esempio di come *non* tenere presente la corrispondenza tra Verilog e schemi circuitali porta a grossi guai.

La maggior parte di quello di cui discutiamo in questo corso si applica per *qualunque* tecnologia si utilizzi per implementarle. Infatti, una volta ottenuti gli operatori logici elementari, sono identici i passaggi necessari per arrivare a costruire un processore in grado di eseguire programmi. Per esempio, c'è chi ha realizzato un processore funzionante usando la redstone di Minecraft, così come ricerca sull'uso della luce, detta photonic computing.

Attualmente, usiamo elettronica digitale basata su semiconduttori (studiata nel corso di Elettronica Digitale). Questo implica che dobbiamo stare attenti ai limiti imposti dall'elettronica quando realizziamo reti logiche, in particolare il fatto che <u>non si possono collegare due o più fonti di tensione allo stesso filo.</u> Vediamo perché.

Una porta logica agisce fondamentalmente come un interruttore che collega la propria uscita a terra, 0V, o alla tensione di alimentazione Vcc, per esempio 5V. All'ingresso di una porta logica, invece, viene rilevata la tensione senza contatti elettrici con l'uscita.



Cosa succede invece se colleghiamo le uscite di due porte logiche, in particolare se una produce 1 e l'altra 0? Si chiude un circuito che collega Vcc a terra. Data la differenza di potenziale, scorre corrente. Data la bassissima resistenza di un semplice filo, scorre tanta corrente. Data la relazione tra la potenza dissipata in calore e la corrente che attraversa il circuito,  $P = R \cdot i^2$ , viene dissipato tanto calore. Il circuito prende fuoco.



Arriviamo quindi al perché questo è un grosso problema all'esame: in Verilog, questa regola si traduce in non si possono fare due o più assign allo stesso wire. Questo è un errore tanto grave quanto è facile da fare, soprattutto se non si tiene a mente la corrispondenza con schemi circuitali come discusso sopra. Per dar fuoco al proprio circuito basta infatti scrivere:

```
wire filo;
...
assign #1 filo = ...;
...
assign #1 filo = ...;
```

Una forma (purtroppo) comune di questo errore è quello in cui si tenta di usare un wire come variabile accumulatore.

```
wire [7:0] filo;
...
rete_combinatoria rc_1 (
    .ingresso1(...), .ingresso2(...),
    .uscita(filo)
)

rete_combinatoria rc_2 (
    .ingresso1(...), .ingresso2(...),
    .uscita(filo)
)
...
```

Ci sono qui due errori in tandem: si parte dall'idea che rc\_1 e rc\_2 lavorino in sequenza anziché in parallelo, come due righe distinte di un programma, e si arriva a collegare sia l'uscita di rc\_1 che rc\_2 allo stesso filo, creando il corto circuito.

Dall'uso del simulatore Verilog questo problema non è sempre evidente: se due valori assegnati sono gli

stessi, il simulatore "lascia fare" assegnando quel valore al filo, se invece i valori sono distinti il filo avrà valore logico indeterminato 1'bx.

## 18.2 Uso efficiente di VS Code

Uso efficiente di VS Code

Questa parte della lezione copre l'uso efficiente di VS codice. Il materiale relativo si trova qui.

# 18.3 Esercizi d'esame

Negli esercizi d'esame dove compare la sintesi di reti combinatorie, questa è *parte* di un esercizio più ampio: si chiede di realizzare una rete sincronizzata che interagisce con l'esterno per raccogliere input, svolgere un calcolo, e inviare un risultato. Viene chiesto di implementare tale calcolo con una rete combinatoria, da sintetizzare come modulo a parte utilizzato dalla rete sincronizzata.

Per esercitarsi, è possibile utilizzare tutti i testi d'esame in questa forma prendendo in considerazione solo la parte relativa alla rete combinatoria e ignorando, per ora il resto. Uno svantaggio è il fatto che le testbench fornite sono relative all'esercizio per intero, interfacciandosi solo con la rete sincronizzata, e si dovrà realizzare da sé una testbench apposita per testare la sola rete combinatoria.

#### Materiale in costruzione

Non è ancora pronta, ma prevista, una guida adeguata alle testbench preparate per gli esercizi d'esame e come riadattarle per altri usi, per esempio per testare solo la parte combinatoria.

Vediamo alcuni esercizi di reti combinatorie prese da testi d'esame.

# 18.4 Esercizio 2.1: parte combinatoria esame 2023-06-27

Qui il testo completo.

L'esercizio parla di una rete sincronizzata, che preleva due numeri naturali x e y, su 8 bit, e ha bisogno di calcolare z = max(x,y). Per ora, ci interessa soltanto la parte dove ci viene chiesto di sintetizzare la rete MAX che svolge questo calcolo.

Per testare tale rete, possiamo ricavarci una testbench come la seguente, scaricabile qui.

```
module testbench();
1
        reg [7:0] x, y;
2
        wire [7:0] z;
3
4
        MAX m (
5
             .x(x), .y(y), .max(z)
6
7
        );
8
9
        initial begin
10
             x = 10; y = 5;
             #10;
11
             if(z != 10)
12
                 $display("Test failed!");
13
14
             x = 5; y = 10;
15
             #10;
16
             if(z != 10)
17
                 $display("Test failed!");
18
19
             x = 10; y = 10;
20
21
             #10;
             if(z != 10)
22
                 $display("Test failed!");
23
24
```

```
x = 100; y = 50;
25
26
             #10;
             if(z != 100)
27
                 $display("Test failed!");
28
29
             x = 50; y = 100;
30
31
             if(z != 100)
32
                 $display("Test failed!");
33
        end
34
    endmodule
35
```

Una versione più completa, ottenuta dalla testbench originale dell'esercizio prendendo lo schema del blocco consumer e i casi di test della funzione get\_testcase, è scaricabile qui.

Notiamo che, come per le testbench d'esame, questa emette output solo in caso di errore. Questo significa che quando lanciamo la simulazione, se vediamo a terminale solo le righe riguardo il file VCD e la \$finish di fine simulaizone, possiamo dire che la testbench non ha trovato errori. Questo non vuol dire che non ci sono, ed è sempre indicato di verificare da sé il corretto comportamento per tutti gli aspetti. Vediamo ora il file reti\_standard.v, anche questo fornito con l'esercizio. Questo file contiene delle reti combinatorie che si assume note e sintetizzabili. Ciò vuol dire che possiamo liberamente usarle come componenti nelle nostre sintesi di reti combinatorie - assieme alle porte logiche elementari e eventuali altre reti sintetizzate da noi nello stesso esercizio.

#### Controllare sempre reti\_standard.v

Il contenuto di reti\_standard.v varia da esercizio ad esercizio. Questo sia in termini di reti fornite sia per la presenza o meno di parametri configurabili. Ciò è intenzionale, e la difficoltà di un esercizio è data anche da ciò che si è fornito come partenza.

In questo caso abbiamo a disposizione una sola rete combinatoria, il sommatore. Questo sommatore ha però un parametro, N. I parametri sono simili ai *generics* nei linguaggi di programmazione: un modo per scrivere un modulo configurabile che si adatta a più situazioni, che in questo caso vuol dire a un diverso numero di bit. Questo vuol dire che possiamo collocare nella nostra rete sommatori di qualunque numero di bit vogliamo, anzi *dobbiamo* trovare il numero giusto di bit da usare.

Prima di vedere la sintassi per usare queste reti parametriche, capiamo prima *come* lo vogliamo usare, ragionando sul problema con schemi circuitali. Una rete che determini il massimo tra due numeri dovrà necessariamente passare da una comparazione tra i due. Partiamo dall'idea di avere un comparatore il cui risultato fa da selettore per un multiplexer.



x < y equivale a x - y < 0. Dato che x e y sono numeri naturali, questo equivale a chiedersi se la loro sottrazione genera un prestito uscente. Posso quindi realizzare questo comparatore usando un sottrattore.



Arriviamo quindi a come fare il sottrattore: sappiamo dal modulo di aritmetica che si può fare a partire da un sommatore: basta negare il sottraendo e i riporti in ingresso e uscita.



Abbiamo quindi una rete sintetizzabile: usiamo solo dei not, un multiplexer e un sommatore a 8 bit, quest'ultimo sintetizzabile perché parte della libreria reti\_standard.v.

Possiamo ora scrivere l'equivalente in Verilog, specificando per il sommatore N=8. Questo parametro viene impostato all'instanziazione del sommatore, e deve essere una costante: determina infatti la quantità di hardware utilizzata, e non si può cambiare l'hardware a runtime.

```
module MAX(
1
2
        х, у,
3
        max
    );
4
        input [7:0] x, y;
5
        output [7:0] max;
6
7
        wire [7:0] y_neg;
8
        assign #1 y_neg = ~y;
9
10
        wire c_out;
11
        add \#(.N(8)) s (
12
             .x(x), .y(y_neg), .c_in(1'b1),
13
             .c_out(c_out)
14
        );
15
16
17
        wire b_out;
        assign #1 b_out = ~c_out;
18
19
        assign #1 max = b_out ? y : x;
20
    endmodule
21
```

#### Uso di wire vs. assegnamento diretto

Esiste una certa flessibilità, soprattutto quando le reti si fanno più complesse, attorno alla sintesi esplicita con ritardi di operazioni come la negazione ~ e l'incremento +1.

Per esempio, in questo esercizio abbiamo dichiarato separatamente i wire  $y_{neg}$  e  $b_{out}$ , con dei ritardi negli assign relativi. È lecito però anche evitare questi wire e scrivere più compattamente  $y(\sim y)$  a riga 13 e  $\sim c_{out}$ ? y: x a riga 20. Uno svantaggio di questo approccio è che, rimuovemendo dei punti di ritardo, può rendere più difficile il debugging via waveform.

# 18.5 Esercizio 2.2: parte combinatoria esame 2023-01-31

Qui il testo completo.

Anche in questo caso, l'esercizio parla di una rete sincronizzata, che per ora ignoreremo. Per la rete sincronizzata, avremo da calcolare un prodotto di numeri naturali, ma abbiamo a disposizione solo mul+add da 4 bit (non parametrizzati). Qui la testbench riadattata per la sola rete combinatoria.

Questo esercizio segue in realtà lo stesso schema dell'equivalente già visto in Assembler ( qui ), cambia solo la base, che passa da  $\beta_{asm}=2^8$  a  $\beta_{vrl}=2^4$ . Anche se matematicamente è lo stesso problema, cambia abbastanza come dovremmo solgerlo proprio perché stiamo descrivendo hardware e non programmando software.

#### Soluzione 1

Una buona strategia, soprattutto quando si ha tempo limitato, è partire da soluzioni semplici ma funzionali, e passare poi a migliorarle.

Seguendo lo schema già visto, dovremo calcolare quattro sottoprodotti tra due cifre. Ciascun sottoprodotto può essere calcolato indipendentemente e produce un risultato su 2 cifre (8 bit). Questi sottoprodotti venivano shiftati a sinistra di 0, 1 o 2 cifre.

In Assembler, dopo questo passaggio si era già pronti a fare la somma su 4 cifre: questo perché i registri del processore hanno numeri di bit fissi, e le istruzioni a disposizione operano su questi numeri di bit. In Verilog, dove descriviamo hardware, i numeri di bit sono decisi da noi, ed è normale avere valori su numeri di bit diversi che non possiamo passare ad un sommatore senza prima *estenderli*.

In altre parole, dobbiamo occuparci tanto degli zeri aggiunti a destra (per shift) quanto di quelli aggiunti a sinistra (per estensione) prima di poter sommare i sottoprodotti tra di loro. Una volta ottenuti i quattro sottoprodotti, tutti su 4 cifre, possiamo sommarli tra loro. Possiamo usare tre sommatori a 4 cifre (16 bit) per farlo. Otteniamo quindi lo schema seguente.



In Verilog, questo diventa quanto segue (scaricabile qui ).

```
// x naturale su 8 bit
1
   // y naturale su 8 bit
2
    // m = x * y, su 16 bit
3
   module MUL8(x, y, m);
4
        input [7:0] x;
5
        input [7:0] y;
6
        output [15:0] m;
7
8
        wire [3:0] xl, xh;
9
        assign \{xh, xl\} = x;
10
        wire [3:0] yl, yh;
11
        assign {yh, yl} = y;
12
13
        wire [7:0] m0;
14
        mul_add_nat ma0(
15
             .x(xl), .y(yl), .c(4'h0),
16
             .m(m0)
17
18
        wire [15:0] m0e = {8'h00, m0};
19
20
        wire [7:0] m1;
21
        mul_add_nat ma1(
22
             .x(x1), .y(yh), .c(4'h0),
23
             .m(m1)
24
25
        wire [15:0] m1e = {4'h0, m1, 4'h0};
26
27
        wire [7:0] m2;
28
29
        mul_add_nat ma2(
             .x(xh), .y(yl), .c(4'h0),
30
31
             .m(m2)
        );
32
```

```
wire [15:0] m2e = {4'h0, m2, 4'h0};
33
34
        wire [7:0] m3;
35
        mul_add_nat ma3(
36
             .x(xh), .y(yh), .c(4'h0),
37
38
             .m(m3)
39
        wire [15:0] m3e = \{m3, 8'h00\};
40
41
42
        wire [15:0] s0;
43
        add #( .N(16) ) a0 (
44
45
             .x(m0e), .y(m1e), .c_in(1'b0),
             .s(s0)
46
         );
47
48
        wire [15:0] s1;
49
        add #( .N(16) ) a1 (
50
             .x(m2e), .y(m3e), .c_in(1'b0),
51
             .s(s1)
52
         );
53
54
        add #( .N(16) ) a2 (
55
             .x(s0), .y(s1), .c_in(1'b0),
56
57
             .s(m)
         );
58
59
    endmodule
60
```

#### Si diceva dei corto circuiti...

Questo è un esempio del tipo di esercizi dove è comune vedere confusione: dovendo sommare quattro valori, usando tre sommatori, si può pensare di poter utilizzare un wire come una variabile accumulatore. Come spiegato, ciò non può funzionare in una rete combinatoria ed è un errore grave.

## Soluzione 2

Nella soluzione precedente si può notare una inefficienza: abbiamo a disposizione solo reti mul+add, che hanno anche un ingresso c e calcolano  $(x \cdot y) + c$ , ma stiamo ignorando questa possibilità impostando tutti gli c a 0.

Per ottimizzare, possiamo quindi cercare un modo di sfruttare questi ingressi per ridurre il numero di sommatori. Ritorniamo alla somma in colonna dei sottoprodotti.

```
0 0 [ m0 ] +
0 [ m1 ] 0 +
0 [ m2 ] 0 +
[ m3 ] 0 0 +
```

Se guardiamo a m0, notiamo che la sua parte bassa è destinata a finire nella somma finale senza alcuna modifica, e dunque i sommatori sono, per quella parte, completamente superflui. La stessa cosa accade per i bit più significativi, dove troviamo tanti zeri sommati tra di loro. Per vedere meglio come procedere, scomponiamo anche i sottoprodotti in parte alta e parte bassa, per esempio {m0h, m0l} = m0.

```
0
       0
           m0h
                 m0l
 0
      m1h
           m1l
                   0
 0
      m2h
           m2l
                   0
m3h
     m3l
             0
                   0
```

Ecco quindi le ottimizzazioni che si possono eseguire:

- mol non viene sommato ad alcunché, dunque m[3:0] = mol
- m0h può essere collegato all'input c di ma1 o ma2
- sia s0 la somma m1 + m2 + m0h, scomposto in {s0h, s0l} = s0, e c0 il suo eventuale riporto uscente. Allora m[7:4] = s0l, e s0h può essere collegato all'input c di ma3.

• sia s1 la somma m3 + s0h, scomposto in {s1h, s1l} = s1. Allora m[11:8] = s1l, mentre m[15:12] = s1h + c0.

Per realizzare questo ci serve, oltre ai moltiplicatori, un sommatore a 8 bit per s0, ed un incrementatore a 4 bit per s1h + c0. Lo schema che lo rappresenta è il seguente.



In Verilog, questo diventa quanto segue (scaricabile qui ).

```
// x naturale su 8 bit
1
   // y naturale su 8 bit
2
3
    // m = x * y, su 16 bit
   module MUL8(x, y, m);
4
5
        input [7:0] x;
        input [7:0] y;
6
        output [15:0] m;
7
8
        wire [3:0] xh, xl;
9
        assign \{xh, xl\} = x;
10
        wire [3:0] yh, yl;
11
        assign {yh, yl} = y;
12
13
        wire [7:0] m0;
14
        mul_add_nat ma0(
15
             .x(xl), .y(yl), .c(4'b0000),
16
17
             .m(m0)
        );
18
        wire [3:0] m0h, m0l;
19
20
        assign {m0h, m0l} = m0;
21
        wire [7:0] m1_m0h;
22
        mul_add_nat ma1(
23
             .x(x1), .y(yh), .c(m0h),
24
             .m(m1_m0h)
25
```

```
);
26
27
        wire [7:0] m2;
28
        mul_add_nat ma2(
29
             .x(xh), .y(yl), .c(4'b0000),
30
31
32
        wire [7:0] s0;
35
        wire c0;
        add #( .N(8) ) a0 (
36
            .x(m2), .y(m1_m0h), .c_in(1'b0),
37
             .s(s0), .c_out(c0)
38
        );
39
        wire [3:0] s0h, s0l;
40
        assign \{s0h, s0l\} = s0;
41
42
        wire [7:0] m3_s0h;
43
        mul_add_nat ma3(
44
             .x(xh), .y(yh), .c(s0h),
45
             .m(m3_s0h)
46
        );
47
        wire [3:0] s1h, s1l;
48
        assign {s1h, s1l} = m3_s0h;
49
50
51
        wire [3:0] s1h_c0;
52
        add \#(.N(4)) a1 (
53
             .x(s1h), .y(4'b0), .c_in(c0),
54
             .s(s1h_c0)
55
        );
56
        assign m = {s1h_c0, s1l, s0l, m0l};
57
58
    endmodule
```

## 19. Esercitazione 3

#### 19.1 Reti sincronizzate

Le reti sincronizzate sono reti logiche con uno stato interno, mantenuto usando registri, che si evolvono a instanti discreti dati da un segnale di clock. In questa esercitazione vedremo come realizzarle, simularle e studiarle nell'ambiente d'esame.

#### Testbench e generatore di clock

Per poter simulare una rete sincronizzata dobbiamo innanzitutto avere un generatore di clock. Il segnale di clock è segnale oscillante, che dal punto di vista logico appare come in figura.



#### Clock in realtà

In realtà i generatori di clock sono basati su cristalli di quarzo, un materiale *piezoelettrico* con il quale si possono realizzare circuiti oscillanti. Questi circuiti emettono una tensione oscillante come mostrato in figura (da Wikimedia), notare come l'onda sia molto meno squadrata di quanto presentato a livello logico.



Per i nostri usi, ci basterà descrivere una rete asincrona che cambia il proprio segnale da 0 a 1, e viceversa, ad intervalli regolari. Una qualunque descrizione realistica, e dunque *sintetizzabile*, dovrebbe avere a che fare con un segnale di reset che indichi a questa rete da che punto cominciare. Dato però che vogliamo usare questo generatore in una testbench simulativa, possiamo utilizzare direttamente i concetti relativi, approfittando della keyword initial per mantenere il codice *semplice*.

```
// generatore del segnale di clock
module clock_generator(
    clock
);
output clock;

parameter HALF_PERIOD = 5;
```

```
reg CLOCK;
assign clock = CLOCK;

initial CLOCK <= 0;
always #HALF_PERIOD CLOCK <= ~CLOCK;

endmodule</pre>
```

Notiamo che questa rete non è sintetizzabile. Infatti, utilizza la keyword initial, che è priva di senso in hardware, e un reg non come registro ma come variabile, come già visto nelle testbench. Questo si nota dal fatto che il reg non viene aggiornato in risposta ad un altro segnale, come il positive edge del clock, come invece accade per registri.

#### Periodo del clock

Il parametro HALF\_PERIOD rende il periodo di questo generatore di clock configurabile. Tipicamente all'esame viene utilizzato il valore default di 5, che implica periodi di clock di 10 unità di tempo. Qualora questo cambiasse (per esempio, per permettere reti combinatorie con maggior tempo di attraversamento) sarà segnalato nel testo.

Come ogni altra rete, questa viene inclusa nella testbench con una instanziazione.

```
module testbench();
    wire clock;
    clock_generator clk(
        .clock(clock)
    );
    ...
    mia_rete dut(
        ...
        .clock(clock)
    );
    ...
```

Oltre al segnale di clock, una rete sincronizzata avrà bisogno anche del segnale di reset. Questo viene aggiunto come un reg pilotato all'inizio del blocco initial della testbench.

Con la sintassi #(clk.HALF\_PERIOD); si attendono unità di tempo proporzionali al periodo di clock configurato. Questo è utile ad evitare di modificare manualmente tutte le attese in caso di cambio di clock.

#### Primo esempio di rete sincronizzata: il contatore

Vediamo ora un semplice esempio di rete sincronizzata, un contatore. Questa rete ha un registro di 3 bit inizializzato a 0, che viene incrementato ad ogni ciclo di clock, facendo infine wrap-around da 7 a 0. Il codice è scaricabile qui.

```
module contatore (
1
        out,
2
        clock, reset_
3
    );
4
        output [2:0] out;
5
        input clock, reset_;
6
7
        reg [2:0] OUT;
8
9
        assign out = OUT;
10
        always @(reset_ == 0) begin
11
             OUT <= 0;
12
13
        end
14
        always @(posedge clock) if (reset_ == 1) #3 begin
15
             OUT <= OUT + 1;
16
        end
17
    endmodule
18
```

Vediamo quindi come questo codice modella il comportamento di una vera rete sincronizzata. Il reg  $\tt OUT$  viene collegato direttamente all'uscita  $\tt out$ , viene inizializzato a  $\tt O$  solo in corrispondenza del segnale di reset (righe  $\tt 11-13$ ) e, durante la normale operazione, viene aggiornato con il valore  $\tt OUT + 1$  in corrispondenza di un posedge del clock. Il ritardo #3 modella il tempo  $T_{propagation}$  del registro.

#### Assegnamento con <=

È importante, nelle reti sincronizzate, utilizzare <= per assegnamenti a registri sul fronte positivo del clock. Questo perché gli statement con <= sono intesi come eseguiti in parallelo, non sequenzialmente. Infatti, i registri non sono variabili e i loro cambiamenti non sono visibili agli altri registri fino al successivo posedge del clock.

Possiamo vedere come si evolve questa rete, simulandola in una testbench con segnale di clock e reset\_ (scaricabile qui ). Per il resto, la testbench non fa altro che attendere diversi cicli di clock, visto che questa rete non ha alcun input e si evolve in autonomia.

Vediamo l'evoluzione della rete usando GTKWave.



Osserviamo, in particolare, il registro OUT e il segnale del clock. Notiamo che a ogni fronte positivo del clock, OUT non cambia immediatamente, ma solo dopo 3 unità di tempo.

Dalla teoria sui registri, ricordiamo anche che il nuovo valore assunto dal registro deve essergli dato in input da  $T_{setup}$  prima del posedge e fino a  $T_{hold}$  dopo il posedge. Questo però non si nota da questa waveform: non c'è nulla che rappresenta il valore in ingresso al registro prima del posedge. Torniamo al codice: alla riga 16 usiamo una espressione combinatoria a sinistra dell'assegnamento. Questa espressione viene calcolata dal simulatore Verilog al momento dell'assegnamento, cioè  $t_{posedge}+3$ , e non prima. Ciò significa che il simulatore non sta simulando né il risultato combinatorio in ingresso al registro, né il fatto che sia settato e mantenuto per i giusti tempi.

Possiamo ovviare al primo di questi problemi introducendo un wire, che ci rappresenti la rete combinatoria che calcola il successivo valore di OUT (scaricabile qui ).

```
module contatore (
1
2
        out.
3
        clock, reset_
4
    );
        output [2:0] out;
5
        input clock, reset_;
6
7
8
        reg [2:0] OUT;
        assign out = OUT;
9
10
        wire [2:0] next_out;
11
        assign #2 next_out = OUT + 1;
12
13
        always @(reset_ == 0) begin
14
             OUT <= 0;
15
16
17
18
        always @(posedge clock) if (reset_ == 1) #3 begin
19
             OUT <= next_out;
20
        end
21
    endmodule
```

Simulando questa nuova rete, otteniamo la seguente waveform.



Vediamo ora chiaramente che la rete combinatoria che produce next\_out risponde quasi immediatamente, ma il registro OUT non registrerà il suo valore fino al prossimo posdege del clock. Infatti, il periodo che separa due posedge è utilizzato proprio per far propagare i nuovi valori dei registri attraverso reti combinatorie, che andranno a produrre i nuovi ingressi dei registri che questi registreranno al prossimo posedge.

Questo modo di propagarsi dei valori tra un ciclo di clock è l'altro è fondamentale per capire come funzionano le reti sincronizzate ed essere quindi in grado di scrivere Verilog corrispondente alla macchina a stati che vogliamo realizzare. Allo stesso modo, riuscire a leggere questa evoluzione dalla waveform è

fondamentale per rendere queste utili al debugging.

#### Mantenere un segnale per N cicli di clock

Vediamo ora l'esempio di una rete sincronizzata con uscita out a 1 bit, che, ciclicamente, viene tenuta a 1 per N clock e messa a 0 per 1 clock. Il codice è scaricabile in due versioni, qui senza wire di debug e qui con, mentre la testbench è qui.

Per semplicità, discutiamo direttamente la versione che usa wire di debug per evidenziare gli ingressi dei registri.

```
module out n clock(
1
2
        out,
        clock, reset_
3
    );
4
5
        output out;
        input clock, reset_;
6
7
8
        reg OUT;
9
        assign out = OUT;
10
        localparam N = 3;
11
        reg [3:0] COUNT;
12
13
        reg STAR;
14
        localparam S0 = 0, S1 = 1;
15
16
        always @(reset_ == 0) begin
17
             COUNT <= N;
18
             OUT <= 0;
19
             STAR <= S0;
20
        end
21
22
        wire [3:0] next_count_s0;
23
        assign #2 next_count_s0 = COUNT - 1;
24
25
        wire next_star_s0;
26
        assign #2 next_star_s0 = (COUNT == 1) ? S1 : S0;
27
28
29
        always @(posedge clock) if (reset_ == 1) #3 begin
30
             casex (STAR)
31
                 S0: begin
32
                      COUNT <= next_count_s0;
                      OUT <= 1;
33
                      STAR <= next_star_s0;</pre>
34
                 end
35
36
37
                 S1: begin
                      COUNT <= N;
38
                      OUT <= 0;
39
                      STAR <= S0;
40
                 end
41
             endcase
42
        end
43
    endmodule
44
```

Questa rete inizializza COUNT a N e, in SO, lo decrementa continuamente. Anziché saltare da SO a S1 quando COUNT raggiunge O, lo facciamo invece quando raggiunge 1. Perché? Guardiamo la waveform per capirlo meglio.



A t=15 corrisponde il primo posedge del clock con <code>reset\_a 1</code>. Notiamo che a questo punto <code>OUT</code> è a <code>O per via dell'inizializzazione</code>, ma a t=18 questo passa a <code>1</code>, conseguenza della riga <code>33</code>. Per <code>COUNT</code>, invece, notiamo che è stato inizializzato a <code>3</code>, e subito dopo <code>next\_count\_s0</code> ha calcolato <code>2</code> come prossimo valore. A t=18, <code>COUNT</code> decrementa a <code>2</code>.

Passiamo ora al clock successivo, cioè t=25. COUNT vale 2, assume poco dopo valore 1, a t=28. Notiamo next\_star\_s0 a cavallo di questo cambiamento: subito dopo il passaggio di COUNT a 1, next\_star\_s0 diventa S1. Siamo però a t=30, non t=25: il check sul valore di COUNT non cambia fino a dopo il posedge del clock, e quindi STAR rimane S0 per un altro ciclo. Al ciclo dopo, a t=38, vediamo che lo stato passa dunque a S1, ma OUT resta 1: infatti solo al clock dopo il cambio di stato avrà effetto sui registri, compreso COUNT che viene reinizializzato. Guardando il filo OUT in tutto ciò, notiamo che è rimasto effettivamente a 1 per N = 3 cicli di clock, come da specifica.

Ci sono diversi fattori che possiamo cambiare, ottenendo risultati diversi. Se inizializziamo COUNT a N - 1, seguendo la stessa logica dovremmo contare fino a O. Se anticipiamo il cambio di OUT, usando OUT <= (COUNT == 1) ? 0 : 1, allora si perde il ciclo in più con OUT a 1 e dovremmo cambiare il conteggio di conseguenza. Anche per strutture apparentemente così semplici, è quindi possibile combinare tanti approcci diversi al punto tale che è difficile dedurre a colpo d'occhio la durata del segnale. È per questo importante sapere come si evolvono i vari registri, come si propagano i loro cambi di valori, come ricostruire (e leggere) una waveform.

#### Partire da N bassi

Nello ragionare su comportamenti di questo tipo, che sia a mente o su carta, è una buona idea partire da N bassi, come 1 o 2, e calcolare la durata del segnale in termini di N. Per esempio, in questo esercizio abbiamo visto che inizializzando COUNT a N otteniamo OUT a 1 per N cicli di clock. Questo varrà che N sia 3 o che sia 12, ma N = 3 è molto più rapido da verificare, e N = 2 lo è ancora di più.

#### Esercizio: Handshake e reti combinatorie

Vediamo un esempio di semplice esercizio che segue uno schema tipico all'esame. Il testo è scaricabile qui.

La testbench è più complessa di quanto visto finora, nella prossima sezione vedremo le principali caratteristiche utili per debugging. Per ora, vediamo come si realizza una rete che risponde a queste specifiche. Il testo ci chiede di eseguire un handshake dav  $\_/rfd$  con il produttore. Questo handshake prevede che, tramite il filo rfd ("ready for data") che va dal consumatore al produttore e il filo  $dav_\_$  ("data valid", attivo basso) che va dal produttore al consumatore, questi si coordinino per la corretta trasmissione del dato. Ricordiamo i passi di questo protocollo:

- A riposo: dav\_ = 1, rfd = 1.
- Comincia il produttore: dav\_ = 0. Questo segnala che il dato è valido.
- ACK del consumatore: rfd = 0. Questo segnala che il dato è stato letto.
- Reset del produttore: dav\_ = 1.
- Reset del consumatore: rfd = 1.

Un *protocollo*, in generale, descrive come due o più attori devono interagire tra loro. Quando implementiamo un attore di un protocollo, ci sono due punti importanti da ricordare perché questo funzioni:

- 1. vanno eseguiti tutti gli step che ci competono, quando il protocollo ci dice di farlo;
- 2. quando il protocollo dice che *qualcun'altro* deve segnalare qualcosa, dobbiamo *attendere* che questo accada.

In questo esercizio, implementiamo il consumatore, che deve prelevare un dato dal produttore. Rileggiamo quindi il protocollo di sopra dal punto di vista del consumatore, per capire cos'è che dobbiamo fare nella nostra rete.

- A riposo, e in particolare al reset iniziale: rfd = 1.
- Attendiamo che il produttore segnali dav\_ = 0.
- Leggiamo il dato.
- Comunichiamo l'avvenuta lettura con rfd = 0.
- Attendiamo che il produttore segnali dav\_ = 1.
- Segnaliamo il reset del protocollo con rfd = 1.

Dall'altra parte, una volta ottenuto il dato valido per a e b, svolgiamo il conto prescritto utilizzando una rete combinatoria e ne emettiamo il risultato tramite l'uscita p.

#### Ordine delle operazioni

Non c'è nessuna prescrizione rigida sull'ordine delle operazioni tra gli step del protocollo e l'immissione del dato in uscita. È valido sia completare l'handshake fino al suo reset e *poi* trasmettere il dato, sia trasmettere immediatamente il dato e poi chiudere l'handshake. La testbench dovrà tenere conto di ciò.

Nello svolgere il calcolo, dobbiamo implementare una semplice rete combinatoria. L'aspetto più interessante è come usarla: dobbiamo assicurarci di campionarne l'output solo quando gli input relativi sono validi

Da questi ragionamenti, deriviamo la seguente descrizione, scaricabile qui.

```
module ABC(
1
        a, b, p,
2
        dav_, rfd,
3
        clock, reset_
4
    );
5
        input [3:0] a, b;
6
        output [5:0] p;
7
8
        input dav_;
9
        output rfd;
10
11
        input clock, reset_;
12
13
        reg [5:0] P:
14
        assign p = P;
15
16
        reg RFD;
17
        assign rfd = RFD;
18
19
        reg [3:0] A, B;
20
21
        wire [5:0] out_rc;
22
        PERIMETRO_RC rc(
23
             .a(A), .b(B),
24
             .p(out_rc)
25
```

```
);
26
27
        reg [2:0] STAR;
28
29
        localparam
30
             SO = O,
31
             S1 = 1,
             S2 = 2,
32
33
             S3 = 3;
34
        always @(reset_ == 0) begin
35
36
             RFD <= 1;
             P <= 0;
37
             STAR <= S0;
38
        end
39
40
        always @(posedge clock) if (reset_ == 1) #3 begin
41
             casex (STAR)
42
                 S0: begin
43
                     A <= a;
44
                      B <= b;
45
                      STAR <= (dav_ == 0) ? S1 : S0;
46
                 end
47
48
                 S1: begin
49
                      P <= out_rc;
50
51
                      STAR <= S2;
                 end
52
53
54
                 S2: begin
55
                      RFD <= 0;
                      STAR <= (dav_ == 1) ? S3 : S2;
56
57
                 end
58
59
                 S3: begin
60
                      RFD <= 1;
61
                      STAR <= S0;
62
63
             endcase
        end
64
65
    endmodule
66
    module PERIMETRO_RC(
67
68
        a, b,
69
    );
70
        input [3:0] a, b;
71
        output [5:0] p;
72
73
        wire [4:0] somma;
74
        add #( .N(4) ) adder(
75
             .x(a), .y(b), .c_in(1'b0),
76
             .s(somma[3:0]), .c_out(somma[4])
77
        );
78
        assign p = { somma[3:0], 1'b0 };
79
80
    endmodule
```

#### Testbench con input e output per reti sincronizzate

Ci muoviamo ora verso reti sincronizzate più complesse, che prendono input da altre reti, svolgono conti, ed emettono output.

#### Blocchi in parallelo: fork ... join

Per scrivere testbench per reti combinatorie abbiamo sfruttato la loro inerente semplicità: dato un nuovo ingresso, una rete combinatoria emette l'output corrispondente dopo un certo tempo. Questo output non varierà nel tempo finché manteniamo l'input costante, anzi in ogni caso allo stesso input corrisponde lo stesso output. Questo ci permette di scrivere testbench semplici basate sulla struttura 1) assegno gli ingressi, 2) attendo un tempo sufficiente, 3) controllo le uscite.

Questo non è però fattibile con le reti sincronizzate: ad un singolo ingresso possono corrispondere diversi cambi di stato ed uscite diverse, e il tempo necessario al calcolo è difficilmente prevedibile. Inoltre, se la rete si coordina tramite handshake con altre reti, non si può determinare a priori in quale ordine eseguirà questi handshake. È necessario quindi adottare una struttura che permette a ciascun componente con cui la rete testata interagisce di comportarsi come un componente *indipendente* che non è bloccato dal proseguire degli altri - proprio come hardware vero.

Questo è possibile con il costrutto fork ... join. All'interno di un fork ... join possiamo definire diversi blocchi begin ... end il cui codice verrà eseguito indipendentemente e in parallelo. Possiamo quindi sfruttare questo per rappresentare diversi componenti.

```
fork
   begin : Producer_1
   ...
   end

begin : Producer_2
   ...
   end

begin : Consumer
   ...
   end

join
```

All'interno dei blocchi Producer scriveremo codice per fornire dati di input alla rete, all'interno dei blocchi Consumer scriveremo codice per ottenere i dati di output della rete e verificare che questi corrispondano a quanto atteso.

#### Timeout di simulazione

Un tipo di problema che possiamo incontrare nelle reti sincronizzate ma non nelle reti combinatorie è la situazione in cui un componente resta in attesa di un segnale che in realtà non verrà mai emesso. Per esempio, questo avviene se la rete da noi realizzata non rispetta il protocollo di handshake.

In questi casi, la simulazione può proseguire indefinitivamente.

È quindi necessario prevedere un meccanismo di timeout che interrompe la simulazione quando questa stia durando molto più di quanto è ragionevole aspettarsi. Possiamo realizzare questo utilizzando sempre fork ... join.

```
end

begin : Producer_2
...
end

begin : Consumer
...
end
join
end
join

finish;
```

Combinando disable f, che interrompe ogni esecuzione all'interno del fork ... join iniziale, e \$finish dopo di questo ci assicuriamo che quando il timeout è raggiunto la simulazione viene terminata. Questo ci lascerà una waveform che potremo analizzare per capire da dove sia scaturito il blocco.

#### Linee di errore

Le simulazioni di reti sincronizzate possono essere molto lunghe (in termini di tempo simulativo, non tempo reale) producendo di conseguenza waveform molto lunghe. Analizzare queste waveform in cerca di errori può essere molto tedioso. Per questo, le testbench d'esame includono solitamente delle *linee di errore*, che evidenziano a colpo d'occhio dov'è che sia avvenuto un problema.

Queste linee sono realizzate nella testbench con una variabile reg error inizializzata a 0 ed un blocco always che risponde ad ogni variazione di error per rimetterla a 0 dopo una breve attesa. Questa attesa breve ma non nulla fa sì che basti assegnare 1 ad error per ottenere un'impulso sulla linea, facilmente visibile.

```
module testbench();
...
initial begin
...
end

reg error;
   initial error = 0;
always @(posedge error) #1
   error = 0;
endmodule
```

Possiamo quindi scrivere un check dell'output come segue.

```
if(p != t_p) begin
    $display("Expected %d, received %d", t_p, p);
    error = 1;
end
```

In GTKWave, guarando alla linea error della testbench questi punti saranno facilmente identificabili nella waveform, come dall'esempio seguente.



# 20. Esercitazione 4

In questa esercitazione vedremo un esercizio d'esame svolto interamente, sia come descrizione che come sintesi. Il testo dell'esercizio è scaricabile qui.

#### 20.1 Esercizio 4.1: Descrizione

La rete sincronizzata ABC deve ottenere tre valori da altrettanti produttori, sostenendo tre handshake soc / eoc indipendenti. Tipicamente, questo vuol dire che siamo liberi di eseguire i tre handshake in qualunque ordine, per esempio in serie. In questo caso però, avendo una sola uscita soc, siamo costretti a far proseguire i tre handshake secondo gli stessi passi.

Se deriviamo il seguente algoritmo per ABC:

- A riposo: soc a 0, tutti gli eoc a 1, i dati sono validi
- Inizia ABC mettendo soc a 1
- Attende la risposta eoc a 0 da tutti i produttori
- Risponde con soc a 0
- Attende la conferma eoc a 1 da tutti i produttori
- A questo punto, i dati sono validi, e lo resteranno fino al prossimo ciclo

Alla fine di un tale handshake, possiamo svolgere il conto. Le specifiche fanno riferimento a trovare il minimo tra le *tensioni*  $v_1$ ,  $v_2$  e  $v_3$ , che sono, in generale, numeri reali, non rappresentabili in un numero finito di bit.

Tramite i convertitori da analogico a digitale si utilizza però una legge di corrispondenza che associa, con un certo errore, a ogni valore reale v un il valore x rappresentabile su un numero finito di bit. In questo caso, l'esercizio specifica che queste tensioni sono rappresentate in binario unipolare : questo significa che i vari x sono numeri naturali. Questa associazione preserva gli ordinamenti: a  $x_1 \leq x_2$  corrisponde  $v_1 \leq v_2$ . Possiamo quindi tradurre il problema di minimo tra tensioni v in un problema di minimo tra naturali v. Il risultato dovrà poi essere trasferito al consumatore usando un handshake v0 / rfd. Per far questo, deriviamo il seguente algoritmo per ABC :

- A riposo: dav\_ a 1, rfd a 1
- All'ottenimento di un nuovo dato da trasferire, si imposta l'uscita min a tale dato <u>e solo poi</u> si mette dav\_ a 0 per segnalarlo. L'uscita min non può oscillare o cambiare
- Si attende la risposta rfd a 0
- Si mette dav\_ a 1, ora l'uscita min è di nuovo libera di oscillare o cambiare
- Si aspetta la risposta con rfd a 1

Possiamo quindi scrivere la seguente descrizione in Verilog, scaricabile qui.

```
module ABC(
1
        x1, x2, x3,
2
        eoc1, eoc2, eoc3,
3
4
        min, dav_, rfd,
5
        clock, reset_
6
    );
7
        input [7:0] x1, x2, x3;
8
        input eoc1, eoc2, eoc3;
9
10
        output soc;
        output [7:0]min;
11
        output dav_;
12
        input rfd;
13
        input clock, reset_;
14
15
        reg SOC;
16
        assign soc = SOC;
17
```

```
reg [7:0] MIN;
18
        assign min = MIN;
19
        reg DAV_;
20
21
        assign dav_ = DAV_;
        reg [1:0] STAR;
23
24
        localparam
25
            S0 = 0,
            S1 = 1,
26
27
            S2 = 2,
            S3 = 3;
28
29
        wire [7:0] out_rc;
30
        MINIMO_3 min_rc(
31
             .a(x1), .b(x2), .c(x3),
32
             .min(out_rc)
33
        );
34
35
        always @(reset_ == 0) #1 begin
36
            SOC <= 0;
37
            DAV_ <= 1;
38
            STAR <= 0;
39
        end
40
41
        always @(posedge clock) if(reset_ == 1) #3 begin
42
            casex (STAR)
43
                 S0: begin
44
45
                     SOC <= 1;
                     STAR <= (\{eoc1, eoc2, eoc3\} == 3'b000) ? S1 : S0;
46
                 end
47
48
49
                 S1: begin
50
                     SOC <= 0;
51
                     MIN <= out_rc;
52
                     STAR <= ({eoc1, eoc2, eoc3} == 3'b111) ? S2 : S1;
53
                 end
54
55
                 S2: begin
                     DAV_ <= 0;
56
                     STAR <= (rfd == 1) ? S2 : S3;
57
58
                 end
59
                 S3: begin
60
                     DAV_ <= 1;
61
                     STAR <= (rfd == 0) ? S3 : S0;
62
                 end
63
64
65
            endcase
        end
66
67
    endmodule
68
69
    module MINIMO_3(
70
        a, b, c,
71
72
        min
    );
73
        input [7:0] a, b, c;
74
75
        output [7:0] min;
76
77
        assign #2 min = (a >= b)? ((b >= c)? c : b)
78
                                    : ((a >= c) ? c : a );
79
80
    endmodule
```

#### La descrizione della rete combinatoria è opzionale

Gli esercizi d'esame chiedono descrizione e sintesi per la rete sincronizzata, ma solo la sintesi per la rete combinatoria. È quindi del tutto opzionale mostrare una descrizione di quest'ultima. È spesso però utile scrivere prima una descrizione, soprattutto se facilmente interpretabile. Così facendo, in caso di errori nei test, sappiamo di dover debuggare *solo* la descrizione della rete sincronizzata.

#### 20.2 Esercizio 4.1: Sintesi della rete combinatoria

La rete da sintetizzare calcola il minimo di tre numeri naturali. Cominciamo osservando che il minimo di tre numeri è un problema che si può scomporre per associatività:  $\min(a,b,c) = \min(\min(a,b),c)$ . Questo vuol dire che posso costruire una reti combinatoria per il minimo di tre numeri combinando solo reti per il minimo di due numeri. Lo stesso principio si generalizza per il minimo di n numeri.

Nell'esercizio 2.1 abbiamo visto come costruire una rete combinatoria per il massimo tra due numeri, utilizzando un comparatore. Modificare tale rete per produrre il minimo anziché il massimo è semplice, basta cambiare il multiplexer in fondo. Dato che questo esercizio ci fornisce un sottrattore, possiamo usarlo direttamente anziché costruirlo come nell'esercizio 2.1

```
module MINIMO_2(
1
2
        a, b,
        min
3
    );
4
        input [7:0] a, b;
5
        output [7:0] min;
6
7
        wire b_out;
8
        diff #( .N(8) ) d(
9
             .x(a), .y(b), .b_{in}(1'b0),
10
             .b_out(b_out)
11
        );
12
13
        assign #1 min = b_out ? a : b;
14
15
```

Essendo questa una sintesi di MINIMO\_2, possiamo usare questo componente per la sintesi di MINIMO\_3.

```
module MINIMO 3(
1
        a, b, c,
2
3
        min
    );
4
        input [7:0] a, b, c;
5
        output [7:0] min;
6
7
        // \min_3(a, b, c) = \min_2(\min_2(a, b), c);
8
9
        wire [7:0] m_ab_out;
10
        MINIMO_2 m_ab(
11
             .a(a), .b(b),
12
             .min(m_ab_out)
13
        );
14
15
16
        MINIMO_2 m_abc(
17
             .a(m_ab_out), .b(c),
18
             .min(min)
         );
19
    endmodule
20
```

#### 20.3 Esercizio 4.1: Sintesi di rete sincronizzata

La descrizione di una rete sincronizzata è molto utile a capire come si evolve nel tempo: mette in evidenza lo stato interno (registro STAR), i suoi registri operativi, e come questi cambiano nel tempo in base sia al loro contenuto sia agli ingressi della rete.

Quest'uso del Verilog è affine a un diagramma di stato della stessa rete: è certamente più prolisso (per rendere il codice non ambiguo e simulabile) ma è comunque facile seguire l'evoluzione della rete usando una descrizione Verilog allo stesso modo in cui si fa lo stesso con un diagramma di stato.

Una sintesi, invece, si occupa di dirci come realizzare tale rete. In teoria, per le descrizioni che scriviamo servirebbero solitamente pochi accorgimenti perché siano direttamente realizzabili in hardware. In pratica, però, questo porterebbe a un uso particolarmente costoso e inefficiente di silicio. Seguiamo quindi un algoritmo euristico che ci porta ad hardware molto più efficiente, ragionevolmente vicino a qualcosa che ha senso realizzare.

#### Non esiste l'ottimo

I ragionamenti fatti in questo corso sull'ottimalità delle sintesi portano solo laddove ci può portare la matematica. Per andare oltre, bisogna entrare nei dettagli pratici, e affrontare trade-off tra processi di produzione, costi in termini di superfice, consumi energetici, esposizione a rischi di progettazione, etc. La progettazione di circuiti integrati è un tema di ingegneria a sé.

#### Corrispondenza tra sintesi e descrizione

Una sintesi <u>corrisponde</u> a una descrizione: mostra più in dettaglio come realizzare in hardware una rete che si comporta, esternamente, *allo stesso modo* della descrizione. Una sintesi che si comporti in modo diverso dalla descrizione non ha alcun senso.

Il modello di sintesi che ci aspettiamo negli esercizi d'esame è il modello con parte operativa e parte controllo, dove la parte controllo è implementata secondo il modello a microindirizzi.

Riassumendo, questo significa che:

- la rete è divisa in una parte operativa, che contiene solo i registri operativi e le relative reti combinatorie, e una parte controllo, che contiene il solo registro di stato STAR
- La parte operativa riceve *variabili di comando* dalla parte controllo, che determinano i comportamenti dei registri operativi
- La parte controllo riceve variabili di condizionamento dalla parte operativa, che determinano i salti a due vie della parte controllo

Vedremo come seguire l'algoritmo passo passo per ottenere questa sintesi a partire dalla descrizione scritta prima.

Da una parte, ciò che si valuta all'esame è solo quanto viene prodotto, mentre il processo seguito per scrivere codice è libera scelta dello studente. Dall'altra, visto che il tempo è necessariamente limitato, avere un processo efficiente permette di esprimere meglio le proprie competenze in tale tempo.

Per questo, vedremo un processo efficiente per fare la sintesi sfruttando l'editor VS Code. Questo sfrutta le scorciatoie dell'editor e l'editing multicaret. Inoltre, avremo vari *chekpoint*, indicati con  $\nearrow$ , dove il codice intermedio è compilabile e simulabile, permettendo di controllare di avere ancora lo stesso comportamento della descrizione.

#### Passo 0: ricopiare su un nuovo file

Ricopiamo il nostro file di descrizione, sia descrizione.v, su un nuovo file per la sintesi, sia sintesi.v. Nel resto delle istruzioni, assumeremo quindi la descrizione "congelata" e modificheremo il file sintesi.v.

#### Passo 1: rendere la descrizione omogenea

Questo processo sfrutta pattern nel codice per eseguire tutte le manipolazioni della descrizione in modo efficiente. Il primo è quindi regolarizzare la descrizione secondo tali pattern.

Per questo, puntiamo a un blocco always a(posedge clock) dove:

- Ogni stato contiene esplicitamente il comportamento di ciascun registro, anche se questo è conservare.
- L'assegnamento di ciascun registro è su una riga diversa.
- Le righe corrispondenti ai vari registri appaiono nello stesso ordine in tutti gli stati.
- Tutti gli stati e assegmenti seguono la stessa spaziatura: o tutti REG<= o tutti REG\_<=; o tutti SX: begind o tutti SX: degind o tutti SX: degin

Per il terzo punto, qualunque ordine va bene, purché sia coerente. Otteniamo quindi il seguente codice  $\nearrow$ .

```
always @(posedge clock) if(reset_ == 1) #3 begin
    casex (STAR)
        S0: begin
            SOC <= 1;
            DAV_ <= DAV_;
            MIN <= MIN;
            STAR <= ({eoc1, eoc2, eoc3} == 3'b000) ? S1 : S0;
        end
        S1: begin
            SOC <= 0;
            DAV_ <= DAV_;
            MIN <= out_rc;
            STAR \leftarrow (\{eoc1, eoc2, eoc3\} == 3'b111) ? S2 : S1;
        end
        S2: begin
            SOC <= SOC;
            DAV_ <= 0;
            MIN <= MIN;
            STAR <= (rfd == 1) ? S2 : S3;
        end
        S3: begin
            SOC <= SOC;
            DAV_ <= 1;
            MIN <= MIN;
            STAR <= (rfd == 0) ? S3 : S0;
        end
    endcase
end
```

#### Corrispondenza tra sintesi e descrizione

Se il comportamento di un registro in un dato stato è assente nella descrizione, questo è implicitamente conservazione, e così deve apparire nella sintesi.

Quando si vuole utilizzare un comportamento esplicito per ottimizzazioni, questo va fatto <u>a partire</u> dalla descrizione.

#### Passo 2: separazione dei blocchi operativi

Separiamo ora i blocchi operativi dei registri - incluso STAR. Per farlo, cominciamo con ricopiare il blocco always @(posedge clock) tante volte quanti sono i registri. Ciascuna di queste copie verrà poi modificata per lasciare solo gli assegnamenti di uno specifico registro, usando l'editing multicaret.

Vediamo per esempio come ottenere il blocco operativo del registro SOC. Selezioniamo la prima occorrenza di SOC <=, e premiamo ctrl + d tre volte per selezionare tutti gli statement di assegnamento a SOC <=. Queste sono ciascuna la prima riga del proprio stato, e vogliamo che diventino *l'unica* riga del proprio stato. Possiamo farlo cancellando le 4 righe sotto, usando i tasti home e end per muoversi tra righe di dimensioni diverse. Una volta rimasto un solo assegnemento, possiamo rimuovere anche i begin ... end.

Facciamo quindi lo stesso per tutti i registri, e separiamo anche gli statement di reset. Otteniamo quindi il seguente codice  $\nearrow$ .

```
always @(reset_ == 0) #1 SOC <= 0;</pre>
always @(posedge clock) if(reset_ == 1) #3 begin
    casex (STAR)
         S0: S0C <= 1;
         S1: SOC <= 0;
         S2: SOC <= SOC;
         S3: SOC <= SOC;
    endcase
end
always @(reset_ == 0) #1 DAV_ <= 1;</pre>
always @(posedge clock) if(reset_ == 1) #3 begin
    casex (STAR)
        S0: DAV_ <= DAV_;
S1: DAV_ <= DAV_;
S2: DAV_ <= 0;
S3: DAV_ <= 1;
    endcase
end
always @(posedge clock) if(reset == 1) #3 begin
    casex (STAR)
         S0: MIN <= MIN;
         S1: MIN <= out_rc;
         S2: MIN <= MIN;
         S3: MIN <= MIN;
    endcase
end
always @(reset_ == 0) #1 STAR <= 0;
always @(posedge clock) if(reset_ == 1) #3 begin
    casex (STAR)
         S0: STAR <= ({eoc1, eoc2, eoc3} == 3'b000) ? S1 : S0;
         S1: STAR <= ({eoc1, eoc2, eoc3} == 3'b111) ? S2 : S1;
         S2: STAR <= (rfd == 1) ? S2 : S3;
         S3: STAR <= (rfd == 0) ? S3 : S0;
    endcase
end
```

#### Passo 3: variabili di comando

In questo passo definiamo per ciascun registro il numero minimo di variabili di comando necessarie per pilotarne il comportamento. Questo numero dipende dal numero di compartomenti distinti di tale registro. Nel caso di SOC e DAV\_, abbiamo tre comportamenti: 1, 0 e conservazione. Nel caso di MIN ne abbiamo due: campionamento di out\_rc o conservazione.

A livello di codice, dovremmo:

- sostituire i casex basati su STAR con casex basati sulle variabili di comando
- aggiungere la definizione delle variabili di comando

Può essere utile fare questo per passaggi successivi, anche se non compilabili, per mantenere il riferimento con la descrizione e riconoscere eventuali errori.

Prendiamo il caso del registro SOC, questo si svolge in tre passi:

- Si aggiungono delle variabili di comando, senza cancellare gli stati
- Si aggiunge la definizione di queste variabili, con riferimento agli stati
- Si cancellano gli stati lasciati prima, ottenendo codice compilabile

Al passo 1, avremo

```
always @(reset_ == 0) #1 SOC <= 0;
always @(posedge clock) if(reset_ == 1) #3 begin
    casex ({b1, b0})
        2'b00 SO: SOC <= 1;
        2'b01 S1: SOC <= 0;</pre>
```

```
2'b1X S2: SOC <= SOC;
2'b1X S3: SOC <= SOC;
endcase
end
```

Al passo 2, scriviamo

```
wire b1, b0;
assign #1 {b1, b0} =
    (STAR == S0)? 2'b00 :
    (STAR == S1)? 2'b01 :
    (STAR == S2)? 2'b1X :
    (STAR == S3)? 2'b1X :
    /*default*/
```

Questa notazione a tabella torna molto utile più avanti, quando scriveremo la ROM.

Al passo 3, cancelliamo gli stati dal blocco @(posedge clock) per riottenere codice valido, ed eliminiamo i doppioni.

```
always @(reset_ == 0) #1 SOC <= 0;
always @(posedge clock) if(reset_ == 1) #3 begin
    casex ({b1, b0})
        2'b00: SOC <= 1;
        2'b01: SOC <= 0;
        2'b1X: SOC <= SOC;
    endcase
end</pre>
```

Otteniamo quindi il seguente codice  $\nearrow$ .

```
always @(reset_ == 0) #1 SOC <= 0;</pre>
always @(posedge clock) if(reset_ == 1) #3 begin
    casex ({b1, b0})
        2'b00: SOC <= 1;
        2'b01: SOC <= 0;
        2'b1X: SOC <= SOC;
    endcase
end
always @(reset_ == 0) #1 DAV_ <= 1;</pre>
always @(posedge clock) if(reset_ == 1) #3 begin
    casex ({b3, b2})
        2'b00: DAV_ <= DAV_;
2'b01: DAV_ <= 0;
        2'b1X: DAV_ <= 1;
    endcase
end
always @(posedge clock) if(reset_ == 1) #3 begin
    casex (b4)
        1'b0: MIN <= MIN;
        1'b1: MIN <= out_rc;
    endcase
end
wire b4, b3, b2, b1, b0;
assign #1 {b4, b3, b2, b1, b0} =
    (STAR == S0) ? 5'b000000 :
    (STAR == S1) ? 5'b10001 :
    (STAR == S2) ? 5'b0011X :
    (STAR == S3) ? 5'b01X1X :
                   5'bXXXXX ;
    /*default*/
```

#### Ottimizzare la codifica

La procedura mostrata definisce le variabili di comando e le rispettive codifiche *indipendentemente*. È talvolta possibile ridurre il numero complessivo di variabili di comando trovando codifiche che

permettano di usare la stessa variabile per più registri. Questa è una ottimizzazione solo se non si aggiunge alcuna variabile di comando a nessun registro.

#### Non usare la codifica dello stato

L'obiettivo delle variabili di comando è ottimizzare la dimensione dei multiplexer in input a ciascun registro: usare il registro STAR significa usare un multiplexer a tanti ingressi quanti sono gli stati, mentre un registro operativo ha tipicamente molti meno comportamenti distinti.

Usare direttamente la codifica dello stato è un errore grave, a meno che non si dimostri che sia proprio la codifica più efficiente. A tale scopo, usare commenti nel codice.

#### Passo 4: variabili di condizionamento

In questo passo definiamo il numero minimo di variabili necessarie per guidare i cambi di stato della parte controllo. Per far questo, dobbiamo guardare alle condizioni *indipendenti* dei salti a due vie.

```
always @(reset_ == 0) #1 STAR <= 0;
always @(posedge clock) if(reset_ == 1) #3 begin
    casex (STAR)
        S0: STAR <= ({eoc1, eoc2, eoc3} == 3'b000) ? S1 : S0;
        S1: STAR <= ({eoc1, eoc2, eoc3} == 3'b111) ? S2 : S1;
        S2: STAR <= (rfd == 1) ? S2 : S3;
        S3: STAR <= (rfd == 0) ? S3 : S0;
    endcase
end</pre>
```

In questo caso notiamo che le condizioni di S2 e S3 sono una la negazione dell'altra: non sono indipendenti. Possiamo guidare entrambi i salti con una sola variabile di condizionamento, se invertiamo uno dei due salti. In questo caso, scegliamo di invertire il salto in S3.

Otteniamo quindi il seguente codice  $\nearrow$ .

Le variabili di condizionamento vanno sintetizzate a livello di bit, sostituendo ai confronti con == le corrispondenti espressioni con porte logiche. In questo caso, otteniamo  $\nearrow$ 

```
assign #1 c0 = ~eoc1 & ~eoc2 & ~eoc3;
assign #1 c1 = eoc1 & eoc2 & eoc3;
assign #1 c2 = rfd;
```

#### Quando invertire i salti

Viene considerata valida anche una sintesi che usi il numero minimo di variabili di condizionamento ma senza invertire i salti nel Verilog. Per esempio, si può scrivere S3: STAR <= ~c2 ? S3 : S0;. Tuttavia non si ha questa libertà nella ROM, dove l'inversione è obbligatoria. Dato che la ROM si fa di solito in fondo è facile dimenticarsene, ed è quindi consigliato di invertire già nel Verilog della parte controllo.

#### Sintesi a livello di bit

La richiesta di sintesi delle variabili di condizionamento è flessibile per esercizi dove si hanno molti

bit (per esempio, un registro COUNT a 16 bit ). Nel dubbio, si può chiedere durante l'esame.

#### Passo 5: separare le parti

Fin a questo punto abbiamo modificato il codice della rete senza separare effettivamente la parte operativa dalla parte controllo. Questo è utile per mantenere la rete simulabile e controllare di non aver introdotto nuovi errori rispetto alla descrizione.

Arrivati a questo punto possiamo separare le parti. Nella parte operativa andranno i registri operativi, le reti combinatorie che ne pilotano gli ingressi, e le reti combinatorie che generano le variabili di condizionamento. A questa parte vengono inoltre collegati gli ingressi e le uscite della rete complessiva. Nella parte controllo, invece, ci sarà solo il registro STAR e la ROM a microindirizzi, di cui scriviamo in Verilog, in particolare, la parte che genera le variabili di controllo.

Otteniamo quindi il seguente codice ?.

```
module ABC(
1
2
        x1, x2, x3,
3
        eoc1, eoc2, eoc3,
4
        soc,
        min, dav_, rfd,
5
6
        clock, reset_
    );
7
        input [7:0] x1, x2, x3;
8
        input eoc1, eoc2, eoc3;
9
        output soc;
10
        output [7:0] min;
11
        output dav_;
12
        input rfd;
13
        input clock, reset_;
14
15
        wire b4, b3, b2, b1, b0;
16
17
        wire c2, c1, c0;
18
        ABC_PO po(
19
20
             x1, x2, x3,
             eoc1, eoc2, eoc3,
21
22
             soc,
23
             min, dav_, rfd,
             b4, b3, b2, b1, b0,
24
             c2, c1, c0
25
             clock, reset_,
26
        );
27
28
        ABC_PC pc(
29
             b4, b3, b2, b1, b0,
30
             c2, c1, c0
31
32
             clock, reset_,
33
        );
34
    endmodule
35
    module ABC_PO(
36
37
        x1, x2, x3,
38
        eoc1, eoc2, eoc3,
39
        soc,
        min, dav_, rfd,
40
        b4, b3, b2, b1, b0,
41
        c2, c1, c0
42
        clock, reset_,
43
    );
44
45
        input [7:0] x1, x2, x3;
46
        input eoc1, eoc2, eoc3;
47
        output soc;
        output [7:0] min;
48
49
        output dav_;
        input rfd;
50
```

```
input clock, reset_;
51
52
         reg SOC;
53
54
         assign soc = SOC;
55
         reg [7:0] MIN;
         assign min = MIN;
56
57
         reg DAV_;
 58
         assign dav_ = DAV_;
59
         wire [7:0] out_rc;
60
61
         MINIMO_3 min_rc(
62
              .a(x1), .b(x2), .c(x3),
63
              .min(out_rc)
         );
64
65
         input b4, b3, b2, b1, b0;
66
67
         output c2, c1, c0;
68
         assign #1 c0 = ~eoc1 & ~eoc2 & ~eoc3;
69
         assign #1 c1 = eoc1 & eoc2 & eoc3;
70
         assign #1 c2 = rfd;
71
72
         always @(reset_ == 0) #1 SOC <= 0;</pre>
73
         always @(posedge clock) if(reset_ == 1) #3 begin
74
              casex ({b1, b0})
75
                  2'b00: SOC <= 1;
76
                  2'b01: SOC <= 0;
77
                  2'b1X: SOC <= SOC;
78
79
              endcase
         end
80
81
82
         always @(reset_ == 0) #1 DAV_ <= 1;</pre>
83
         always @(posedge clock) if(reset_ == 1) #3 begin
84
              casex ({b3, b2})
                  2'b00: DAV_ <= DAV_;
2'b01: DAV_ <= 0;
85
86
87
                  2'b1X: DAV_ <= 1;
88
              endcase
         end
89
90
         always @(posedge clock) if(reset_ == 1) #3 begin
91
92
              casex (b4)
                  1'b0: MIN <= MIN;
93
94
                  1'b1: MIN <= out_rc;
95
              endcase
         end
96
     endmodule
97
98
     module ABC_PC(
99
         b4, b3, b2, b1, b0,
100
         c2, c1, c0
101
         clock, reset_,
102
     );
103
         input clock, reset_;
104
105
         output b4, b3, b2, b1, b0;
106
         input c2, c1, c0;
107
108
         reg [1:0] STAR;
109
         localparam
110
              SO = O,
111
              S1 = 1,
112
              S2 = 2,
113
              S3 = 3;
114
115
         assign #1 \{b4, b3, b2, b1, b0\} =
```

```
(STAR == S0) ? 5'b00000 :
117
              (STAR == S1) ? 5'b10001 :
118
              (STAR == S2) ? 5'b0011X :
119
              (STAR == S3) ? 5'b01X1X :
120
             /*default*/
                              5'bXXXXX ;
121
122
         always @(reset_ == 0) #1 STAR <= 0;</pre>
123
         always @(posedge clock) if(reset_ == 1) #3 begin
124
             casex (STAR)
125
                  S0: STAR <= c0 ? S1 : S0;
126
                  S1: STAR <= c1 ? S2 : S1;
127
                  S2: STAR <= c2 ? S2 : S3;
128
                  S3: STAR <= c2 ? S0 : S3;
129
130
             endcase
         end
131
     endmodule
132
133
     // sintesi di rete combinatoria omessa
134
```

#### Passo 6: la ROM

Secondo il modello a microindirizzi, la parte controllo è implementata come una ROM che usa il registro STAR come *microindirizzo*, e fornisce in uscita le variabili di controllo per la parte operativa così come c\_eff, m\_true e m\_false. Questi ultimi tre elementi, insieme alle variabili di condizionamento in ingresso dalla parte operativa, sono utilizzati con dei multiplexer in cascata per determinare lo stato successivo della rete. Lo schema circuitale è il seguente.



Fare la sintesi direttamente come ROM è possibile, ma è ben più tedioso e difficile da debuggare. Per questo manteniamo il linguaggio di trasferimento tra registri per indicare in Verilog il comportamento di STAR, e scriviamo invece come commento nel codice una tabella che mostri il contenuto della ROM. Per evitare ogni ambiguità, si comincia specificando codifiche binarie per gli stati e i *nomi* delle variabili di comando. Dopodiché, si può riempire la tabella con quanto scritto in Verilog.

```
01 | 01100 | 01 | 10 | 01
10 | 1X001 | 1X | 10 | 11
11 | 1X01X | 1X | 00 | 11
*/
```

A questo punto la sintesi è completa. È scaricabile qui.

Menzioniamo a parte il caso dei salti incondizionati, del tipo del tipo STAR <= S1. In questo caso, va scritta la ROM in modo che next\_address sia S1 per qualunque valore delle variabili di condizionamento. Questo si può ottenere mettendo sia m\_true che m\_false a S1, lasciando non-specificato c\_eff. In tabella, questo si traduce in

```
/*
... | c_eff | M-addr-T | M-addr-F
------
... | X | 01 | 01
*/
```

#### Formattazione della tabella

Non essendo parte del codice, non c'è una sintassi o formattazione precisa da seguire per la tabella, purché sia non-ambigua quando letta dai docenti. Questo include le varie alternative come m-true, m-addr-true, m-T etc., o usare ? al posto di X.

#### Valori non specificati

La tabella della ROM è difatto una tabella di verità per una rete combinatoria, che è quindi sintetizzabile utilizzando i metodi visti come le mappe di Karnaugh.

I valori non specificati per variabili di comando e condizionamento sono quindi utili per permettere ottimizzazioni in tale sintesi.

#### Salti incondizionati, non indeterminati

È purtroppo frequente vedere ROM dove uno o entrambi gli indirizzi m\_true o m\_false sono non specificati, come nell'esempio seguente

Una ROM del genere è priva di senso, perché determina una rete che salta a uno stato a caso.

## 21. Esercitazione 5

#### 21.1 Esercizio 5.1: esame 2023-07-18

Qui testo e soluzione.

#### Provare da sé

Provare a svolgere da sé l'esercizio, prima di guardare la soluzione o andare oltre per la discussione.

#### Esercizi con interfacce parallele

Il corretto pilotaggio di interfacce parallele richiede inevitabilmente più stati di quanto è solito usare per esercizi, per esempio, con handshake dav \_/rfd o soc/eoc.

Per questo, sono tipicamente gli esercizi che hanno più tempo a disposizione in sede d'esame.

In questo esercizio si lavora con interfacce parallele connesse ad un bus, una interfaccia di ingresso con handshake (da cui ottenere dati in ingresso) ed una interfaccia di ingresso e uscita senza handshake (a cui scrivere il risultato del calcolo). Il calcolo da svolgere è semplice: bisogna moltiplicare l'ingresso per 5, esprimendo il risultato su 16 bit. È *opzionale* sintetizzarlo con rete combinatoria.

La parte critica dell'esercizio è il corretto pilotaggio del bus, evitando corse critiche e usando potre tristate per evitare situazioni di corto circuito, e delle interfacce.

Per quanto riguarda le operazioni sul bus, ricordiamo che le interfacce si attivano alla ricezione di segnali ior\_ e iow\_. Questi segnali arrivano a <u>tutte</u> le interfacce sul bus, ma è solo quella *selezionata* tramite addr che si attiva, o leggendo data o assegnandogli un valore. È quindi critico che i fili di uscita addr e data siano stabili prima di portare ior\_ o iow\_ a 0.

Per data, questo si traduce, per scritture, nel valore assegnato stabile (per esempio, con registro DATA) e la porta tri-state abilitata (solitamente, DIR = 1); per le letture invece si disabilita la porta tri-state (solitamente, DIR = 0) per lasciare che sia l'interfaccia a assegnargli un valore. Ricordiamo che il problema qui è di tipo elettrico: assegnare un valore logico ad un filo equivale a imporre una tensione, e se più dispositivi assegnano tensioni diverse sullo stesso filo la differenza di potenziale porta ad un disastroso corto circuito.

Questo schema di pilotaggio va ripetuto più volte per accedere ai diversi registri. L'interfaccia parallela di ingresso con handshake richiede che si legga il suo registro RSR, ed in particolare il suo flag FI, in attesa che FI = 1 segnali la presenza di un dato da poter leggere. La lettura verrà fatta sul registro RBR. Per l'interfaccia parallela di ingresso-uscita senza handshake, dovremo invece fare due scritture sul registro TBR.

#### 21.2 Esercizio 5.1: esame 2024-01-26

Qui testo e soluzione.

#### Provare da sé

Provare a svolgere da sé l'esercizio, prima di guardare la soluzione o andare oltre per la discussione.

Il testo di questo esercizio è pensato per apparire fuori dalla norma a un occhio poco preparato, ma si rivela molto semplice con le dovute osservazioni.

Tralasciando le curiosità sulla congettura di Collatz, ciò che ci interessa è osservare che il calcolo di  $n_{i+1}$  a partire da  $n_i$  è di tipo combinatorio. Ciò è anche suggerito dal testo, che ci chiede di sintetizzare proprio questo.

Ciò che non è combinatorio è invece il calcolo di  $n_{i+1}$  a partire da  $n_0$ : questa è infatti una operazione *iterativa*, che implica una struttura ad anello che svolge più passaggi. Come dovremmo ben sapere, tali anelli

non possono essere reti combinatorie, e vanno invece implementate con reti sincronizzate che avanzano a passaggi discreti guidati dal segnale del clock. Anche questa osservazione è suggerita dal testo, visto che il modo più immediato per ottenere k è contare le iterazioni necessarie per arrivare ad 1.

La struttura chiave quindi è la seguente: abbiamo un registro N che conterrà l'attuale  $n_i$ , inizializzato con  $n_0$ . Al posedge del clock, campionando l'uscita della rete combinatoria CALCOLO\_ITERAZIONE, riceve il nuovo valore  $n_{i+1}$ . Contemporaneamente, un registro K, inizializzato a O, conta con K <= K + 1; quanti posedge sono necessari perché N arrivi ad 1. Questo è garantito dall'uso di un cambio di stato che interrompe il conteggio quando la condizione è raggiunta, fatte le solite osservazioni per il corretto conteggio di cicli di clock. Questo ciclo può essere espresso come nel seguente pseudo-codice:

```
CALCOLO_ITERAZIONE ci(
    .n_curr(N),
    .n_next(n_next)
);
always @(posedge clock) if(reset_ == 1) #3 begin
    casex(STAR)
        S_init: begin
            N \ll n_0;
            K <= 0;
        end
        S_loop: begin
            N <= n_next;
            K <= K + 1;
            STAR <= (n_next == 1) ? S_after : S_loop;</pre>
        end
        S_after: ...
    endcase
end
```

Una volta chiarito questo processo, il resto dell'esercizio è molto semplice. Va dimensionato N e la relativa rete combinatoria: il testo ci indica che il massimo raggiungibile è inferiore a 'h4000, implicando che 14 bit sono sufficienti. Va poi sintetizzata la rete combinatoria, che altro non è che un multiplexer, guidato dal bit meno significativo, i cui due ingressi sono uno shift a destra e un moltiplicatore con y = 3 e c = 1. Infine, la rete sincronizzata campiona  $n_0$ 0 e invia k tramite un singolo handshake soc/eoc.

# 22. Esercitazione 6

#### 22.1 Esercizio 6.1: esame 2024-07-16

Qui testo e soluzione.

#### Provare da sé

Provare a svolgere da sé l'esercizio, prima di guardare la soluzione o andare oltre per la discussione.

#### Esercizi senza sintesi di reti combinatorie

Non tutti gli esercizi includono la sintesi di reti combinatorie, così come non tutti i pretest, esercizi di Assembler o domande all'orale coprono un dato argomento del corso.

Nel complesso, ogni esame ambisce a coprire tutti gli argomenti del corso.

L'aspetto particolare di questo esercizio è la richiesta di utilizzare microsottoprogrammi. Questo significa codificare una serie di stati a cui si può saltare da diversi altri stati, a cui poi si intende tornare, proprio come i sottoprogrammi nel software. Al posto di call e ret, però, si usa il registro MJR (Multiway Jump Register).

La struttura per la descrizione è la seguente. Siano S0... SN gli stati della sequenza principale, e siano Smp0... SmpN gli stati del microsottoprogramma. Uno stato della sequenza principale può saltare ad un microsottoprogramma così

```
S0: begin
...
MJR <= S1;
STAR <= Smp0;
end</pre>
```

Al termine del microsottoprogramma si salterà poi alla sequenza principale così

```
SmpN: begin
...
STAR <= MJR;
end</pre>
```

All'interno del processore sEP8 visto nel corso si fa un uso massiccio di microsottoprogrammi per separare le varie operazioni del processore in sequenze generiche, atomiche e ben riconoscibili, come la fase di esecuzione di una specifica istruzione, l'accesso ad una locazione di memoria, l'accesso ad una interfaccia di I/O, etc.

Nella soluzione di questo esercizio, si usa un microsottoprogramma che esegue l'handshake e preleva un dato dal convertitore A/D. Il flusso principale non fa che saltare a questo microsottoprogramma 3 volte per prelevare i dati di cui ha bisogno. In S3, il calcolo è solo descritto.

```
X1 <= X0;
            MJR <= S3;
            STAR <= S_read0;
        end
        S3: begin
            OUT <= ((X0 + X1 + X2) >= 164) ? 1 : 0;
            STAR <= S0;
        end
        // microsottoprogramma per l'acquisizione di un campione
        // il dato acquisito viene lasciato in X0
        S read0: begin
            SOC <= 1;
            STAR <= (eoc == 1'b0) ? S_read1 : S_read0;</pre>
        end
        S_read1: begin
            SOC <= 0;
            STAR <= (eoc == 1'b1) ? S_read2 : S_read1;</pre>
        end
        S_read2: begin
            X\Theta <= x;
            STAR <= MJR;
        end
    endcase
end
```

Un altro aspetto critico è come sintetizzare una rete del genere, cioè come si implementa effettivamente dell'hardware che si comporta in questo modo. L'aspetto chiave è il fatto che quando non si usano microsottoprogrammi, i valori assegnati a STAR sono sempre delle costanti, che come abbiamo visto possono essere sintetizzate usando una ROM. I salti che usano MJR invece no, perché, per l'appunto, usano un registro da cui viene letto il prossimo stato.

Va quindi utilizzata una architettura diversa. Una di quelle viste nel corso è così schematizzata.



In questa architettura notiamo che si aggiunge un nuovo filo in uscita alla ROM per distinguere i salti (in)condizionati dai salti che leggono da MJR. Possiamo quindi sintetizzare la parte controllo di questo esercizio con una ROM come la seguente.

```
// Per i salti incondizionati o a due vie, si utilizzano i campi m-addr T ed m-addr F della
→ ROM, ed un multiplexer guidato da una delle variabile di condizionamento prodotte dalla

→ parte operativa.

// Dato che, in questo caso, abbiamo una sola variabile di condizionamento, non c'è bisogno
  di distinguerle tramite un multiplexer ed il campo c_eff della ROM, che quindi
   omettiamo.
/*
m-addr
                m-code
                              | m-addr T
                                              | m-addr F
                                                              | m-type
                              | 100 (S_read0) | 100 (S_read0) | 0
001 (S1)
                000000101
000 (S0)
                 100000010
                             | 100 (S_read0) | 100 (S_read0)
                                                                0
010 (S2)
                  010000011
                              | 100 (S_read0) |
                                                100 (S_read0)
011 (S3)
                  000001X00
                              | 000 (S0)
                                                000 (S0)
100 (S_read0)
               0001X0000
                              | 100 (S_read0) |
                                                101 (S_read1)
                                                                0
101 (S_read1)
                  000010000
                               110 (S_read2) |
                                                101 (S_read1)
                                                                0
110 (S_read2)
                001000000
                              | XXX
                                              | XXX
```

#### Niente salti condizionati con MJR

L'architettura presentata permette solo

- Salti incondizionati a stato *costante*, del tipo STAR <= S0;, da sintetizzare con m-type = 0, c\_eff = X, m-true = m-false = S0.
- Salti condizionati a stati *costanti*, del tipo STAR <= c1 ? S0 : S1;, da sintetizzare con m-type = 0, c\_eff = c1, m-true = S0, m-false = S1.
- Salti incondizionati a MJR, del tipo STAR <= MJR;, da sintetizzare con m-type = 1, c\_eff = X, m-true = X, m-false = X.

Non sono sintetizzabili invece salti del tipo STAR <= c1 ? MJR : S1. Per far questo ci vorrebbe un'altra architettura, diversa da quelle viste in questo corso.

#### 22.2 Esercizio 6.2: esame 2024-09-10

Qui testo e soluzione.

#### Provare da sé

Provare a svolgere da sé l'esercizio, prima di guardare la soluzione o andare oltre per la discussione.

Il primo aspetto interessante di questo esercizio è la ricezione di byte tramite linea seriale, la cui specifica è data dal testo. Dalla specifica, quando un valore viene trasmesso si imposta la linea su 0, la lunghezza dell'intervallo in cui la linea è a 0 ci indica quale bit è stato trasmesso. Ci sono due range dati: [2,7] periodi di clock per un bit 1, [11,15] per un bit 0.

#### Assenza di errori

In esercizi d'esame come questo, si *assume* che non ci siano errori di alcun tipo nel trasmettitore o sulla linea. Non ci saranno quindi periodi di lunghezze diversa dagli intervalli indicati. La distanza tra 7 e 11 permette di escludere ambiguità nella misurazione della lunghezza degli intervalli.

Abbiamo quindi bisogno di due ingredienti. Il primo è un registro su cui campioniamo in shift continuo. Dato che l'esercizio indica i bit inviati a partire dal più signficativo, si può campionare un byte eseguendo 8 volte BYTE <= {nuovo\_bit, BYTE[7:1]};. Il secondo ingrediente è aspettare che rxd vada a 0, e poi *contare* per quanti periodi di clock rimane a 0, per esempio con un registro COUNT. Possiamo quindi calcolare nuovo\_bit = (COUNT <= 7);, che è ottimizzabile (ma non è indispensabile) notando che è equivalente a nuovo\_bit = ~COUNT[3].

Il secondo aspetto interessante dell'esercizio riguarda il calcolo combinatorio da eseguire con i byte ricevuti. L'esercizio chiede di interpretarli come numeri *interi* in complemento alla radice  $x_0, ..., x_n$ , calcolandone di volta in volta la somma  $s_i$  che è posta in uscita. Quando tale somma sarà non più rappresentabile, si torna alle condizioni al reset (ossia il prossimo campione sarà  $x_0$ ).

Per far questo utilizziamo iterativamente un sommatore, a cui colleghiamo in ingresso i registri S (inizializzato a 0) e BYTE. Sia s l'uscita di tale sommatore. Ognivolta che un nuovo campione è stato ricevuto completamente, campioniamo la nuova somma con S <= s.

Dato che si parla di numeri interi in complemento alla radice, come criterio di rappresentabilità dobbiamo usare il filo di overflow ow di questo sommatore. L'uscita c\_out è invece irrilevante, sarebbe di interesse sole se questi fossero numeri *naturali*.

# Parte V Documentazione

# 23. Introduzione

Questa documentazione è organizzata per fornire riferimenti rapidi per ciascun contesto d'uso del Verilog. Nel far questo, prendiamo in considerazione il fatto che in Verilog la stessa sintassi può avere usi diversi in contesti diversi: per esempio, si parlerà in modo diverso di reg per testbench simulative rispetto a come se ne parla per reti sincronizzate.

Le definizioni "vere" di queste sintassi sono più astratte di quanto presentato qui, proprio per accomodare usi diversi. Un esempio di documentazione più completa ma non orientata agli usi di questo corso si trova su www.chipverify.com.

# 24. Operatori

## 24.1 Valori letterali (literal values)

In ogni linguaggio, i *literal values* sono quelle parti del codice che rappresentano valori costanti. Per ovvi motivi, in Verilog questi sono principalmente stringhe di bit.

La definizione (completa) di un valore letterale è data da

- 1. dimensione in bit
- 2. formato di rappresentazione
- 3. valore

Per esempio, 4'b0100 indica un valore di 4 bit, espressi in notazione *binaria*, il cui valore in binario è 0100. Le altre notazioni che useremo sono d per decimale (4'd7 corrisponde al binario 0111) e h per esadecimale (8'had corrisponde al binario 10101101).

#### Estensione e troncamento

Verilog automaticamente estende e tronca i letterali la cui parte valore è sovra o sottospecificata rispetto al numero di bit. Per esempio, 4'b0 viene automaticamente esteso a 4'b0000, mentre 6'had viene automaticamente troncato a 6'b101101.

### 24.2 Operatori aritmetici

Il Verilog supporta molti degli operatori comuni, che possiamo usare in espressioni combinatorie: +, -, \*, /, %, <, > <, >=, ==.

Prestare attenzione, però, ai dimensionamenti in bit degli operandi e a come Verilog li estende per eseguire le operazioni.

## 24.3 Operatori logici e bitwise

Verilog supporta i classici operatori logici &&, || e !. Questi lavorano su valori booleani ( 0 è false, diverso da zero è true ), e producono un solo bit come risultato.

| Operatore logico | Tipo di operazione |
|------------------|--------------------|
| 88               | and                |
|                  | or                 |
| !                | not                |

Questi vanno distinti dagli operatori *bitwise* (in italiano *bit a bit* ), che lavorano invece per un bit alla volta (e per bit corrispondenti) producendo un risultato delle stesse dimensioni degli operandi.

| Operatore bitwise | Tipo di operazione |
|-------------------|--------------------|
| 8                 | and                |
| ~&                | nand               |
|                   | or                 |
| ~                 | nor                |
| *                 | xor                |
| ~^                | xnor               |
| ~                 | not                |

Per indicare porte logiche, utilizzare gli operatori bitwise.

#### Come scrivere la tilde ~

Nel layout di tastiera QWERTY internazionale, la tilde ha un tasto dedicato, a sinistra dell'1.



Nel layout di tastiera QWERTY italiano, invece, la tilde non è presente. Ci sono 3 opzioni:

- 1. passare al layout QWERTY internazionale
- 2. imparare scorciatoie alternative, che dipendono dal sistema operativo
- 3. usare scripting come AutoHotkey per personalizzare il layout

L'opzione 1 richiede di imparare un layout diverso, ma è consigliabile per tutti gli usi di programmazione dato che risolve altri problemi come il backtick ` e rende più semplici da scrivere caratteri come []{} e ;. Qui le istruzioni per cambiare layout su Windows.

L'opzione 2 varia da sistema a sistema. Su Windows, la combinazione di tasti è alt + 126, facendo attenzione a digitare il numero usando il tastierino numerico e *non* la riga dei numeri.

L'opzione 3 non è utilizzabile all'esame. Per uso personale, vedere qui.

#### **Reduction operators**

I reduction operators applicano un'operazione tra tutti i bit di un elemento di più bit, producendo un risultato su un solo bit. Sia per esempio x di valore 4'b0100, allora la sua riduzione and  $\delta x$ , equivalente a x[3]  $\delta$  x[2]  $\delta$  x[1]  $\delta$  x[0], varrà 1'b0; mentre la sua riduzione or, |x, varrà 1'b1. Le riduzioni possono rendere alcune espressioni combinatorie più semplici da scrivere.

| Operatore | Tipo di riduzione |
|-----------|-------------------|
| δ         | and               |
| ~&        | nand              |
|           | or                |
| ~         | nor               |
| ^         | xor               |
| ~^        | xnor              |

## 24.4 Operatore di selezione [...]

Quando si dichiara un elemento, come un wire, si utilizza la notazione [N:0] per indicare l'elemento ha N+1 bit, indicizzati da O a N. Per esempio, per dichiarare un filo da 8 bit, scriveremo

```
wire [7:0] x;
```

Possiamo poi utilizza l'operatore per selezionare uno o più bit di un tale componente. Per esempio, possiamo scrivere x[2], che seleziona il bit di posizione 2 ( bit-select ), e x[6:3], che seleziona i quattro bit dalla posizione 6 alla posizione 3 ( part-select ).

## 24.5 Operatore di concatenazione {...}

L'operatore di concatenazione viene utilizzato per combinare due o più espressioni, vettori, o bit in un'unica entità.

```
input [3:0] a, b;
wire [7:0] ab;
assign ab = {a, b};
```

L'operatore può anche essere usato a sinistra di un assegnamento.

```
input [7:0] x;
wire [3:0] xh, xl;
assign {xh, xl} = x;
```

# Maneggiare fili non ha nessun costo

Questo operatore corrisponde, circuitalmente, al semplice raggruppare o separare dei fili. Non è un'operazione combinatoria, e per questo non consuma tempo. È per questo che negli esempi sopra gli assign non hanno alcun ritardo #T.

# Operatore di replicazione N{...}

L'operatore di replicazione semplifica il tipico caso d'uso di ripetere un bit o un gruppo di bit N volte. Si può utilizzare solo all'interno di un concatenamento che sia a *destra* di un assegnamento e con N costante. È equivalente a scrivere N volte ciò che si vuole ripetere.

```
input [3:0] x;
wire [15:0] x_repeated_4_times;
assign x_repeated_4_times = {4{x}}; // equivalente a {x, x, x, x}
```

Il suo uso più comune è l'estensione di segno di interi, mostrato più avanti.

# 24.6 Operazioni comuni

# Estensione di segno

Quando si estende un numero su più bit bisogna considerare se il numero è un naturale o un intero. Per estendere un naturale, basta aggiungere degli zeri.

```
wire [7:0] x_8;
wire [11:0] x_12;
assign x_12 = {4'h0, x_8};
```

Per estendere un intero, dobbiamo invere replicare il bit più significativo.

```
wire [7:0] x_8;
wire [11:0] x_12;
assign x_12 = {4{x_8[7]}, x_8};
```

#### Shift a destra e sinistra

Per fare shift a destra e sinistra ci basta utilizzare gli operatori di selezione e concatenamento. Lo shift a sinistra è lo stesso per numeri naturali e interi, posto che non ci sia overflow.

```
input [7:0] x;
wire [7:0] x_mul_4;
assign x_mul_4 = {x[5:0], 2'b0};
```

Lo shift a destra richiede invece di considerare il segno, se stiamo lavorando con interi.

```
input [7:0] x; // rappresenta un numero naturale
wire [7:0] x_div_4;
assign x_div_4 = {2'b0, x[7:2]};

input [7:0] x; // rappresenta un numero intero
wire [7:0] x_div_4;
assign x_div_4 = {2{x[7]}, x[7:2]};
```

# 25. Sintassi per reti combinatorie

Una rete combinatoria si esprime come un module composto solo da wire, espressioni combinatorie e componenti che sono a loro volta reti combinatorie.

# 25.1 module

Il blocco module ... endmodule definisce un tipo di componente, che può poi essere instanziato in altri componenti. La dichiarazione di un module include il suo nome e la lista delle sue porte.

```
module nome_rete ( porta1, porta2, ... );
...
endmodule
```

# input e output

Per ciascuna porta di un module, dichiariamo se è di input o output, e di quanti bit è composta. Se non specificata, la dimensione default è 1. La dichiarazione di porte con le stesse caratteristiche si può fare nella stessa riga.

Le porte input sono dei wire il cui valore va assegnato al di fuori di questa rete.

Le porte output sono dei wire il cui valore va assegnato all'interno di questa rete.

```
module nome_rete ( porta1, porta2, porta3, porta4 );
   input [3:0] porta1, porta2;
   output [3:0] porta3;
   output porta4;
   ...
endmodule
```

#### inout

Non usiamo porte inout nelle reti combinatorie.

# 25.2 wire

Un wire è un filo che trasporta un valore logico. Se non specificata, la dimensione default è 1. La dichiarazione di wire con le stesse caratteristiche si può fare nella stessa riga.

```
wire [3:0] w1, w2;
wire w3, w4, w5;
```

Con uno statement assign possiamo associare al wire una espressione combinatoria: il wire assumerà continuamente il valore dell'espressione, rispondendo ai cambiamenti dei suoi operandi. Lo statement assign può includere un fattore di ritardo, #T, per indicare che il valore del filo segue il valore dell'espressione con ritardo di T unità.

```
assign #1 w5 = w3 & w4;
```

Un wire può essere associato a una porta di un module, come mostrato nella sezione successiva.

# 25.3 Usare un module in un altro module

Una volta definito un module, possiamo instanziare componenti di questo tipo in un altro module.

```
nome_module nome_istanza (
          .porta1(...), .porta2(...), ...
);
```

Questo corrisponde, circuitalmente, al prendere un componente fisico di tipo nome\_module, chiamato nome\_istanza per distinguerlo dagli altri, e posizionarlo nella nostra rete collegandone i vari piedini con altri elementi.

All'interno degli statement .porta(...) specifichiamo quale porta, espressione o wire del module corrente va collegato alla porta del module instanziato.

Insieme agli statement assign e l'uso di wire, questo ci permette di comporre reti combinatorie su diversi livelli di complessità e con poca duplicazione del codice.

Come esempio, costruiamo un and a 1 ingresso e lo usiamo per comporre un and a 3 ingressi.

```
module and(a, b, z);
    input a, b;
    output z;
    assign #1 z = a \delta b;
endmodule
module and2(a, b, c, z);
    input a, b, c;
    output z;
    wire z1;
    and a1(
        .a(a), .b(b),
        .z(z1)
    );
    and a2(
        .a(c), .b(z1),
         z(z)
    );
endmodule
```

# 25.4 Tabelle di verità

Talvolta il modo più immediato per esprimere una rete combinatoria è tramite la sua tabella di verità. È anche noto che data una tabella di verità possiamo ottenere una sintesi della rete combinatoria, utilizzando metodi come le mappe di Karnaugh.

In Verilog, il modo più immediato di esprimere una tabella di verità è utilizzando una catena di operatori ternari.

```
module and (x, y, z);
  input x, y;
  output z;
  assign #1 z =
    ({x,y} == 2'b00) ? 1'b0 :
    ({x,y} == 2'b00) ? 1'b0 :
    ({x,y} == 2'b00) ? 1'b0 :
    /*{x,y} == 2'b11*/ 1'b1;
```

Un'alternativa è l'uso di function e casex.

```
1 module and (x, y, z);
2    input x, y;
3    output z;
4    assign #1 z = tabella_verita({a, b});
```

25.5. MULTIPLEXER 149

```
5
        function tabella_verita;
6
            input [1:0] ab;
7
            casex(ab)
                2'b00: tabella_verita = 1'b0;
9
                2'b01: tabella_verita = 1'b0;
10
                2'b10: tabella_verita = 1'b0;
11
                2'b11: tabella_verita = 1'b1;
            endcase
13
        endfunction
14
    endmodule
15
```

Per indicare tabelle di verità con più di un bit in uscita si scrive, per esempio, function [1:0] tabella\_verita;. Nel casex si può utilizzare anche un caso default, scrivendo come ultimo caso default: tabella\_verita = ...

#### Attenzione all'uso delle function

Le function sono blocchi di codice da eseguire, parti del behavioral modelling di Verilog. Il simulatore ne svolge i passaggi come un programma, senza consumare tempo e senza alcun corrispettivo hardware previsto. È per questo, per esempio, che dobbiamo specificare noi il tempo consumato nello statement assign.

L'uso mostrato qui delle function è <u>l'unico ammesso</u> per una sintesi di reti combinatorie. In presenza di ogni altra elaborazione algoritmica, di cui non sia evidente il corrispettivo hardware, sarà invece considerata una descrizione di rete combinatoria.

# 25.5 Multiplexer

I multiplexer sono da considerarsi noti e sintetizzabili, e si possono esprimere con uno o più operatori ternari?.

# Operatore ternario

La sintassi è della forma cond ? v\_t : v\_f, dove cond è un predicato (espressione true o false) mentre v\_t e v\_f sono espressioni dello stesso tipo.

L'espressione ha valore v t se il predicato cond è true, v f altrimenti.

Per un multiplexer con selettore a 1 bit, basterà un solo ?.

```
input sel;
assign #1 multiplexer = sel ? x0 : x1;
```

Per un selettore a più bit si dovranno usare in serie per gestire più casi

```
input [1:0] sel;
assign #1 multiplexer =
    (sel == 2'b00) ? x0 :
    (sel == 2'b01) ? x1 :
    (sel == 2'b10) ? x2 :
    /*sel == 2'b11*/ x3 :
```

### Differenza tra multiplexer e tabella di verità

La sintassi qui mostrata sembra identica a quella mostrata poco prima per le tabelle di verità. Sono quindi la stessa cosa? **No.** 

Dato uno specifico ingresso, una rete combinatoria avrà come uscita sempre il valore corrispondente nella tabella di verità, che è specifico e costante (a meno di *non specificati* ). Per un multiplexer, invece, l'uscita è il valore di uno degli ingressi, che è libero di mutare. Le realizzazioni circuitali di questi componenti sono completamente diverse.

Per la sintassi Verilog, invece, la differenza è da poco (prendere un *right hand side* da una variabile o da un letterale). Di nuovo, è importante stare attenti a *cosa si sta facendo* quando si scrive codice Verilog.

# 25.6 Reti parametrizzate

In un module si possono definire parametri per generalizzare la rete. In particolare, questo è utilizzato in reti\_standard.v per fornire reti il cui dimensionamento va specificato da chi le utilizza. Per esempio, vediamo come è definita una rete di somma a N bit.

```
module add(
    x, y, c_in,
    s, c_out, ow
);
    parameter N = 2;

    input [N-1:0] x, y;
    input c_in;

    output [N-1:0] s;
    output c_out, ow;

    assign #1 {c_out, s} = x + y + c_in;
    assign #1 ow = (x[N-1] == y[N-1]) && (x[N-1] != s[N-1]);
endmodule
```

Con N = 2 viene impostato il valore di default del parametro. Quando instanziamo la rete altrove, possiamo modificare questo parametro, per esempio per ottenere un sommatore a 8 bit.

```
add #( .N(8) ) a ( ... );
```

Un module può avere più di un parametro, che possono essere impostati indipendentemente.

# Immutabilità dei parametri

I parametri determinano la quantità di <u>hardware</u>, che non può essere cambiata mentre la rete è in uso. I valori associati devono essere costanti.

### Parametrizzazione e sintesi di reti combinatorie

La parametrizzazione è facilmente applicabile a *descrizioni* di reti combinatorie dove si usano espressioni combinatorie che il simulatore è facilmente in grado di adattare a diverse quantità di bit. È molto più complicato applicarla a *sintesi* di reti combinatorie, dato che non si possono instanziare componenti in modo parametrico, per esempio N full adder da 1 bit per sintetizzare un full adder a N bit.

# 26. Sintassi per reti sincronizzate

Una rete sincronizzata si esprime come un module contenente registri, che sono espressi con reg il cui valore è inizializzato in risposta a reset\_ ed aggiornato in risposta a fronti positivi del clock.

Gran parte della sintassi già vista per le reti combinatorie rimane valida anche qui, e dunque non la ripetiamo. Ci focalizziamo invece su come esprimere registri usando reg.

# 26.1 Istanziazione

Un registro si istanzia con statement simili a quelli per wire:

```
reg [3:0] R1, R2;
reg R3, R4, R5;
```

#### Nomi in maiuscole e minuscolo

Verilog è *case sensitive*, cioè distingue come diversi nomi che differiscono solo per la capitalizzazione, come out e OUT.

Nel corso, utilizziamo questa feature per distinguere a colpo d'occhio reg e wire, utilizzando lettere maiuscole per i primi e minuscole per i secondi. Questo è particolarmente utile quando si hanno registri a sostegno di un wire, tipicamente un'uscita della rete o l'ingresso di un module interno. Seguire questa convenzione non è obbligatorio, ma fortemente consigliato per evitare ambiguità ed errori che ne conseguono.

# 26.2 Collegamento a wire

Un reg si può utilizzare come "fonte di valore" per un wire. Questo equivale circuitalmente a collegare il wire all'uscita del reg.

```
output out;
reg OUT;
assign out = OUT;
```

In questo caso, out seguirà sempre e in modo continuo il valore di OUT, propagandolo a ciò a cui viene collegato a sua volta. In questo caso non introduciamo nessun ritardo #T nell' assign perché si tratta di un semplice collegamento senza logica combinatoria aggiunta.

Allo stesso modo, si può collegare un reg all'ingresso di una rete.

```
reg [3:0] X, Y;
add #( .N(4) ) a(
    .x(X), .y(Y), .c_in(1'b0),
    ...
);
```

Non ha invece alcun senso cercare di fare il contrario, ossia collegare direttamente un wire all'ingresso di un reg. Anche se questo ha senso circuitalmente, Verilog richiede di esprimere questo all'interno di un blocco always per indicare anche *quando* aggiornare il valore del reg.

# 26.3 Struttura generale di un blocco always

Il valore di un reg si aggiorna all'interno di blocchi always. La sintassi generale di questi blocchi è la seguente

```
always @( event ) [if( cond )] [ #T ] begin
  [multiple statements]
end
```

Il funzionamento è il seguente: ogni volta che accade event, se cond è vero e dopo tempo T, vengono eseguiti gli statement indicati. Se lo statement è uno solo, si possono anche omettere begin e end.

Per Verilog, qui come *statement* si possono usare tutte le sintassi procedurali che si desiderano, incluse quelle discusse per le testbench che permettono di scrivere un classico programma "stile C". Per noi, *no*. Useremo questi blocchi in dei modi specifici per indicare

- 1. come si comportano i registri al reset,
- 2. come si comportano i registri al fronte positivo del clock.

# 26.4 Comportamento al reset

Per indicare il comportamento al reset useremo statement del tipo

```
always @(reset_ == 0) begin
R1 = 0;
end
```

Il funzionamento è facilmente intuibile: finché reset\_ è a 0, il reg è impostato al valore indicato. Il blocco begin ... end può contenere l'inizializzazione di più registri. Tipicamente, raggrupperemo tutte le inizializzazioni in una descrizione, mentre le terremo separate in una sintesi.

Un registro può non essere inizializzato: in tal caso, il suo valore sarà *non specificato*, in Verilog X. Ricordiamo che questo significa che il registro *ha* un qualche valore misurabile, ma non è possibile determinare logicamente a priori e in modo univoco quale sarà.

In un blocco reset è indifferente l'uso di = o <= per gli assegnamenti (vedere sezione più avanti).

#### Valore assegnato al reset

Per la sintassi Verilog, a destra dell'assegnamento si potrebbe utilizzare qualunque espressione, sia questa costante (per esempio, il letterale 1'b0 o un parameter) o variabile (per esempio, il wire w). Se pensiamo però all'equivalente circuitale, hanno senso solo valori costanti. Infatti, impostare un valore al reset equivale a collegare opportunamente i piedini preset\_e preclear\_del registro.

# 26.5 Aggiornamento al fronte positivo del clock

Per indicare il comportamento al fronte positivo del clock useremo statement del tipo

```
always @(posedge clock) if(reset_ == 1) #3 begin
   OUT <= ~OUT;
end</pre>
```

Il funzionamento è il seguente: ad ogni fronte positivo del clock, se reset\_ è a 1 e dopo 3 unità di tempo, il registro viene aggiornato con il valore indicato. Differentemente dal reset, qui si può utilizzare qualunque logica combinatoria per il calcolo del nuovo valore del registro.

L'unità di tempo (impostato a 3 in questo corso solo per convenzione, così come il periodo del clock a 10 unità) rappresenta il tempo di propagazione  $T_{propagation}$  del registro, ossia il tempo che passa dal fronte del clock prima che il registro mostri in uscita il nuovo valore.

Tutti gli assegmenti in questi blocchi devono usare l'operatore <=, e non =. Come spiegato nella sezione più avanti, questo è necessario perché i registri simulati siano non-trasparenti.

Tipicamente usiamo registri multifunzionali, ossia che operano in maniera diversa in base allo stato della rete.

In una descrizione, questo si fa usando un singolo registro di stato STAR e indicando il comportamento dei vari registri multifunzionali al variare di STAR. Questo ci fa vedere in generale come si comporta l'intera

rete al variare di STAR. In questa notazione, è lecito omettere un registro in un dato stato, implicando che quel registro *conserva* il valore precedentemente assegnato.

In una *sintesi*, invece, si sintetizza ciascun registro individualmente come un multiplexer guidato da una serie di *variabili di comando*. Il multiplexer ha come ingressi *tutti* i risultati combinatori che il registro utilizza, e in base allo stato (da cui vengono generate le variabili di comando) solo uno di questi è utilizzato per aggiornare il registro al fronte positivo del clock. Questo è rappresentato in Verilog utilizzando le variabili di comando per discriminare il casex, e indicando un comportamento combinatorio per ciascun valore di queste variabili. In questa notazione, <u>non è lecito</u> omettere le operazioni di conservazione, mentre è lecito utilizzare non specificati per indicare comportamenti assegnati a più ingressi del multiplexer. Nell'esempio sotto, con 2'b1X si indica che a entrambi gli ingressi 10 e 11 del multiplexer è collegato il valore DAV\_.

```
always @(posedge clock) if(reset_ == 1) #3 begin
    casex({b1, b0})
        2'b00: DAV_ <= 0;
        2'b01: DAV_ <= 1;
        2'b1X: DAV_ <= DAV_;
    endcase
end</pre>
```

# 26.6 Limitazioni della simulazione: temporizzazione, non-trasparenza e operatori di assegnamento

Ci sono alcune differenze tra i registri, intesi come componenti elettronici, e i reg descritti in Verilog così come abbiamo visto. Queste differenze non sono d'interesse *se non si fanno errori*. In caso di errori, si potrebbero osservare comportamenti altrimenti inspiegabili, ed è per questo che è utile conoscere queste differenze per poter risalire alla fonte del problema.

I registri hanno caratteristiche di temporizzazione sia prima che dopo il fronte positivo del clock: ciascun ingresso va impostato almeno  $T_{setup}$  prima del fronte positivo, mantenuto fino ad almeno  $T_{hold}$  dopo, e il valore in ingresso è rispecchiato in uscita solo dopo  $T_{propagation}$ .

Date le semplici strutture sintattiche che utilizziamo, la simulazione non è così accurata e non considera  $T_{setup}$  e  $T_{hold}$ . In particolare, il simulatore campiona i valori in ingresso non prima del fronte positivo, ma direttamente quando aggiorna il valore dei registri, ossia  $dopo\ T_{propagation}$  dal fronte positivo del clock. In altre parole: tutti i campionamenti e gli aggiornamenti dei registri sono fatti allo stesso tempo di simulazione, ossia  $T_{propagation}$  dopo il fronte positivo del clock.

Questo porterebbe a violare la non-trasparenza dei registri, se non fosse per l'operatore di assegnamento <=, detto non-blocking assignement. Questo operatore si comporta in questo modo: tutti gli assegmenti <= contemporanei (ossia allo stesso tempo di simulazione) non hanno effetto l'uno sull'altro perché campionano il right hand side all'inizio del time-step e aggiornano il left hand side alla fine del time-step.

Questo simula correttamente la non-trasparenza dei registri, ma solo se *tutti* usano <=. Gli assegnamenti con =, detti *blocking assignement*, sono invece eseguiti completamente e nell'ordine in cui li incontra il simulatore (si assuma che quest'ordine sia del tutto casuale).

Al tempo di reset questo ci è indifferente, perché sono (circuitalmente) leciti solo assegnamenti con valori costanti e non si possono quindi creare anelli per cui è di interesse la non-trasparenza.

# 27. Simulazione ed uso di GTKWave

Documentiamo qui il software da utilizzare per il testing e debugging delle reti prodotte, ossia iverilog, vvp e GTKWave. A differenza dell'ambiente per Assembler, questi sono facilmente reperibili per ogni piattaforma, o compilabili dal sorgente. In sede d'esame si utilizzano da un normale terminale Windows, senza utilizzare macchine virtuali. Qui si trovano installer per Windows.

Negli esercizi di esame vengono forniti i file necessari a compilare simulazioni per testare la propria rete. Questi sono tipicamente i file testbench.vereti\_standard.v. Il primo contiene una serie di test che verificano il corretto comportamento della rete prodotta rispetto alle specifiche richieste. Il secondo contiene invece delle reti combinatorie che si potranno assumere note e sintetizzabili, da usare per la sintesi di rete combinatoria.

Non tutti gli esercizi hanno una parte di sintesi di rete combinatoria, e quindi il file reti\_standard.v. Inoltre, ciascun esercizio ha il *proprio* file reti\_standard.v, che sarà diverso da quelli allegati ad altri esercizi.

# 27.1 Compilazione e simulazione

Sia descrizione.v il sorgente contenente la descrizione della rete sincronizzata da noi prodotto, e che vogliamo testare.

Si compila la simulazione con il comando da terminale iverilog. Il comando richiede come argomenti i file da compilare assieme. Di default, il binario prodotto si chiamerà a.out, mentre con l'opzione -o nome è possibile impostarne uno a scelta. Per esempio:

iverilog -o desc testbench.v reti\_standard.v descrizione.v

Il file prodotto non è eseguibile da solo, ma va lanciato usando vvp. Per esempio:

vvp desc

Questo lancerà la simulazione. In un test di successo, vedremo le seguenti stampe:

```
VCD info: dumpfile waveform.vcd opened for output. $finish called at [un numero]
```

La prima stampa ci informa che il file waveform. vcd sta venendo popolato, la seconda ci informa del tempo di simulazione al quale questa è terminata con il comando \$finish. Alcune versioni di vvp non stampano quest'ultima di default - non è un problema.

Le testbench degli esercizi d'esame stampano a video quando incontrano un errore: un test fallito avrà quindi delle righe in più in mezzo a quelle presentate qui. Per esempio, Timeout - waiting for signal failed indica che la simulazione si era bloccata in attesa di un evento che non è mai accaduto, come un segnale di handshake.

### Le testbench non sono mai complete

Se la simulazione non stampa errori, questo indica solo che la testbench non ne ha trovato alcuno. Non implica, invece, che non ci siano errori. Questo sia perché è impossibile scrivere una testbench davvero esaustiva per tutti i possibili percorsi di esecuzione, ma anche perché è facile scrivere Verilog che sembra funzionare bene ma che in realtà usa costrutti che rendono la rete irrealizzabile in hardware.

È sempre responsabilità dello studente assicurarsi che non ci siano errori. In fase di autocorrezione, anche se la testbench non trova nessun errore, è sempre possibile (anzi, dovuto) assicurarsi della correttezza del compito e fare correzioni se necessarie.

#### Testbench con`timescale

Con la sintassi `timescale è possibile controllare l'unità di misura default e la granularità della simulazione. Per esempio, un file testbench.v che comincia come segue imposta l'unità di misura a 1s (il solito) e la granularità di simulazione a 1ms, permettendo di osservare cambiamenti più veloci di un secondo.

```
`timescale 1s/ms
module testbench();
...
```

Questa sintassi è utilizzata in alcuni testi d'esame, per esempio se sono previste RC particolarmente veloci. Per maggiori dettagli, vedere qui.

```
Se la sintassi `timescale è utilizzata, è obbligatorio compilare la simulazione ponendo il file testbench.v come primo file del comando, ossia iverilog -o desc testbench.v ....
In caso contrario, il compilatore stamperà il seguente warning:
warning: Found both default and `timescale based delays.
```

# 27.2 Waveform e debugging

La simulazione genera un file wave form. vcd contenente l'evoluzione di tutti i fili e registri nella simulazione. Questo file è prodotto grazie alle seguenti righe, incluse in tutte le testbench:

```
initial begin
   $dumpfile("waveform.vcd");
   $dumpvars;
...
```

Con questo file possiamo studiare l'evoluzione della rete e trovare eventuali errori. Per analizzarlo, usiamo GTKWave, richiamabile da terminale con

```
gtkwave waveform.vcd
```

Si dovrebbe aprire quindi una finestra dal quale possiamo analizzare l'evoluzione della rete.



Il programma mostra sulla sinistra le varie componenti nella simulazione e, se li selezioniamo, i fili e registri che li compongono. Ci interesserà in particolare dut ( device under test ), che sarà proprio il componente da noi realizzato. Selezionando poi i vari wire e reg che compaiono sotto, e cliccando "Append", compariranno nella schermata a destra, dove possiamo vedere l'evoluzione nel tempo.

## Zoom, ordinamento, formattazione

Lo zoom della timeline a destra è regolabile, usando la rotellina del mouse o le lenti d'ingrandimento in alto a sinistra.

Cliccando in punti specifici della timeline spostiamo il cursore, cioè la linea rossa verticale. Possiamo quindi leggere nella colonna centrale il valore di ciascun segnale all'istante dove si trova il cursore.

I segnali nella schermata principale sono ordinabili, per esempio è in genere utile spostare clock e STAR in alto. Di default, sono formattati come segnali binari, se composti da un bit, o in notazione esadecimale, se da più bit. Cliccando col destro su un segnale è possibile cambiare la formattazione in diversi modi, incluso decimale.

# Non specificati e alta impedenza

Prestare particolare attenzione ai valori non specificati ( X ) e alta impedenza ( Z ), che sono spesso sintomi di errori, per esempio per un filo di input non collegato.

Nella waveform, i valori non specificati sono evidenziati con un'area rossa, mentre i fili in alta impedenza sono evidenziati con una linea orizzontale gialla posta a metà altezza tra 0 e 1.

# Pulsante Reload

Il comando gtkwave waveform.vcd blocca il terminale da cui viene lanciato, rendendo impossibile mandare altri comandi finché non viene chiuso. È quindi frequente vedere studenti chiudere e riaprire GTKWave ogni volta che c'è bisogno di risimulare la rete.

Questo approaccio è però inefficiente, dato che si dovrà ogni volta riselezionare i fili, riformattarne i valori, ritrovare il punto d'errore che si stava studiando.

Il pulsante *Reload*, indicato con l'icona , permette di ricaricare il file waveform.vcd senza chiudere e riaprire il programma, e mantentendo tutte le selezioni fatte.

È per questo una buona idea utilizzare una delle seguenti strategie:

- 1. usare due terminali, uno dedicato a iverilog e vvp, l'altro a gtkwave;
- 2. lanciare il comando gtkwave in background. Nell'ambiente Windows all'esame, questo si può fare aggiungendo un & in fondo: gtkwave waveform.vcd &.

In entrambi i casi, otteniamo di poter rieseguire la simulazione mentre GTKWave è aperto, e poter quindi sfruttare il pulsante Reload.

# Se l'operatore & non funziona

In alcune installazioni di Powershell l'operatore & non funziona. L'operatore è un semplice alias per Start-Job, e si può ovviare al problema usando questo comando per esteso:

Start-Job { gtkwave waveform.vcd }

L'operatore è documentato qui.

#### Linea di errore

Nelle testbench d'esame è (di solito) presente anche una *linea di errore* che permette di identificare subito i punti in cui la testbench ha trovato un errore. Questo è particolarmente utile per scorrere lunghe simulazioni.

Queste linee sono realizzate nella testbench con una variabile reg error inizializzata a 0 ed un blocco always che risponde ad ogni variazione di error per rimetterla a 0 dopo una breve attesa. Questa attesa breve ma non nulla fa sì che basti assegnare 1 ad error per ottenere un'impulso sulla linea, facilmente visibile.

In GTKWave, possiamo trovare il segnale error tra i wire e reg del modulo testbench ( non in dut ). Mostrando questo segnale, possiamo riconoscere i punti di errore come impulsi, come nell'esempio seguente.



# Parte VI Appendice

# 28. Simulatore processore sEP8

Il processore sEP8 (Simple Educational Processor 8 bit) è un semplice processore a 8 bit, descritto nel libro Dalle porte AND OR NOT al sistema calcolatore del prof. Paolo Corsini e utilizzato nel corso per presentare i meccanismi fondamentali di un processore e la realizzazione dello stesso in hardware tramite il linguaggio Verilog. Oltre che a questi scopi didattici, è anche una buona base di partenza per esplorare architetture di processori e le loro implementazioni in hardware.

Nel repository https://github.com/Unipisa/sEP8 contiene codice utilizzabile per simulare il processore, sperimentarne estensioni etc.

#### **Attribuzione**

Il codice attualmente presente nel repository è frutto del lavoro di Nicola Ramacciotti nell'ambito della sua Tesi di Laurea in Ingegneria Informatica, dal titolo " Design e implementazione di un ambiente di simulazione e testing in Verilog per il processore sEP8".

Siamo disponibili a seguire tesi triennali sull'argomento.

## 28.1 Lancio di simulazioni

Il codice sorgente fornito include tutto il necessario per simulare l'architettura sEP8 e osservare il suo comportamento interno durante l'esecuzione di un semplice programma.

I caratteri che vediamo stampati (da A a Z ) sono l'output del programma contenuto in ROM.v. Dal file waveform.vcd, possiamo studiare il comportamento del processore.



# 28.2 Caricamento di programmi tramite ROM

In questo simulatore, il programma da eseguire è caricato tramite un modulo ROM, che viene montato a partire dall'indirizzo 24'hFF0000. Tale modulo dovrà contenere le sequenze di byte corrispondenti alle istruzioni del programma.

Un assemblatore basilare è fornito come script python, che traduce semplici programmi assembler per questo processore in un modulo ROM contenente la giusta sequenza di byte.

## Riferimenti storici: le cartucce

Questo modo di caricare i programmi non è solo una semplificazione a scopo didattico, ma ha anche degli esempi storici concreti.

Infatti operavano così le prime console, dove gli esempi più famosi sono probabilmente le console Nintendo come N64 e GameBoy. In queste console, ciascun gioco è fornito come una *cartuccia* che va inserita nella console prima di accenderla. Ciascuna cartuccia è del vero e proprio hardware che contiene la ROM dentro la quale è scritto il *programma* del gioco, e i pin che collegano la cartuccia e la console sono proprio fili di indirizzamento e dati.



In realtà, permettendo generiche letture e scritture al range di indirizzi a cui è montata la cartuccia, questa

poteva contenere diversi tipi di hardware, inclusi chip di RAM aggiuntivi, chip di memoria persistente per permettere di salvare il gioco, o ancora hardware dedicato come *rumble pak* o fotocamera.