

# SCUOLA DI INGEGNERIA INDUSTRIALE E DELL'INFORMAZIONE

# Prova finale: Reti Logiche 2023/2024

Angelo Prete angelo2.prete@mail.polimi.it 10767149

# 1. Introduzione

Il componente realizzato elabora una sequenza di dati presenti in una memoria RAM sostituendo alle celle con valore 0, interpretabili come valori assenti, l'ultimo dato letto con valore valido (non zero), con credibilità opportunamente decrementata.

```
std_logic =
                                                           o_done
                                                                      std_logic
                                                                     std_logic_vector(15 downto 0)
std_logic_vector(7 downto 0)
                     std_logic -
                                                      o_mem_addr
                                   i rst
                     std_logic =
                                                      o_mem_data
                                   i_start
                                                                     std_logic
std_logic_vector(15 downto 0) =
                                   i_add
                                                       o_mem_we
std_logic_vector(9 downto 0) •
                                   i k
                                                        o_mem_en
                                                                      std_logic
std_logic_vector(7 downto 0) =
                                   i_mem_data
```

Rappresentazione grafica dell'interfaccia del componente

Un esempio di possibile applicazione è la correzione di letture di sensori. Le letture assenti sono spesso segnalate memorizzando il valore 0 in memoria.

Nei paragrafi successivi è fornita sia una descrizione dei segnali necessari per il corretto funzionamento, sia una descrizione in maggior dettaglio del componente stesso.

# a. Collegamento a memoria RAM

Il componente deve essere collegato a una memoria RAM che ha interfaccia

```
entity ram is
    port
    (
        clk : in std_logic;
        we : in std_logic;
        en : in std_logic;
        addr : in std_logic_vector(15 downto 0);
        di : in std_logic_vector(7 downto 0);
        do : out std_logic_vector(7 downto 0)
    );
end ram;
```

Sono specificate, nella tabella seguente, le corrispondenze tra segnali della memoria RAM e del componente

|              | RAM (segnale) | Componente (segnale) | Dimensione |  |
|--------------|---------------|----------------------|------------|--|
| Enable       | en            | o_mem_en             | 1 bit      |  |
| Write enable | we            | o_mem_we             | 1 bit      |  |
| Address      | addr          | o_mem_addr           | 16 bit     |  |
| Data in      | di            | i_mem_data           | 8 bit      |  |
| Data out     | do            | o_mem_data           | 8 bit      |  |

Bisogna ricordare, infine, che RAM e componente devono condividere lo stesso segnale di clock.

# b. Collegamento all'utilizzatore

L'utilizzatore dovrà fornire al componente i seguenti segnali:

- i\_clk: segnale di clock
- i\_rst: reset asincrono del componente
- i start: segnale di avvio
- i\_add: indirizzo iniziale
- i\_k: numero di dati da processare

Il termine della computazione, invece, sarà sengnalato dal componente all'utilizzatore tramite il segnale **o\_done**.

#### c. Descrizione funzionamento

Il funzionamento ad alto livello del componente può essere diviso in tre fasi:

#### 1. Inizializzazione:

Sono forniti in input l'indirizzo iniziale, il numero di parole da processare e il segnale di start. Questa fase deve seguire un reset asincrono o la corretta terminazione di un'esecuzione precedente.

#### 2. Aggiornamento:

Il modulo processa i dati in memoria, aggiornandoli e associando loro un valore di credibilità, come descritto in dettaglio dal seguente pseudocodice

```
input: indirizzo di partenza a, numero di iterazioni k a_f \leftarrow a + 2 * k (indirizzo finale, escluso) d_l \leftarrow 0 (ultimo dato letto diverso da 0) c_l \leftarrow 0 (ultima credibilità) RAM (memoria RAM rappresentata come vettore) while a \neq a_f do d \leftarrow \text{RAM}[a] if d \neq 0 then d_l \leftarrow d RAM[a + 1] \leftarrow 31 c_l \leftarrow 31 else RAM[a] \leftarrow d_l c_l \leftarrow \max((c_l - 1), 0) RAM[a + 1] \leftarrow c_l
```

end 
$$a \leftarrow a + 2$$
 end

#### 3. Terminazione:

Il componente segnala la fine dell'esecuzione ponendo il segnale o\_done alto e rimanendo in attesa di osservare che il segnale i\_start diventi 0. Infine, il segnale o\_done assume valore 0 e la computazione viene considerata terminata.

# d. Esempio di funzionamento

In questa sezione viene presentato il risultato di una computazione in termini di aggiornamento della memoria. È inoltre introdotto uno dei possibili edge-cases: l'inizio di una sequenza con dato zero.

Siano dati in ingresso i\_k= 37, i\_add= 1158 e sia la situazione iniziale e finale della memoria RAM quella rappresentata in figura (i dati memorizzati sono evidenziati in grassetto)



Il primo dato letto ha valore zero. Non avendo letto alcun dato valido precedentemente, il valore rimane inalterato e la credibilità assegnata sarà 0.

Il dato successivo è 13, essendo non nullo riceve credibilità massima (31) e dato e credibilità vengono memorizzati come ultimi validi.

Segue una serie di dati nulli. Avendo salvato 13 come ultimo dato valido possiamo sovrascriverli, è associato ad ognuno di loro credibilità decrementata rispetto al precedente.

Quando la credibilità è stata già decrementata a 0, se il dato nella cella successiva è nullo riceve credibilità nulla, non potendola decrementare ulteriormente.

Troviamo un dato diverso da zero, 111, e quindi riceve credibilità 31. Il dato successivo è invece pari a 0 e quindi viene sovrascritto con 111 e riceve credibilità decrementata (30) rispetto all'ultima memorizzata.

# e. Osservazioni

Si noti che, nonostante le porzioni di memoria che ospitano la credibilità abbiano valore 0 sia in questo esempio sia in tutti i test forniti con la specifica, non si tratta del caso generale. È quindi necessario, qualora non si abbia la certezza che sia presente uno zero, sovrascrivere il valore di credibilità anche se il valore da assegnare è pari a 0 stesso.

La lettura della generica cella di memoria che ospiterà la credibilità al fine di verificare che abbia valore nullo, seppur possibile, è un'operazione più costosa (un ciclo di clock in più) rispetto alla semplice sovrascrittura.

# 2. Architettura

Data la semplicità del componente, non si è ritenuto necessario dividerlo in più entities. Il risultato finale è una singola entity, la cui architettura realizza una macchina a stati mediante due processi.

# a. Macchina a stati finiti (entity project reti logiche)

La macchina a stati finiti dell'architecture implementata è una macchina di Mealy. Internamente, le transizioni della FSM avvengono sul fronte di salita del clock. È composta da 6 stati, sono quindi necessari 3 Flip Flop per memorizzare lo stato corrente.



Rappresentazione ad alto livello della FSM implementata

| Nome stato implementato         | Abbreviazione |
|---------------------------------|---------------|
| STATE_IDLE                      | IDLE          |
| STATE_ACTIVE                    | ACTIVE        |
| STATE_WAIT_START_LOW            | WAIT_LOW      |
| STATE_WAIT_WORD_READ            | WAIT_RD       |
| STATE_ZERO_WORD_CHECK_AND_WRITE | CHK_ZER0      |
| STATE_WRITE_DECREMENTED_CRED    | WR_DECR       |

Tabella di mapping dei nomi degli stati tra rappresentazione grafica e implementazione

#### i. Stati

In questa sezione è presentata una descrizione delle funzioni svolte dal componente in ogni stato:

#### • STATE IDLE

La FSM si trova in questo stato quando è in attesa di iniziare una nuova computazione (sta as-

pettando che i\_start diventi pari a 1). È possibile arrivare in STATE\_IDLE sia a seguito del reset asincrono sia a seguito della fine di una computazione.

#### • STATE\_ACTIVE

In questo stato viene deciso se bisogna processare un nuovo indirizzo di memoria oppure porre temine alla computazione. Se l'indirizzo corrente è da processare, si preparano i segnali di memoria per leggere il dato memorizzato allo stesso indirizzo, altrimenti ci si sposta nello stato STATE WAIT START LOW.

#### • STATE\_WAIT\_START\_LOW

Si arriva in questo stato quando non ci sono indirizzi da processare rimanenti; la FSM lo segnala all'utilizzatore ponendo il segnale o\_done alto e aspetta che i\_start diventi 0, tornando subito dopo nello stato di STATE\_IDLE.

#### • STATE\_WAIT\_WORD\_READ

Questo stato serve per permettere alla memoria di fornire il dato richiesto negli stati precedenti; infatti, come stabilito nella specifica, la memoria ha un delay di 2 nanosecondi in lettura, solo al termine dei quali può fornire il dato richiesto.

#### • STATE\_ZERO\_WORD\_CHECK\_AND\_WRITE

Il dato è finalmente disponibile: se è uguale a 0 bisogna sovrascriverlo (comunicandolo opportunamente alla RAM) con l'ultimo dato diverso da 0 e spostarsi nello stato STATE\_WRITE\_DECREMENTED\_CRED; altrimenti, viene salvato nell'indirizzo successivo in RAM il massimo valore di credibilità (31), tornando poi nello stato STATE\_ACTIVE.

#### • STATE\_WRITE\_DECREMENTED\_CRED

Si è in questo stato a seguito della lettura un valore pari a 0 in memoria nello stato STATE\_ZERO\_WORD\_CHECK\_AND\_WRITE. Viene scritto in memoria quindi un valore di credibilità decrementato rispetto al precedente (o 0 se l'ultima credibilità era già pari a 0 stesso).

# ii. Segnali

La macchina a stati usa diversi segnali interni e per ognuno è presente un segnale con nome simile più l'aggiunta della parola *next*. La scelta progettuale di avere segnali "doppi" è stata fatta nell'ottica di avere solo Flip Flop come registri e nessun Latch.

Sono qui elencati i vari segnali con una brevissima descrizione:

• Segnali per la gestione dello stato FSM, dove state\_t è un tipo che memorizza uno dei possibili stati validi

```
current_state : state_tnext_state : state_t
```

• Memorizzazione dell'indirizzo corrente (da 16 bit)

```
current_address : std_logic_vector(15 downto 0)current_address_next : std_logic_vector(15 downto 0)
```

• Memorizzazione dell'indirizzo finale (anche questo a 16 bit)

```
end_address: std_logic_vector(15 downto 0)end_address_next: std_logic_vector(15 downto 0)
```

• Ultima parola letta diversa da zero (o zero stesso a seguito del reset asincrono)

```
last_word : std_logic_vector(7 downto 0)last_word_next : std_logic_vector(7 downto 0)
```

- Credibilità corrente (pari a zero a seguito del reset asincrono, con valore massimo 31 e minimo 0)
  - last\_credibility : std\_logic\_vector(7 downto 0)

• last\_credibility\_next : std\_logic\_vector(7 downto 0)

Sono state inoltre dichiarate costanti per evitare ripetizioni nel codice:

- zero\_word e zero\_credibility con valore zero
- max\_credibility con valore 31 (credibilità massima)

#### iii. Processi

La FSM è implementata con soli due processi

#### 1. Reset asincrono e clock

Il primo processo svolge due funzioni:

#### 1. Gestione del reset asincrono

Quando il segnale i\_rst è alto, al registro contenente lo stato corrente viene assegnato lo stato STATE\_IDLE.

#### 2. Transizioni

In presenza del fronte di salita del segnale i\_clk allora ai segnali contententi i valori correnti vengo assegnati i segnali *next*. Questa operazione aggiorna anche lo stato corrente che, essendo presente nella sensitivity list del Processo 2, lo "sveglia".

#### 2. Delta/Lambda

Il secondo processo realizza le funzioni  $\delta$  e  $\lambda$  della FSM di Mealy. Si occupa quindi di stabilire quale sarà il prossimo stato, il valore dei segnali interni e quali valori fornire in output (sia verso la memoria, sia verso l'utilizzatore del modulo).

# 3. Risultati sperimentali

#### a. Sintesi

A seguito del processo di sintesi (con target xa7a12tcpg238-2I), otteniamo i seguenti dati:

|                       | Used | Fixed | Available | Util% |
|-----------------------|------|-------|-----------|-------|
| Slice LUTs*           | 78   | 0     | 134600    | 0.06  |
| LUT as Logic          | 78   | 0     | 134600    | 0.06  |
| LUT as Memory         | 0    | 0     | 46200     | 0.00  |
| Slice Registers       | 51   | 0     | 269200    | 0.02  |
| Register as Flip Flop | 51   | 0     | 269200    | 0.02  |
| Register as Latch     | 0    | 0     | 269200    | 0.00  |
| F7 Muxes              | 0    | 0     | 67300     | 0.00  |
| F8 Muxes              | 0    | 0     | 33650     | 0.00  |

Notiamo che il componente usa:

- 51 Flip Flop (0.02%), tutti e soli i previsti. Nell'implementazione del componente viene salvato l'indirizzo di fine per controllare se ci sono indirizzi rimanenti: una scelta alternativa, che avrebbe permesso di ridurre ulteriormente il numero di Flip Flop, è quella di salvare k e decrementarlo.
- 78 Look-Up Table (0.06%)
- **0** Latches, risultato ottenuto grazie ad opportune scelte progettuali descritte precedentemente.

La percentuale di occupazione degli elementi disponibili è molto bassa: la logica implementata è molto semplice e non necessita di ampi spazi di memoria o complesse operazioni.

#### b. Simulazioni

Il componente è stato sottoposto sia testbeches scritti a mano per verificare il suo comportamento in presenza dei vari edge-cases, sia a testbenches generati automaticamente per controllare il corretto funzionamento su vari range di memoria.

# i. Testbench fornito ed esempi specifica

Il primo testbench ad essere stato provato è quello presente nei materiali per il progetto, funziona correttamente e rispetta i vincoli di clock.

Inoltre, sono stati scritti test per controllare che il componente funzioni correttamente anche con tutti gli altri esempi forniti nella specifica.

#### ii. Start multipli

Questo testbench è stato scritto per verificare il corretto funzionamento del componente in esecuzioni successive senza reset intermedi.

Ciò ha permesso di controllare che i segnali interni vengano correttamente ripristinati quando inizia una nuova esecuzione (i\_start pari a 1).

# iii. Dato iniziale nullo

Si è testato il corretto funzionamento in condizioni simili a quelle dell'esempuo di funzionamento (Section d.).

#### iv. Credibilità nulla

Con questo testbench si è voluto testare che la credibilità, qualora sia stata decrementata fino a zero, rimanga pari a zero se i nuovi dati letti hanno valore nullo.

# v. Reset durante la computazione

Grazie a questo test si è mostrato il funzionamento del componente quando il segnale di reset viene portato alto durante una computazione. Il test è stato utile per rimuovere problemi dovuti ad un'errata inizializzazione dei segnali.

# vi. Reset durante accesso a memoria

Come nel testbench precedente, si è verificato il funzionamento a seguito di reset, questa volta durante una lettura e poi una scrittura in memoria.

# 4. Conclusioni

Il componente, oltre a rispettare la specifica, è stato implementato in modo efficiente. È stata posta particolare attenzione a ridurre il numero di stati e della durata delle computazioni, senza sacrificare allo stesso tempo la leggibilità del codice.

Come già anticipato, un possibile miglioramento per ridurre l'uso di Flip Flop è quello di cambiare la verifica di fine della computazione, cambiamento che però andrebbe ad aumentare l'uso di Look-up Table per svolgere l'operazione di decremento del k (memorizzato al posto di last\_address, utilizzando quindi 6 registri in meno). Questo permetterebbe anche di eliminare il segnale end\_address\_next a favore di un segnale k\_next, risparmiando altri 6 registri.

Un altro miglioramento che ridurrebbe ulteriormente il numero di registri è la memorizzazione della credibilità attraverso segnali di tipo std\_logic\_vector(5 downto 0) invece di queli a 8 bit utilizzati nell'implementazione attuale. Questa modifica permetterebbe di risparmiare registri.

Oltre a funzionare nelle simulazioni Behavioral e Post-Synthesis Functional, il componente ha il comportamento richiesto anche quando viene testato in simulazioni Post-Synthesis Timing.