

# RISC-V - Computerarchitektur

# Projekt HEIRV32



Orientierung: Informatik und Kommunikationssysteme (ISC)

Kurs: Computerarchitektur (CAr) Verfasser: Silvan Zahno, Axel Amand

Datum: 3. Juli 2023

Version: v1.2



## Inhaltsverzeichnis

| 1   | Einführung         1.1 Multi-cycle HEIRV32 Mikroprozessor | <b>2</b><br>3 |  |  |  |  |  |  |
|-----|-----------------------------------------------------------|---------------|--|--|--|--|--|--|
| 2   | Spezifikation 2.1 Funktionen                              | <b>4</b><br>4 |  |  |  |  |  |  |
|     | 2.2 Support für zusätzliche Befehlen                      | 5             |  |  |  |  |  |  |
|     | 2.3 HDL-Designer Projekt                                  | 6             |  |  |  |  |  |  |
| 3   | Komponenten                                               | 8             |  |  |  |  |  |  |
|     | 3.1 EBS3 FPGA-Platine                                     | 8             |  |  |  |  |  |  |
|     | 3.2 Knöpfe und LEDs                                       | 8             |  |  |  |  |  |  |
|     | 3.3 Zusätzliche LEDs                                      | 9             |  |  |  |  |  |  |
|     | 3.4 Optionale Karten                                      | 9             |  |  |  |  |  |  |
| 4   | Bewertung                                                 | 10            |  |  |  |  |  |  |
| 5   | Leitfaden                                                 | 11            |  |  |  |  |  |  |
|     | 5.1 Allgemeine Architektur                                | 11            |  |  |  |  |  |  |
|     | 5.2 Control Unit                                          | 15            |  |  |  |  |  |  |
|     | 5.3 Simulation                                            | 17            |  |  |  |  |  |  |
|     | 5.4 Code                                                  | 18            |  |  |  |  |  |  |
|     | 5.5 Tips                                                  | 19            |  |  |  |  |  |  |
| Lit | eratur                                                    | 20            |  |  |  |  |  |  |
| Ak  | Akronyme                                                  |               |  |  |  |  |  |  |



#### Einführung 1

Ziel des Projekts ist es, das erworbene Wissen am Ende des Semesters direkt mit Hilfe eines praktisches Beispieles anzuwenden. Es geht darum, einen reduzierten RISCV Prozessor zu erstellen, um einen kleines Assemblerprogram auszuführen. Der Prozessor kann simuliert und auf einer FPGA-Hardware implementiert werden. Die Verbindung mit der Aussenwelt kann über Knöpfe und Leds erfolgen. Dieses Prozessorsystem ist in der Abbildung 1 dargestellt.



Abbildung 1: Hardwareaufbau des Systeme (EBS3)

Die Aufgabe besteht aus einer klar definierten minimalen Spezifikation (Kapitel 2).

Studenten können optional weitere Funktionen hinzufügen: ein Kommunikationsprotokoll implementieren, andere Erweiterungsboards zu verwenden ...



#### Multi-cycle HEIRV32 Mikroprozessor 1.1

Die Ein-Zyklus-Architektur, die in einem früheren Labor vervollständigt wurde, ermöglicht eine einfache Annäherung an die RISCV Architektur. Es bringt jedoch mehrere Probleme mit sich:

- Programm- und Datenspeicher sind getrennt
  - die Implementierung erfordert zwei Chips für ein einzelnes Programm
- auf den Speicher wird asynchron zugegriffen
  - die auf dem Markt verkauften Speicher unterstützen nur den synchronen Zugriff auf Daten
  - der Platz, den die Decodierlogik einnimmt, wird beträchtlich : HEIRV32 single-cycle unterstützte nur 2<sup>5</sup> Befehle und füllte somit den FPGA aus
  - die Kapazitäten dieser Speicher würden weit unter den heute verfügbaren liegen
- die Geschwindigkeit des Prozessors wird durch den längsten Befehl begrenzt
  - Verbesserungen sind nur noch durch die Weiterentwicklung der Transistortechnologie und die Verkürzung der Verkabelungs-Längen möglich

Grundsätzlich bestehen die Anweisungen aus fünf Schritten:

- Fetch: die Anweisung wird aus dem Speicher abgerufen
- Decode: die Anweisung wird dekodiert : funct3, funct7, ALU- und Quelleneinstellungen ...
- Execute: die angegebene Operation wird ausgeführt
- Memory: greift auf bestimmte Daten im Speicher zu (optional)
- Writeback: speichert Daten im Speicher (optional)

Da nicht alle Anweisungen die Ausführung jedes einzelnen Schritts erfordern, können diese Schritte durch einen Taktzyklus getrennt werden ⇒ Multi-Cycle. Auf diese Weise kann die Taktfrequenz erhöht werden, die Geschwindigkeit wird nun durch den langsamsten Schritt begrenzt.

Kürzere Befehle die nur 3-4 Schritte erfordern profitieren von einer schnelleren Verarbeitung:

Die verwendeten Speicher sind nun synchron.



Diese Architektur ebnet auch den Weg für die Implementierung eines Pipeline-Systems (d. h. bei jedem Taktzyklus wird ein Befehl geladen), für die Vorhersage von Verzweigungen und für jede andere Technik, die den allgemeinen Betrieb des Prozessors beschleunigt.

Nur Multi-Cycle wird hier behandelt.



## 2 Spezifikation

## 2.1 Funktionen

Die Basisfunktionen sind wie folgt definiert:

- Die FPGA beinhaltet einen 32-Bit, multi-cycle RISCV Mikroprozessor deren Funktionsweise durch Simulation und anschliessenden Einsatz auf einem physischen Chip bestätigt wird.
- Der implementierte Microprozessor muss mindestens folgende Befehle unterstützen:
  - R-Type Befehle: add, sub, and, or, slt
  - I-Type Befehle: addi, andi, ori, slti
  - Speicher Befehle: lw, sw
  - Sprung Befehle: beq, jal
- Mithilfe der unterstützten Befehlen schreibe Sie einen Assemblercode, der in der Lage ist:
  - erkennt, wenn die Tasten auf der Karte Knöpfe-LED-LCD Platine [25] gedrückt werden und handelt entsprechend.
  - die LEDs auf der Karte Knöpfe-LED-LCD Platine [25] kontrollieren
  - demonstrieren der Funktionen des Prozessors

Um die LEDs zu steuern, schreiben Sie einfach das Register x30.

Um die Tasten zu lesen, lesen Sie einfach das Register x31. Ein Schreibvorgang in dieses Register ändert seinen Wert nicht.



Die genaue der Funktion der 2 Knöpfe und 8 LEDs ist den Studenten überlassen.



Abbildung 2: RISCV Hardware Schaltung



## Support für zusätzliche Befehlen



Mithilfe von Zusatzfunktionen können einige Extrapunkte erarbeitet werden.

Optional ist es möglich folgende Elemente zusätzlich zu implementieren:

- Den ALU-Block grafisch zu reimplementieren
- Den Immediate-Block grafisch zu implementieren
- Einen Code zu schreiben, der mit den Optionale Karten oder den Chips auf dem Board arbeiten kann:
  - Steuerung eines Motors durch Erzeugung eines PWMs
  - Textübertragung durch UART
  - Verwaltung einer seriellen RGB-LED vom Typ WS2812



## 2.3 HDL-Designer Projekt

Ein vordefiniertes HDL-Designer Projekt kann im Cyberlearn heruntergeladen oder geklont von Git werden. Die Dateistruktur des Projektes sieht folgendermassen aus:

```
did\_heirv
+--Board/
                       # Project and files for programming the fpga
   +--concat/
                      # Complete VHDL file including PIN-UCF file
   +--hds/
                      # Board-related VHDL files
   +--ise/
                      # Xilinx ISE project
   +--diamond/
                      # Lattice Diamond project
+--HEIRV32/
                      # Library for the components of the student solution
                      # Library for the simulation testbenches
+--HEIRV32\_test/
+--Libs/
                      # External libraries which can be used e.g. gates, io, sequential
+--Prefs/
                      # HDL-Designer settings
+--Scripts/
                      # HDL-Designer scripts
+--Simulation/
                     # Modelsim simulation files
                      # Folder with additional documents relevant to the project
+--doc/
   +--Board/
                      # All schematics of the hardware boards
   +--Components/
                     # All data sheets of hardware components
   +--HEIRV32\_MC\-x \# This doc
                       # Dedicated assembler for HEIRV32 (doc and execs)
+--heirv32\-asm/
+--img/
                       # Pictures
```



Der Pfad des Projektordners darf keine Leerzeichen enthalten.



Im Projektordner doc/ können viele wichtige Informationen gefunden werden. Datenblätter, Projektbewertung sowie Hilfsdokumente für HDL-Designer um nur einige zu nennen.

Die Signale des Top-Levels welche zu implementieren sind, sehen wie folgt aus:



Abbildung 3: Leere Toplevel Schaltung



Die verfügbaren Signale sind wie folgt:

- btns: Werte der Tasten S0 und S1 auf der Knöpfe-LED-LCD Platine [25]-Karte. Dies werden mit dem Register x31 verlinkt.
- clk: Systemclock, getaktet mit 50 MHz für die EBS3 boards und 66 MHz für die EBS2 boards.
- en: Prozessoraktivierungssignal. Wenn dieses Signal auf '1' gesetzt ist, läuft der Prozessor normal, ansonsten stoppt er. Auf dem FPGA-Board schaltet der Knopf S4 das en-Signal ein und aus, während der Knopf S3 die Step-by-Step Funktion ermöglicht (erkennt, wenn der Knopf gedrückt wird und aktiviert das en-Signal während einer Taktperiode).
- rst: System-Reset, asynchron.
- dbg\_leds: Debug-Signal, ermöglicht die Aktivierung von LEDs je nach Systemzustand. Sind nicht an das Register x30 gebunden.
- leds: LEDs auf der Knöpfe-LED-LCD Platine [25] werden mit dem Register x30 verlinkt.

Die Bibliotheken HEIRV32 und HEIRV32\_MC enthalten einige vorgefertigte Blöcke, um die Entwicklung zu leiten und zu unterstützen:

- HEIRV32\_MC
  - **controlUnit**: Block für die Dekodierung von Anweisungen.
  - heirv32\_mc: Top-level
  - instructionDataManager: Programmspeicher, der Anweisungen und Daten vereint und gelesen und geschrieben werden kann.
- HEIRV32
  - ALU: eine Version des ALU, welcher die Funktionen: Addition, Subtraktion, AND, OR und SLT implementiert.
  - buffer\*Enable: getakteter Buffer (Flip-Flops) mit Enable-Eingang.
  - extend: Anweisungserweiterungsblock für Tests, der die Anweisungen I, S, B und J unterstützt.
  - mux4To1ULogVec: mux 4-to-1 of std\_ulogic\_vector.
  - registerFile: Block zur Verwaltung der 32 Register, wobei x31 durch den Vektor btns - Register zum Lesen der Tasten - und x30 durch den Vektor leds - Register zum Schreiben der LEDs - ersetzt wird.

Die Board-Bibliothek enthält die Signalformungslogik, die für den Einsatz der Schaltung auf einer FPGA vorgesehen ist.

Die Bibliothek HEIRV32\_test enthält einen Tester, der mit dem Code Simulation/code\_sim.s verknüpft ist.



Der Simulator ist standardmässig auf EBS3 eingestellt. Um dies zu ändern, öffnen Sie den Block heirv32\_mc\_tb und ändern Sie die Konstante constant c\_clockFrequency : real := 50.0E6; in constant c\_clockFrequency : real



## 3 Komponenten

Das System besteht aus drei verschiedenen Hardwareplatinen, die in der Abbildung 1 zu sehen sind.

- eine FPGA Entwicklungskarte, siehe Abbildung 4.
- Eine Steuerkarte mit 4 Tasten und 8 LEDs, siehe Abbildung ??.
- Zwei PMod-LED-Karten, siehe Abbildung 6.

## 3.1 EBS3 FPGA-Platine

Die Hauptplatine ist die FPGA-EBS 3 Laborentwicklungsplatine der Schule. Diese beherbergt eine Lattice LFE5U-25F FPGA und verfügt über viele verschiedene Schnittstellen (Universal Asynchronous Receiver Transmitter (UART), Peripheral Module (PMod), PPT, Ethernet). Der benutzte Oszillator erstellt ein Taktsignal (clock) mit einer Frequenz von  $f_{clk} = 100MHz$ , intern durch PLL auf  $f_{clk} = 50MHz$  reduziert.



Abbildung 4: FPGA Platine

## 3.2 Knöpfe und LEDs

Die Platine mit den Knöpfen und LEDs [25] wird an die motherboard angeschlossen. Sie hat 4 Tasten und 8 LEDs, die im Design verwendet werden können. Falls gewünscht kann diese Platine mit einer LCD Anzeige ausgestattet werden [26] [3].



Abbildung 5: Knöpfe-LED-LCD Platine [25]



#### 3.3 Zusätzliche LEDs

Es ist möglich, die Anzahl der LEDs für Debugging mithilfe von dedizierten Erweiterungsboards zu erweitern. Es ist auch möglich, weitere Erweiterungsplatten anzuschliessen (Abstandssensor, Open-Drain-Ausgänge ...).



Abbildung 6: PMod LEDs

#### 3.4 **Optionale Karten**

Um die Funktionalität Ihrer Schaltung zu erweitern, können Sie Erweiterungsplatinen verwenden. Ihre Dokumentation finden Sie unter dem Ordner doc/ext\_boards.







Abbildung 7: Inputs: PMod-BTN [12] [13], PMod-CON1 [14] [15], PMod-CON3 [16] [17]





Abbildung 8: Outputs: PMod-OD1 [19] [20], PMod-BB [10] [11]





Abbildung 9: I/Os: PMod-MAXSONAR [18] [22], PP-MATRIX [21]



## 4 Bewertung

Im Ordner doc/ zeigt die Datei **evaluation-bewertung-riscv.pdf** das detaillierte Bewertungsschema, Tabelle 1.

Die Schlussnote beinhaltet den Bericht, den Code sowie eine Präsentation eurerseits des Systems.

| Evaluierte Aspekte            | Punkte |     |
|-------------------------------|--------|-----|
| Bericht                       |        | 55  |
| Einleitung                    | 3      |     |
| Spezifikation                 | 5      |     |
| Entwurf                       | 20     |     |
| Verifizierung und Validation  | 10     |     |
| Integration                   | 9      |     |
| Schlussfolgerung              | 3      |     |
| Formale Aspekte des Berichtes | 5      |     |
| Funktionalität der Schaltung  |        | 30  |
| Qualität der Lösung           |        | 10  |
| Präsentation                  |        | 10  |
| Total                         |        | 105 |

Tabelle 1: Bewertungsraster



Das Bewertungsraster gibt bereits Hinweise über die Struktur des Berichtes. Für einen guten Bericht konsultieren Sie das Dokument "'Wie verfasst man einen Projektbericht?" [2]

HEI-Vs / ZaS, Ama / 2023



## 5 Leitfaden

Um mit dem Projekt zu beginnen, kann folgendermassen vorgehen werden:

- Lest die obigen Spezifikationen und Informationen genau durch.
- Schaut euch die Hardware mit dem vorinstallierten Programm und das gegeben HDL-Designer Projekt.
- Stöbert durch die Dokumente im Ordner doc/ eures Projektes.
- Analysiert im Detail die Blöcke welche bereits vorhanden bzw. vorgegeben sind.
- Entwickelt ein detailliertes Blockdiagramm. Die Signale und deren Funktionen solltet Ihr erklären können.
- Implementierung und Simulation der verschieden Blöcken.
- Testen der Lösung in der Simulation und finden etwaiger Fehler 🦹.
- Schreiben und verteilen Sie Ihren eigenen Code

## 5.1 Allgemeine Architektur

Schlagen Sie zunächst eine Architektur vor, die keinen Block implementiert und sich um das Multi-Cycle-Prinzip dreht:



Abbildung 10: RISCV-Pipeline

### Instruktion lw

Das Design dreht sich um den Programmspeicher, indem es über die Anweisung **Iw** nachdenkt, eine Anweisung, die die fünf Schritte der Pipeline erfordert:

• Fetch: der Programm-Counter ortet Informationen aus dem Speicher und erzeugt so einen data (RD)- und instruction (instr)-Bus. Die Busse sind sequentiell: RD wird bei jedem Clockschlag aus dem Speicher gelesen, während Instr. nur dann aktualisiert wird, wenn der IRWrite-Eingang auf "1"gesetzt ist.



Abbildung 11: Fetch

- Decode:
  - die Basisadresse ist im Instr-Bus enthalten, Bits 19 downto 15. Sie werden als Adresse verwendet, um das Register RD1 auszuwählen.



- der unmittelbare Wert ist in den Bits 31 downto 20 gegeben, dessen Vorzeichen erweitert werden muss. Dazu kann man mit dem Block extend über zwei Kontrollbits festlegen, ob der Wert mit 12, 13 oder 21 Bits codiert wird und somit das Vorzeichen des Wertes erweitern.
- die Register (hier RD1) werden bei jedem Clockschlag aktualisiert.



Abbildung 12: Decode

• Execute: der unmittelbare Wert wird dem über die ALU ausgelesenen Register hinzugefügt, um die Adresse zu bestimmen, auf die im Speicher zugegriffen werden soll. Mit dem Output-Flip-Flop wird dieser Schritt noch einmal vom Rest der Pipeline getrennt.



Abbildung 13: Execute

 Mem. Access: der berechnete Wert wird verwendet, um den Speicher neu zu lesen. Zu diesem Zweck wird ein Multiplexer hinzugefügt, der zwischen dem PC oder dem ALU-Wert wählt, gesteuert durch das Signal AdrSrc.



Abbildung 14: Mem. Access



• Write Back: der letzte Schritt ist um das Zielregister zu schreiben, das durch die Bits 11 downto 7 des Instr-Busses angegeben wird. Das Signal RegWrite lädt beim nächsten Clockschlag das von A3 angezeigte Register. Dieser Wert kann wie hier aus dem Ergebnis der ALU oder aus den Daten selbst stammen. Ein Multiplexer, ist hinzugefügt, der durch das Signal ResultSrc gesteuert wird:



Abbildung 15: Write Back

Parallel zu all dem muss der Programmzähler inkrementiert werden. Dies wurde in der Single-Cycle-Architektur mit einem separaten Addierer gemacht. Hier ist es jedoch möglich, die ALU während des Fetch-Schritts zu verwenden, da keine Berechnung erforderlich ist. Zur Steuerung der ALU-Quellen werden zwei Multiplexer hinzugefügt, die von den Signalen AdrSrcA und AdrSrcB gesteuert werden. Hier wird der PC auf A geladen, während B den Wert 4 lädt, wobei der ALU auf Addition eingestellt ist. Da die Berechnung sofort verwendet werden soll (PC muss zur späteren Verwendung gespeichert werden), wird das Flip-Flop des ALU-Ergebnisses umgangen und das Signal zum Ausgangsmultiplexer addiert. Der von PCWrite gesteuerte Enable-Eingang ist auf '1' gesetzt, wodurch PCNext (= PC + 4) auf dem PC gespeichert werden kann:



Abbildung 16: PC + 4

Steuersignale werden von dem weiter unten angesprochenen Block controlUnit erzeugt.

## Signal en

Das Signal en ermöglicht es, die Arbeit des Prozessors zu unterbrechen. ALLE Schritte der Pipeline müssen blockiert werden, wenn dieser Eingang auf '0' gesetzt ist. Ändern Sie Ihre Architektur,



um dieses Signal dort zu berücksichtigen, wo es benötigt wird.

### Instruktion sw

In der gleichen Argumentation erweitern Sie das System, um sw zu unterstützen:

- Fetch: liest die Anweisung aus dem Speicher, auf den PC zeigt.
- Decode: lädt das Register, das die Basisadresse angibt, auf RD1. Lädt ausserdem das Register, das die zu sichernde Information enthält, auf RD2.
- Execute: fügt den unmittelbaren Wert über die ALU zur Basisadresse hinzu, um auf die Speicheradresse zu verweisen.
- Write Back: speichert den Wert mithilfe des Signals MemWrite im Speicher.

## Instruktion R- und I-Type

Überlegen Sie dann, welche Pfade für Anweisungen vom Typen R und I benötigt werden.

## Instruktion beq

Fügen Sie die Anweisung beq hinzu, die zwei Register vergleicht und den PC ändert, wenn diese gleich sind:

- Fetch: liest die Anweisung aus dem Speicher, auf den PC zeigt.
- Decode: lädt die beiden zu vergleichenden Register. Da die ALU nicht verwendet wird, kann die Adresse bei einem Sprung berechnet werden. Allerdings hat sich der PC schon inkrementiert. Daher muss im vorherigen Schritt ein alter PC-Wert gespeichert werden, um ihn in die Quelle A des ALUs zu laden. Quelle B ist der Sofortwert.
- Execute: subtrahiert die beiden Register und setzt das Signal zero auf '1', wenn das Ergebnis 0 ist. In diesem Fall setzt der Kontrollblock das Signal PCWrite auf '1', ein Signal mit dem der Result-Bus auf den PC geladen wird. Damit wird der Sprungwert (ALU-Ausgang aus dem vorherigen Schritt) geladen (a == b, PC = PC + imm.). Andernfalls bleibt PCWrite auf '0' und PC wird nicht geändert (a! = b, PC = PC + 4).

## Instruktion jal

Fügen Sie schliesslich die Anweisung jal hinzu, die nach dem Speichern der Rücksprungadresse springt:

- Fetch: liest die Anweisung aus dem Speicher, auf den PC zeigt.
- Decode : berechnet die Sprungadresse.
- Execute : speichert die Sprungadresse als neuen PC, während sie die im Zielregister zu speichernde Rücksprungadresse berechnet.
- Write Back : speichert die Rücksendeadresse im Zielregister.



#### 5.2 **Control Unit**

Es fehlt noch ein Kontrollblock, der den aktuellen Schritt gemäss der oben genannten Pipeline verfolgt und die verschiedenen Kontrollsignale erzeugt. Um die Arbeit zu vereinfachen, trennen Sie die Signalerzeugung in drei verschiedene Blöcke:



Abbildung 17: Control unit



Die Anweisungen des RV32I-Sets sind in 6 Typen unterteilt: R, I, S, B, U und J. Es ist logisch, dass zwei Anweisungen desselben Typs die gleiche Verarbeitung erfahren. Wenn dies nicht der Fall wäre, müsste jede Anweisung vom controlUnit-Block unterschiedlich behandelt werden. Allein für das Basic-Set gibt es 40 davon, Set mit dem man kein Betriebssystem betreiben kann!

### **ALU Block**

Die ALU realisiert die arithmetischen und logischen Funktionen gemäss der folgenden Tabelle:

| ALUControl | Operation     |  |
|------------|---------------|--|
| 000        | add           |  |
| 001        | substract     |  |
| 010        | AND           |  |
| 011        | OR            |  |
| 101        | SetLesserThan |  |
| Others     | _             |  |

Tabelle 2: Bestelltabelle für den ALU-Block



## **Extend Block**

Der Block extend stützt sich auf den von immSrc vorgegebenen Anweisungstyp, um das Vorzeichen des unmittelbaren Wertes zu extrahieren und zu erweitern:

| immSrc | Туре |
|--------|------|
| 00     | 1    |
| 01     | S    |
| 10     | В    |
| 11     | J    |

Tabelle 3: Bestelltabelle für den Extend-Block

## **ALUOp Signal**

Um Doppelungen zu vermeiden, wird  $op_{[6:0]}$  nicht in den Block **aluDecoder** übernommen. Stattdessen erzeugt mainDecoder das kleinere Signal ALUOp, das mehrere Arten von Anweisungen zusammenfasst, die nach einem willkürlichen Code auf die gleiche Weise arbeiten. Beispielsweise führen addi x2, x3, 30 und add x2, x3, x4 beide eine Additionsoperation aus. Die Anweisungen I und R sind daher unter demselben Code zusammengefasst.

Die folgende Tabelle zeigt diese Idee der Vereinheitlichung und listet die speziellen Kästchen für die Dekodierung auf:

| ALUOP | Funct3 | $Op_5 / funct7_5$ | instr    | $ALUControl_{[2:0]}$ |
|-------|--------|-------------------|----------|----------------------|
| 00    |        |                   | lw,sw    | 000 (add)            |
| 01    |        |                   | beq      | 001 (sub)            |
| 10    | 000    | 00, 01, 10        | add/addi | 000 (add)            |
| 10    | 000    | 11                | sub      | 001 (sub)            |
| 10    | 010    |                   | slt/slti | 101 (slt)            |
| 10    | 110    |                   | or/ori   | 011 (or)             |
| 10    | 111    |                   | and/andi | 010 (and)            |

Tabelle 4: Dekodierungstabelle des Blocks ALUDecoder



## 5.3 Simulation

Um die gesamte Schaltung zu simulieren, steht Ihnen unter HEIRV32\_test/heirv32\_mc\_tb ein Prüfstand zur Verfügung. Sie führt den Code aus, der unter Simulation/code\_sim.s angegeben ist.

### Verständnis

Öffnen und analysieren Sie den gegebenen Code. Welche Anweisungen werden ausgeführt? Ist er ein guter Kandidat, um die Funktionsweise Ihres Prozessors zu bestätigen?

## **Automatisierung von Tests**

Der Tester HEIRV32\_test/heirv32\_mc\_tester zeigt in der Simulation ein Signal testInfo an, das theoretisch Auskunft darüber gibt, welcher Befehl gerade ausgeführt werden sollte. Im Falle eines nicht funktionierenden Prozessors ist diese Information wertlos.

Es ist auch möglich, die Tests mithilfe des folgenden Verfahrens zu automatisieren:

```
procedure checkProc(
1
        msg :
                          string;
2
                         unsigned(31 downto 0);
        AdrArg:
3
        ALUControlArg : std_ulogic_vector(2 downto 0);
4
        {\tt ALUSrcAArg:} \qquad \textbf{std\_ulogic\_vector} (1 \ \textbf{downto} \ \theta);
5
        ALUSrcBArg:
                          std_ulogic_vector(1 downto 0);
6
        IRWriteArg :
                          std_ulogic;
7
        PCWriteArg:
                          std_ulogic;
8
                          std_ulogic;
        adrSrcArg :
9
        immSrcArg :
                          std_ulogic_vector(1 downto 0);
10
        memWriteArg :
                          std_ulogic;
11
        regwriteArg :
                          std_ulogic;
12
        resultSrcArg : std_ulogic_vector(1 downto 0)) is
13
      begin
14
15
      end procedure checkProc;
16
    Sie wird in der Testerschleife wie folgt verwendet:
```

```
checkProc("Addi, addr. 0x00 - decode", x"00000004", "000", "01", "01", '0', '0',
'0', "00", '0', '0', "00");
```

Vervollständigen Sie den Tester mit den Werten, die Sie erwarten.

Verifizieren Sie, dass Ihre Schaltung funktioniert.



## **5.4** Code

Sobald die Architektur durch eine Simulation bestätigt wurde, kann man die FPGA flashen.

Hierfür enthält die Bibliothek Board den Top-Level. Der geflashte Code ist der unter Simulation/code mc ebs3 bram.txt, der nichts anderes als die Kompilierung des Codes Simulation/code\_mc\_ebs3.s ist.



Der angegebene Code Simulation/code\_mc\_ebs3.s ist leer, Simulation/code\_mc\_ebs3\_bram.txt dagegen nicht. Es liegt an Ihnen, einen neuen Code zu schreiben, sobald die Funktion der Schaltung bestätigt wurde.

## Prüfung durch Äquivalenz

Flashen Sie zunächst den vorgegebenen Testcode und vergewissern Sie sich, dass er auf dieselbe Weise funktioniert wie der bereits auf dem Board verfügbare.

Lesen Sie dazu das Dokument doc/Board\_LFE5U-25F.pdf.

## Benutzerdefinierter Code

Wenn die Schaltung funktioniert, schreiben Sie in Simulation/code\_mc\_ebs3.s einen eigenen Code, der auf das Drücken der beiden Knöpfe reagiert und die LEDs zum Leuchten bringt:

- Wenn Sie einen Wert in das Register x30 schreiben, werden die LEDs eingeschaltet. Die LED 0 entspricht Bit 0, LED 1 entspricht Bit 1 ...
- Das Register x30 zu lesen, gibt den aktuellen Status der leds an.
- Das Lesen der Schaltflächen erfolgt durch das Lesen des Registers x31. Bit 0 entspricht der Schaltfläche S0, Bit 1 der Schaltfläche S1.
- Das Schreiben des Registers x31 verändert es nicht.



Vergessen Sie nicht, Ihren Code mit der Software HEIRV32-ASM, die im gleichnamigen Ordner enthalten ist, neu zu kompilieren, BEVOR Sie mit der Synthese der Schaltung beginnen!



## **5.5** Tips

Anbei noch einige zusätzlichen Tips um Probleme und Zeitverlust zu vermeiden:

- Teilen Sie das Problem in verschiedene Blöcke auf, benutzt hierzu das leere Toplevel Dokument. Es ist ein ausgeglichener Mix zwischen Anzahl Komponenten und Komponentengrösse empfohlen.
- Analysieren Sie die verschiedenen Ein- und Ausgangssignale, ihre Arten, ihre Grössen ... Sollte man sich teilweise auf die Datenblätter und die Dokumentation beziehen.
- Beachten Sie bei der Erstellung des Systems das DiD Kapitel "Methodologie für die Entwicklung von digitalen Schaltungen (MET)" [6]
- Halten Sie sich an die vorgeschlagene inkrementelle Vorgehensweise. Benutzen Sie die Tests so früh wie möglich.
- Speichern und dokumentieren Sie Ihre Zwischenschritte. Nicht funktionierende Architekturen, grundlegende Codes zum Testen der Architektur …sind allesamt Material, das dem Bericht hinzugefügt werden kann.



Vergessen Sie nicht Spass zu haben 😊.







## Literatur

- [1] Christophe Bianchi, François Corthay und Silvan Zahno. *Comment Rédiger Un Rapport de Projet?* 2021.
- [2] Christophe Bianchi, François Corthay und Silvan Zahno. Wie Verfasst Man Einen Projektbericht? 2021.
- [3] Electronic Assembly. Datasheet: DOGM Graphics Series 132x32 Dots. 2005.
- [4] Five Embeddev. RISC-V Quick Reference. Five EmbedDev. 2022. URL: https://www.five-embeddev.com//quickref/tools.html (besucht am 04.06.2022).
- [5] François Corthay, Silvan Zahno und Christophe Bianchi. *Méthodologie de Conception de Cicuits Numériques*. 2021.
- [6] François Corthay, Silvan Zahno und Christophe Bianchi. *Methodologie Für Die Entwicklung von Digitalen Schaltungen*. 2021.
- [7] Sarah L Harris und David M Harris. "Digital Design and Computer Architecture RISC-V Edition". In: Digital Design and Computer Architecture. First Edition. Elsevier, 2022, IBC1–IBC2. ISBN: 978-0-12-820064-3. DOI: 10.1016/B978-0-12-820064-3. 00025-8. URL: https://linkinghub.elsevier.com/retrieve/pii/B9780128200643000258 (besucht am 30.08.2022).
- [8] Digilent Inc. Pmod 8LD Reference Manual. 2015.
- [9] Digilent Inc. Pmod 8LD Schematics. 2008.
- [10] Digilent Inc. Pmod BB Reference Manual. 2016.
- [11] Digilent Inc. Pmod BB Schematics. 2007.
- [12] Digilent Inc. Pmod BTN Reference Manual. 2016.
- [13] Digilent Inc. Pmod BTN Schematics. 2005.
- [14] Digilent Inc. Pmod CON1 Reference Manual. 2015.
- [15] Digilent Inc. *Pmod CON1 Schematics*. 2015.
- [16] Digilent Inc. Pmod CON3 Reference Manual. 2016.
- [17] Digilent Inc. Pmod CON3 Schematics. 2005.
- [18] Digilent Inc. Pmod MAXSONAR Reference Manual. 2015.
- [19] Digilent Inc. Pmod OD1 Reference Manual. 2016.
- [20] Digilent Inc. Pmod OD1 Schematics. 2006.
- [21] Laurent Gauch. Schematic: HEB Dot Matrix v1.0. 2003.
- [22] Maxbotix. LV-MAXSONAR-EZ Datasheet. 2021.
- [23] David A Patterson und John L Hennessy. *Computer Organization and Design RISC-V Edition*. Second Edition. Elsevier, 2021. ISBN: 978-0-12-820331-6.
- [24] Silvan Zahno. Schematic: FPGA-EBS v2.2. 2014.
- [25] Silvan Zahno. Schematic: Parallelport HEB LCD V2. 2014.
- [26] Sitronix. Datasheet Sitronix ST7565R 65x1232 Dot Matrix LCD Controller/Driver. 2006.
- [27] Andrew Waterman, Krste Asanovic und Five Embeddev. RISC-V Instruction Set Manual, Volume I: RISC-V User-Level ISA. Five EmbedDev. 2019. URL: https://www.five-embeddev.com//riscv-isa-manual/latest/riscv-spec.html (besucht am 04.06.2022).
- [28] Xilinx. Datasheet Spartan-3E FPGA Family. 2008.
- [29] Xilinx. Spartan-3 FPGA Family. Xilinx. URL: https://www.xilinx.com/products/silicon-devices/fpga/spartan-3.html (besucht am 20.11.2021).
- [30] Silvan Zahno. "CAr RISC-V Summary (RISC-V)". 2022.



## **A**kronyme

```
FPGA Field Programmable Gates Array. 2–4, 7, 8, 19

LCD Lquid Crystal Display. 8, 9

LED Light Emitting Diodes. 4, 5, 7–9, 19

PMod Peripheral Module. 8–10

PWM Pulse Width Modulation. 5

RISCV 5-stages Reduced Instruction Set Computer architecture, open-sourced. 2–4, 12

UART Universal Asynchronous Receiver Transmitter. 5, 8
```