#### PANNON EGYETEM, Veszprém Villamosmérnöki és Információs Rendszerek Tanszék



#### Digitális Rendszerek és Számítógép Architektúrák

4. előadás: Utasítás végrehajtás folyamata: címzési módok, RISC-CISC processzorok

Előadó: Dr. Vörösházi Zsolt

voroshazi.zsolt@virt.uni-pannon.hu

#### M

#### Jegyzetek, segédanyagok:

Könyvfejezetek:

```
    http://www.virt.uni-pannon.hu
    → Oktatás → Tantárgyak → Digitális
    Rendszerek és Számítógép Architektúrák (nappali)
    (chapter04.pdf)
```

- Fóliák, óravázlatok .ppt (.pdf)
- Frissítésük folyamatosan



### Utasítás végrehajtás folyamata

- Utasítás kódok
  - □ Programvezérlő utasítások
- Címzési módok
- RISC vs. CISC processzor architektúrák

#### Alapvető digitális építőelemek

#### м

#### Legfontosabb digitális építőelemeink:

- ALU
- Memóriák
- Adat / Cím / Vezérlő Buszok
- Regiszterek, De/Multiplexerek, De/Kódoló áramkörök



# ALU egység

- Az ALU egység két különböző n-bites bemeneti résszel (A, B) rendelkezik, és egy n-bites\*\* kimeneti vonallal (F). A szelektáló (S) jelek segítenek a megfelelő műveletek kiválasztásában. Az ALU egység egy algoritmus utasításainak megfelelően aritmetikai ill. logikai műveleteket hajt végre.
- Eml: funkcionális teljesség, +,-,\*,/ és Logikai fgv.
- (Korábban részletesen: chapter\_03.pdf)
- \*\* eredmény valójában n+1, vagy 2\*n bites

## м

# Memória egységek

Az ALU által kezelt / végrehajtott adatok a memóriában (tároló rekeszek lineáris tömbjében) tárolódnak el. A memória rekeszei általában olyan szélesek, amilyen széles az adatbusz. Például, legyen *n-bit (w)* széles, és álljon 2<sup>n</sup> számú rekeszből. Ekkor *m* számú címvezetékkel címezhető meg. Az adatbuszon kétirányú (írás/olvasás) kommunikáció megengedett. Memória a von Neumann architektúrát követi: tehát az utasítások (program/kód) és az adatok egy helyen tárolódnak, nem pedig külön-külön (Harvard architektúrá). A programot is adatként tárolja a memória.

#### Adatbuszok – adatvonalak

- Másik alap építőelem az adatbusz vagy adatút (datapath). Fontos paraméter a szélessége: egy n természetes szám.
- Az adatutak pont-pont összeköttetéseket jelentenek különböző méretű és sebességű eszközök között.
- A közvetlen kapcsolat nagy sebességet, de egyben rugalmatlanságot is jelent a bővíthetőségben.
- Ezek az adatutak adatbuszokká szervezhetők, amivel különböző jelvezetékek információi foghatók össze.

## M

#### Regiszterek

A következő fontos elem a regiszter. Olyan szélesnek kell lennie, hogy benne, a buszokról, memóriákból, ALU-ból érkező információ eltárolható legyen. Adott vezérlőjelek hatására a bemenetén lévő adatokat betölti, és ideiglenesen eltárolja. Más vezérlőjelek hatására a kimenetére rakja a tárolt adatokat, vagy például egy vezérlőjel hatására, lépteti (shift-eli) a benne lévő adatokat.



# 4-bites Parallel In/ Parallel Out regiszter (D-tárolókból felépítve)



Katalógus adat: SN54/74LS175



# 4-bites Shift/léptető regiszter (Serial in/Paralel Out – D-tárolós)



Katalógus adat : SN54/74LS95



#### További digitális építőelemek

- a.) MUX
- b.) DEMUX
- c.) Kódoló (encoder)
- d.) Dekódoló (decoder)
- e.) Komparátor (Comparator)

# a.) Multiplexer (MUX)

- N kiválasztó jel → 2<sup>N</sup> bemenet, 1 kimenet
- Példa: 4:1 MUX



2<sup>N</sup> számú bemenet közül választ egyet (Y), mint egy kapcsoló. Rendelkezhet EN bemenettel is.



# TTL'74LS157 pl. 2:1 MUX



- Quad (4-bites) 2-bemenetű 2:1
   MUX-ból áll.
- ← Közös S, EN jelek.
- 4 db Y(1,2,3,4) kimenet



2:1 MUX szimbóluma



2:1 MUX áramköri szignál jelölésekkel

$$Y = EN \cdot (A \cdot \overline{S} + B \cdot S)$$



#### Pl. LUT megvalósítások:

index m

n(w)=1-bites bejegyzések a memóriában



## M

### b.) Példa - 1:4 Demultiplexer

- TTL 74'LS139 duál 1:4 demultiplexer
  - Kereskedelmi forgalomban kapható
  - □G: egy bemenetű
  - □ A,B: routing control jelek (bináris kód)
  - 4-kimenet mindegyike False, egyet kivéve, amelyik a kiválasztott (annak az értéke a bemenettől függően lehet T/F)

T=L!

G 'LS139



## Példa - 1:4 Demultiplexer (folyt)

Kanonikus táblázat

| Demultiplexer logika |   |   |    |            |           |           |  |
|----------------------|---|---|----|------------|-----------|-----------|--|
| G                    | В | A | Υ0 | <b>Y</b> 1 | <b>Y2</b> | <b>Y3</b> |  |
| 0                    | X | X | 0  | 0          | 0         | 0         |  |
| 1                    | 0 | 0 | 1  | 0          | 0         | 0         |  |
| 1                    | 0 | 1 | 0  | 1          | 0         | 0         |  |
| 1                    | 1 | 0 | 0  | 0          | 1         | 0         |  |
| 1                    | 1 | 1 | 0  | 0          | 0         | 1         |  |

T=L!



Feszültség-logikai tábl.

| 74'LS139 feszültség-logika |     |     |      |      |      |      |  |
|----------------------------|-----|-----|------|------|------|------|--|
| G.L                        | B.H | A.H | Y0.L | Y1.L | Y2.L | Y3.L |  |
| Н                          | X   | x   | Н    | Н    | Н    | Н    |  |
| L                          | Н   | Н   | L    | Н    | Н    | Н    |  |
| L                          | н   | L   | Н    |      | Н    | Η    |  |
| L                          | L   | Н   | Н    | Н    | L    | Н    |  |
| L                          | L   | L   | Н    | Н    | Н    | L    |  |

■ Demultiplexer logikai egyenletei:  $Y0 = B \cdot A \cdot G$ 



$$Y1 = \overline{B} \cdot A \cdot G$$

$$Y2 = B \cdot \overline{A} \cdot G$$

$$Y3 = B \cdot A \cdot G$$



#### c.) Dekódoló áramkörök

- N bemenet esetén 2<sup>N</sup> kimenete van
- N bemenetből mindig csak egy aktív logikai értékű
- Példa: 3→8 dekóder áramkör
  - □ Példa: Hamming-kódú hibajavító áramkör





#### TTL'74LS42 dekóder áramkör

- 3→8 dekóder áramkör
  - □ (A,B,C) 3 bemenet, (1...7) 8 kimenet
- EN: engedélyező jel, (T=L) alacsony aktív





# Példa: 2x4 Dekódoló áramkör engedélyező bemenettel

- EN: alacsony aktív állapotban működik
- 2 bemenő bit (A,B)
- 4 kimenő bit (D0...D3)



| En | A E                      | 3 | DO | D1 | D2 | D3 |
|----|--------------------------|---|----|----|----|----|
|    | x x                      |   | 1  | 1  | 1  | 1  |
| 0  | 0 (<br>0 '<br>1 (<br>1 ' | 0 | 0  | 1  | 1  | 1  |
| 0  | 0 4                      | 1 | 1  | 0  | 1  | 1  |
| 0  | 1 (                      | D | 1  | 1  | 0  | 1  |
| 0  | 1 -                      | 1 | 1  | 1  | 1  | 0  |



#### d.) Kódoló (encoder) áramkör

- A dekódoló áramkör ellentéte: bemenetek kódolt ábrázolásának egy formája
  - Hagyományos encoder: csak egy bemenete lehet aktív logikai értékű egyszerre
  - □ Priority encoder: több bemenete is lehet aktív logikai értékű egyszerre, de azok közül ált. a legnagyobb bináris értékű, azaz prioritású bemenethez generál kódot! (pl. kód: address, index is lehet)
    - I/O, IRQ jelek generálásánál használják leggyakrabban

# Probléma: Priority encoder esetén

- Mi van akkor, ha még sincs igaz bemenete (mindegyik hamis)? Két megoldás van:
  - 1.) módszer: Input vonalak megszámozása 1-től (D1) kezdődően, és a 0 kimeneti kód (itt FF) jelenti, hogy mind "hamis" volt. (Továbbá: X – don't care)
  - 2.) módszer: input vonalak megszámozása 0-tól (D0) kezdődően, és egy külön vezérlőjelet (W) biztosítani arra, hogy nincs "igaz" bemenet. (Továbbá: X – don't care)

| Method 1     |    |    |   |   |  |  |
|--------------|----|----|---|---|--|--|
| D3           | D2 | DI | В | A |  |  |
| F            | F  | F  | F | F |  |  |
| $\mathbf{F}$ | F  | T  | F | T |  |  |
| F            | T  | Х  | T | F |  |  |
| T            | X  | X  | T | T |  |  |

|              |    | M  | ethod 2   |   |                  |   |    |
|--------------|----|----|-----------|---|------------------|---|----|
| D3           | D2 | DI | $D\theta$ | В | $\boldsymbol{A}$ | W |    |
| F            | F  | F  | F         | _ | _                | Т | •  |
| F            | F  | F  | T         | F | F                | F |    |
| $\mathbf{F}$ | F  | T  | X         | F | T                | F |    |
| F            | T  | X  | X         | T | F                | F |    |
| T            | X  | ×  | X         | T | T                | F | 22 |



# TTL'74LS147 Priority encoder - kódoló áramkör

- 10-input, 4-output encoder
  - "0" nincs jelölve: amikor az összes bemenet False (lefoglalt)
  - □ Alkalmazás:
    - Cím, indexgenerálás
    - LUT választás



Mixed logic szimbólum

T=L!

#### M.

### e.) Komparátor

- Logikai kifejezés referencia kifejezés (bináris számok) aritmetikai kapcsolatának megállapítására szolgáló eszköz.
  - □ PI: Kettő n-bites szám összehasonlítása
- compare = összehasonlítás! Az azonosság eldöntéséhez a EQ/XNOR/Coincidence operátort használjuk. Jele:  $A.EQ.B = A \odot B$
- n-bites minták esetén:

$$A.EQ.B = (A0 \odot B0) \cdot (A1 \odot B1) \cdot ... \cdot (An \odot Bn)$$

#### ŊΑ

#### Ismétlés: EQ/XNOR/Coincidence operátor

- Logikai egyenlet:  $A.EQ.B = A \odot B = A \cdot B + A \cdot B$
- Referenciabit szerinti megkülönböztetés:
  - □ ha a referencia bit (B), amihez hasonlítunk konstans
  - □ ha a referencia bit (B) egy <u>változó</u> mennyiség
- Példa: ha B referencia konstans -> egyszerűsítése A-nak A.EQ.B = A if B = T

$$A.EQ.B = \overline{A}$$
 if  $B = F$ 

Példa: legyen B egy 4-bites konstans mennyiség (B=TFFT), és A tetszőleges, akkor:

$$A.EQ.B = A0 \cdot \overline{A1} \cdot \overline{A2} \cdot A3$$

### Példa: 4-bites komparátor

Mixed-logic kapcsolási rajza, és log.egyenlete:

$$A.EQ.B = (A0 \odot B0) \cdot (A1 \odot B1) \cdot (A2 \odot B2) \cdot (A3 \odot B3)$$





- Magnitude comparing (~nagyságrend összehasonlítás, relációs műveletek):
  - □ két kifejezés nagyságának összehasonlítása (A<B; A=B; A>B stb.) egyszerre



## Példa: 8-bites Magnitude Comparator – Pl. egyenlőség esetén

 Kettő 4-bites '74LS85 Magnitude komparátor sorbakötéséből ("cascading") kapjuk a 8 bites (P,Q) értékek összehasonlítását



# Egyszerű számítógép (egycímű gép)

blokkdiagramja

•MAR: Memory Address Register (Memória-cím Regiszter): információ helyét azonosítja adott memóriacím alapján.

•MBR: Memory Buffer Register (Memória Puffer Regiszter): tárolja a memóriába bevitt, ill. érkező információt. Egy adott memóriacímen lévő adat kiolvasásakor az ott lévő bejegyzés törlődhet (destruktív memória)

• PC: Program Counter (Programszámláló): a soron következő (végrehajtandó) utasítás helyét azonosítja. Azon gépeknél, amelyek egy utasítást tárolnak memóriaterületenként, az utasítás végrehajtása után a PC értékét 1-el kell növelni (increment), mint egy számlálót.

•IR: Instruction Register (Utasítás Regiszter): tárolja az éppen végrehajtás alatt álló utasítást. Engedélyezi a gép vezérlő részeinek, hogy a regiszterek, memóriák, aritmetikai egységek vezérlő vonalait a végrehajtáshoz szükséges működési módba állítsák. Az IR olyan széles, hogy az utasítás műveleti kódja ill. a hozzá tartozó egyéb utasítások ideiglenes másolatai eltárolhatók legyenek.

•ACC: Accumulator regiszter (tároló regiszter): eredmény ideiglenes tárolására használjuk (összes adatkezeléshez tartozó utasítás tárolása).



#### Utasítások kódolása



#### Utasítás kódok

- A rendszer-tervezéshez szükséges erőforrások a regiszterek, ALU, memória, adatbuszok nem elegendőek a végrehajtás egyes fázisainak (tranzakcióknak) ábrázolásánál. Szükség van egy olyan eljárásra, amely leírja ezeket az egyes egységek között végbemenő tranzakciókat.
- Utasítások végrehajtásának leírására szolgáló programnyelv az assembly. Az utasítások gyűjteményét amelyeket a felhasználó/programozó használ az adatkezelésnél gépi utasításkészletnek nevezzük.

#### **FDE** mechanizmus

- Egy utasítás végrehajtásának három fő lépését a <u>Fetch-</u> <u>Decode-Execute</u> (FDE) mechanizmussal definiálhatjuk:
  - F Fetch: az utasítás betöltődik a memóriából az utasításregiszterbe (regiszter-transzfer művelet)
  - D Decode: utasítás dekódolása (értelmezése), azonosítja az utasítást
  - E Execute: a dekódolt utasítást végrehajtjuk az adatokon, aminek eredménye visszakerül a memóriába
- További lépések lehetnek még (tipikusan):
  - MEM: Memory operations: következő utasítás letöltése a memóriából
  - □ WB: Memory Write-Back: eredmény visszaírása





#### RTL leírás:

- Minden utasítás végrehajtása az RTL leírás (Regiszter-Transzfer Nyelv) segítségével írható le. A szükséges adatátviteleket ezzel a nyelvvel specifikáljuk az egyik fő komponenstől a másikig.
- Továbbá megadható az engedélyezett adatátvitelekhez tartozó blokkdiagram (gráf) is, az éleken adott irányítással, amelyek az adatátvitel pontos irányát jelölik.
- Az RTL leírások specifikálják a műveletek pontos sorrendjét. Az egyes utasításokhoz megadhatók a szükséges végrehajtási idők (pl. [ns, ps]-ban), amelyek erősen függenek a felhasznált technológia tulajdonságaitól. Ezek összege fogja megadni a teljes tranzakció időszükségletét.

# Néhány alapvető tranzakció specifikációja a következő:

- PC → MAR: A Program Számláló tartalma a Memória Cím Regiszterbe töltődik
- PC+1→ PC: A PC 1-el inkrementálódik, és PC-be visszatöltődik
- M[MAR] → MBR: MAR címregiszter tartalmával címezzük meg az M memória adott celláját, melynek tartalma az MBR regiszterbe kerül
- MBR→IR: MBR tartalma az IR-be töltődik. Ha az adatbusz megenged többszörös műveletvégzést egyidejűleg, akkor az egyes akciók összekapcsolhatók!
- IR <3:0> → ALU: Az információnak csak egy része, az IR regiszter 3-0 bitje töltődik az ALU-ba
- REG[2] → MEM[MAR]: Általános célú regiszter 2. rekesze töltődik a Memória Cím Regiszter adott rekeszébe, a MAR által mutatott címre mutat az operatív memóriában
- If (carry==1) then PC-24 → PC :Feltételes utasítások: Ha átvitel 1, akkor PC 24-el dekrementálódik, és visszatöltődik
- Else PC+1 → PC :egyébként 1-el inkrementálódik.

#### ŊΑ

#### Utasítás formák:

- **Zéró-című (0-című):** (PUSH, POP, ALU műv.) [operátor] (példa: STACK, vagy verem)
- **1-című:** [operátor],[operandus] (Példa: Egyszerű számítógép blokkdiagramja)
- 2-című: [operátor],[operandus1],[operandus2]
- **3-című:** [operátor],[operandus1],[operandus2], [eredmény]
- **4-című:** [operátor],[operandus1],[operandus2], [eredmény],[következő utasítás]

...

#### Példa: ADD utasítás RTL leírása

Fetch: (regiszterek feltöltése, utasításhívások):

PC → MAR Elsőként a PC-ből a következő utasítás címe a

MAR-ba töltődik

M[MAR] → MBR Memóriában lévő utasítás beírása az MBR-be

(később visszaírjuk)

MBR → IR Majd az MBR-ben lévő adatot az IR-be tesszük

PC+I\_len → PC Az utasítás hosszával (I\_len) növeli a PC értékét

Decode: (a dekódolást általában 0 idejűnek feltételezzük)

Execute:(végrehajtás)

IR <addr> → MAR operandus címét a MAR-ba töltjük

M[MAR] → MBR ezt az értéket kell az ACC-vel összeadni

ACC+MBR → ACC összeadás (eredmény az ACC-ben)

Időszükségletek itt még nincsenek feltüntetve!



## ADD3 assembly utasításokkal

Megfelel: ADD3 R<sub>1</sub>, R<sub>2</sub>, R<sub>3</sub> (3-című utasításnak)

LD  $x, \$R_1$ 

LD  $y, \$R_2$ 

ADD  $\$R_1, \$R_2, \$R_3$ 

ST  $\$R_3, z$ 

## re.

#### Egy-című gépek (Egyszerű számítógép)

Példa: DEC PDP-8

számítógépe



38



## Egy-című gép

- Megadása: [operátor],[operandus]
- A műveletekhez csak 1 operandus szükséges. Ilyen művelet lehet például:
  - □ 1's vagy 2's komplemens képzés,
  - □ inkrementálás, törlés, keresés az *ACC*-ben (akkumulátor).
- Az eredmény az ACC-ben tárolódik. (ACC egy olyan speciális regiszter, amelyben az aritmetikai és logikai műveletek eredménye ideiglenesen tárolódik.)
- Két operandus esetén az első operandus ACC-ben tárolt értékét használjuk fel, míg a másik operandust egyetlen címmel azonosítjuk!

## Példa: Egy-című gép 2's komplemens képzés

Fetch: (regiszterek feltöltése, utasításhívások):

PC→MAR Elsőként a PC-ből a következő utasítás címe a

MAR-ba töltődik

M[MAR]→MBR Memóriában lévő utasítás beírása az MBR-be

(később visszaírjuk)

PC+I\_len→PC Az utasítás hosszával (I\_len) növeli a PC értékét

MBR→IR Majd az MBR-ben lévő adatot az IR-be tesszük

Decode: (a dekódolást általában 0 idejűnek feltételezzük)

Execute: (végrehajtás)

**ACC** → **ACC** ACC komplemensét az ACC-be töltjük

**ACC+1**→**ACC** majd ACC-t 1-el inkrementáljuk (eredmény)

# Példa: IAS adat és utasításformátum (Neumann – 1947)



40 bites adat-szóhosszúság

2x20 bites utasításhossz: 8-bit -> 256 művelet, 12 bit-> 4096 memóriacím érhető el

## Példa: 1-című gép (Kivonás SUB<sub>1</sub>X)

Mostantól: "X" Operandus címét is a PC-vel azonosítjuk!

Fetch: (regiszterek feltöltése, utasításhívások):

**PC→MAR** Elsőként a PC-ből a következő utasítás címe a

MAR-ba töltődik

M[MAR]→MBR Memóriában lévő utasítás beírása az MBR-be

(később visszaírjuk)

PC+I len→PC Az utasítás hosszával (I len) növeli a PC

értékét

MBR→IR Majd az MBR-ben lévő adatot az IR-be tesszük

Decode: (a dekódolást általában 0 idejűnek feltételezzük)

Execute: (végrehajtás)

PC→MAR PC-vel a következő címre mutatunk

PC+X\_len →PC X operandus címének hosszával növeljük a PC-t

M[MAR]→MBR Ezt címet az MBR-be tesszük

MBR→MAR Ez a cím lesz az X operandus címe

M[MAR]→MBR Címen lévő értéket az MBR-be töltjük

ACC – MBR→ACC ACC-ből kivonjuk az X-et, és ACC-be töltjük

## Példa: 1-című gép (kivonás SUB<sub>1</sub>X)

Időszükségletek feltüntetésével! T<sub>MEM</sub>=30ns, T<sub>ALU</sub>=10ns, T<sub>REG</sub>=5ns

Fetch: (regiszterek feltöltése, utasításhívások):

PC→MAR [5ns] Elsőként a PC-ből a következő utasítás címe a

MAR-ba töltődik

M[MAR]→MBR [30ns] Memóriában lévő utasítás beírása az MBR-be

(később visszaírjuk)

PC+I\_len→PC [5ns] Az utasítás hosszával (I\_len) növeli a PC értékét

MBR→IR [5ns] Majd az MBR-ben lévő adatot az IR-be tesszük

Decode: (a dekódolást általában 0 idejűnek feltételezzük)

Execute: (végrehajtás)

PC→MAR [5ns] PC-vel a következő címre mutatunk

M[MAR]→MBR [30ns] Ezt címet az MBR-be tesszük

MBR→MAR [5ns] Ez a cím lesz az X operandus címe

M[MAR]→MBR [30ns] Címen lévő értéket az MBR-be töltjük

PC+X\_len →PC [5ns] X operandus címének hosszával növeljük a PC-t

ACC – MBR→ACC [10+5ns] ACC-ből kivonjuk az X-et, és ACC-be töltjük

## Példa: DEC PDP 8 (egycímű gép)

12-bites szóhossz: 3-bites opcode (8 művelet) +
 9-bit utasítás cím (speciális operandus címzési módokat tett lehetővé)





#### DEC PDP-8 utasításformátuma

- 3-bites opcode [11:9]: 8 művelet, ebből:
  - 6-nak van saját címe (itt az alsó 9 bit adja a címet) pl:
     Add, And, Jmp, Inc\_Skip\_IfZero, DepositClearAcc
  - □ 2-nek nem kell cím: pl. ACC műveletekhez







## b.) Kettő-, és több-című gépek (regiszter nélküli változat)

- Egy utasítással több operandust / operátort lehet megadni,
- Kevesebb utasítás-sorral, összetett módon írhatók le az RTL nyelven a folyamatok, (az egycímű gépekkel ellentétben)
- A többcímű utasítások meghatározzák, mind a forrás, mind a célinformációt. A célinformáció helyét az utolsó operandus címe adja meg! [operátor],[operandus1],[operandus2]...





## Jelölés: kettő-, és többcímű gép

- Jelölés: ADD₂ X, Y két-című utasítás (műv, op1, op2). Az X cím által azonosított helyen tárolt értéket hozzáadjuk az Y cím által azonosított helyen lévő értékhez, és az összeadás eredményét az Y címmel azonosított helyen tároljuk el.
- Jelölés: ADD₃ X,Y,Z három-című utasítás (műv, op1, op2, eredmény): hasonló az előzőhöz, csak az összeadás eredménye egy új helyen, a Z cím által azonosított helyen tárolódik el.
- Fontos megjegyezni hogy ebben az esetben ("regiszter nélküliség") a T1, ill. T2 regiszter nem az utasítás-készlet architektúra része! (Ezért nem keverendő össze a később említésre kerülő regiszteres címzéssel!)
  - □ Ebben az esetben T1, T2-t "csak" az ALU részeként, nem pedig a rendszer gyorsítását szolgáló elkülönített regiszter bankként használjuk.

## М

#### Példa: Összeadás két-című géppel ADD<sub>2</sub>(X,Y)

#### Időszükségletek feltüntetésével!

 $T_{MEM}$ =30ns,  $T_{ALU}$ =10ns,  $T_{REG}$ =5ns

Fetch: (regiszterek feltöltése, utasításhívások):

PC→MAR [5ns] PC-ből a következő utasítás címe a MAR-ba töltődik

M[MAR]→MBR [30ns] Memóriában lévő utasítás beírása az MBR-be
PC+I\_len→PC [5ns] Az utasítás hosszával (I\_len) növeli a PC értékét
MBR→IR [5ns] Majd az MBR-ben lévő adatot az IR-be tesszük

Decode: (a dekódolást általában 0 idejűnek feltételezzük)

Execute: (végrehajtás)

PC→MAR [5ns] PC-vel a következő (X) címre mutatunk

PC+X\_Alen →PC [5ns] X operandus címének hosszával növeljük a PC-t

M[MAR] $\rightarrow$ MBR [30ns] Ezt az X címet az MBR-be írjuk

MBR→MAR [5ns] Ez a cím lesz az X operandus címe

M[MAR]→MBR [30ns] X címen lévő értéket az MBR-be töltjük

MBR→T1 [5ns] X értékét T1-be töltjük

**PC→MAR** [5ns] PC-vel a következő (**Y**) címre mutatunk

PC+Y Alen →PC [5ns] Y operandus címének hosszával növeljük a PC-t

M[MAR]→MBR [30ns] Ezt a Y címet az MBR-be írjuk

MBR→MAR [5ns] Ez a cím lesz az Y operandus címe

M[MAR]→MBR [30ns] Y Címen lévő értéket az MBR-be töltjük

MBR→T2 [5ns] Y értékét T2-be töltjük

T1 + T2→MBR [10+5ns] ADD2 művelet elvégzése, MBR-be töltjük [30ns] Eredményt a MAR-ban tároljuk el (ahol Y volt)

Direkt címzést használunk itt!

#### Példa: Összeadás három-című géppel ADD<sub>3</sub>(X,Y,Z)

Időszükségletek feltüntetésével!

 $T_{MEM}$ =30ns,  $T_{ALU}$ =10ns,  $T_{REG}$ =5ns

Fetch: (regiszterek feltöltése, utasításhívások):

PC→MAR [5ns] PC-ből a következő utasítás címe a MAR-ba töltődik

M[MAR]→MBR

[30ns] Memóriában lévő utasítás beírása az MBR-be

PC+I\_len→PC

[5ns] Az utasítás hosszával (I\_len) növeli a PC értékét

MBR→IR

[5ns] Majd az MBR-ben lévő adatot az IR-be tesszük

Decode: (a dekódolást általában 0 idejűnek feltételezzük)

Execute: (végrehajtás)

PC→MAR [5ns] PC-vel a következő (X) címre mutatunk

PC+X Alen →PC [5ns] X operandus címének hosszával növeljük a PC-t

M[MAR]→MBR [30ns] Ezt az X címet az MBR-be írjuk

MBR→MAR [5ns] Ez a cím lesz az X operandus címe

M[MAR]→MBR [30ns] X címen lévő értéket az MBR-be töltjük

MBR→T1 [5ns] X értékét T1-be töltjük

PC→MAR [5ns] PC-vel a következő (Y) címre mutatunk

PC+Y\_Alen →PC [5ns] Y operandus címének hosszával növeljük a PC-t

M[MAR]→MBR [30ns] Ezt a Y címet az MBR-be írjuk
MBR→MAR [5ns] Ez a cím lesz az Y operandus címe

M[MAR]→MBR [30ns] Y Címen lévő értéket az MBR-be töltjük

MBR→T2 [5ns] Y értékét T2-be töltjük

PC→MAR [5ns] PC-vel a következő (Z) címre mutatunk

PC+Z Alen →PC [5ns] Z operandus címének hosszával növeljük a PC-t

M[MAR]→MBR [30ns] a Z eredmény címét az MBR-be írjuk

MBR→MAR [5ns] majd a MAR-ba töltjük

T1 + T2→MBR [10+5ns] ADD2 művelet elvégzése, MBR-be töltjük MBR→M[MAR] [30ns] Eredményt a memóriában tároljuk el (ahol Z volt)

Direkt címzést használunk itt!



# Komplex műveletek: MűV<sub>2</sub> vs. MŰV<sub>3</sub>

- Az MŰV<sub>3</sub> végrehajtásánál (ahogy az RTL leírásból is látszott), egy sor több időt vesz igénybe az utasítások F-D-E fázisánál, mint az MŰV<sub>2</sub> esetén, mivel egyel több címre kell hivatkozni.
- Azonban, az MŰV₃ jelentősége a komplexebb műveletek elvégzésekor mutatkozik meg: tömörebb forma, kevesebb utasítás sor!
- Példa: Legyen X = Y \* Z + W \* V ( oldjuk meg MŰV₂-vel, és MŰV₃-al)

| MŰV <sub>2</sub>      | MŰV <sub>3</sub>       |
|-----------------------|------------------------|
| MOVE Y to X           | MUL <sub>3</sub> Y,Z,T |
| MUL <sub>2</sub> Z,X  | MUL <sub>3</sub> W,V,Y |
| MOVE W to Y           | ADD <sub>3</sub> T,Y,X |
| MUL <sub>2</sub> V, Y |                        |
| ADD <sub>2</sub> Y,X  |                        |

## c.) Kettő-, és több-című gépek (Regiszteres változat)

- Egy utasítással több operandust / operátort lehet megadni,
- Kevesebb utasítás-sorral, összetett módon írhatók le az RTL nyelven a folyamatok, (az egycímű gépekkel szemben)
- Az általános célú regiszterek (Reg. Bank) használata csökkenti a végrehajtási időt, mivel a lassú memória-intenzív műveletek helyett gyorsabb regiszterműveleteket használnak. (A regiszterbank 2<sup>N</sup> számú regisztert tartalmazhat.)



## М

#### Példa 1: Összeadás kétcímű géppel ADD<sub>2</sub>(R<sub>X</sub>,R<sub>Y</sub>)

Időszükségletek feltüntetésével!

 $T_{MEM}$ =30ns,  $T_{ALU}$ =10ns,  $T_{REG}$ =5ns

Fetch: (regiszterek feltöltése, utasításhívások):

PC→MAR [5ns] PC-ből a következő utasítás címe a MAR-ba töltődik

M[MAR]→MBR [30ns] Memóriában lévő utasítás beírása az MBR-be

PC+I\_len→PC [5ns] Az utasítás hosszával (I\_len) növeli a PC értékét

MBR→IR [5ns] Majd az MBR-ben lévő adatot az IR-be tesszük

Decode: (a dekódolást általában 0 idejűnek feltételezzük)

Execute: (végrehajtás)

**RX→T1** [5ns] **RX értékét** T1-be töltjük

RY→T2 [5ns] RY értékét T2-be töltjük

T1 + T2→RY [10+5ns] ADD2 művelet elvégzése, RY-ba töltjük

Σ 70ns

Regiszteres, direkt-címzést használunk itt!

## М

#### Példa 2: Összeadás kétcímű géppel ADD<sub>3</sub>(R<sub>X</sub>,R<sub>Y</sub>,R<sub>Z</sub>)

Időszükségletek feltüntetésével!

 $T_{MEM}$ =30ns,  $T_{ALU}$ =10ns,  $T_{REG}$ =5ns

Fetch: (regiszterek feltöltése, utasításhívások):

PC→MAR [5ns] PC-ből a következő utasítás címe a MAR-ba töltődik

M[MAR]→MBR [30ns] Memóriában lévő utasítás beírása az MBR-be

PC+I\_len→PC [5ns] Az utasítás hosszával (I\_len) növeli a PC értékét

MBR→IR [5ns] Majd az MBR-ben lévő adatot az IR-be tesszük

Decode: (a dekódolást általában 0 idejűnek feltételezzük)

Execute: (végrehajtás)

**RX→T1** [5ns] **RX értékét** T1-be töltjük

RY→T2 [5ns] RY értékét T2-be töltjük

T1 + T2→RZ [10+5ns] ADD2 művelet elvégzése, RZ-be töltjük

Σ 70ns

Regiszteres, direkt-címzést használunk itt!

### d.) Zéró-, vagy 0-című gépek (Stack)

- Egy vermet (Stack) használunk: LIFO-típusú tároló, amelyből az utoljára betett adatot vesszük ki elsőként. A Stack a memóriában található egy elkülönített részen. MŰV₀(). Alkalmazása:
  - □ Függvény hívás, visszatérés (CALL-RETURN eljárások)
  - Különböző aritmetikai kifejezések hajthatók végre elég hatékonyan stack használatával: a szükséges operandusokat a stack egy-egy rekeszében tároljuk. A megfelelő operandusokat (mindig a felső kettő regiszterből) vesszük ki, elvégezzük rajtuk a műveletet, majd az eredményt a verem tetejére tesszük vissza. Azért nevezzük zéró címűnek, mivel az operandusok azonosítására szolgáló utasításhoz nem használunk címeket.
  - Egy HW-orientált stack rendszert felépítése a következő:





## Példa: Zéró-, vagy 0-című gép

Legyen F=A+[ B\*C + D\*(E / F) ] aritmetikai kifejezés, F-et akarjuk kiszámolni verem segítségével és eltárolni az eredményt. A következő műveletek szükségesek: PUSH, POP, ADD2, DIV2, MULT2

Fontos: minden elvégzett művelet egy szinttel csökkenti a verem mélységét!

- 1. módszer kiértékelésénél az aritmetikai kifejezés elejétől haladunk, és amint lehetséges a verem tetején lévő két értéken végrehajtjuk a soron következő műveletet, az eredményt, pedig a verem tetejére pakoljuk. A veremben max. 5 értéket tárolunk el, (mélysége 5 lesz) ezért lassabb, mint a második módszer.
- 2. módszernél az aritmetikai kifejezést hátulról előrefelé haladva értékeljük ki. Itt is elvégezzük a soron következő műveletet, és az eredményt a verem tetejére rakjuk. De ez gyorsabb módszer, mivel a veremben max, csak 3 értéket tárolunk el (mélysége 3).

| PUSH E PUSH F DIV [E/F]    |  |  |
|----------------------------|--|--|
|                            |  |  |
| DIV [E/F]                  |  |  |
| L J                        |  |  |
| PUSH D                     |  |  |
| MULT [D*(E/F)]             |  |  |
| PUSH C                     |  |  |
| PUSH B                     |  |  |
| MULT [B*C]                 |  |  |
| ADD [B*C+D*(E/F)]          |  |  |
| PUSH A                     |  |  |
| F))] ADD [A+(B*C+D*(E/F))] |  |  |
| POP F <b>55</b>            |  |  |
|                            |  |  |

## Operandus "címzési módok"



## Operandus címzési módok

- Utasítás végrehajtásakor a kívánt operandust el szeretnénk érni, címével hivatkozhatunk a pontos helyére, azonosítjuk őt.
- Többféle címzési mód is létezik:
  - □ közvetlen (directed),
  - □ közvetett (indirected),
  - □ indexelt (indexed),
  - □ regiszteres megvalósítású (register relative).
- Ezek kombinációja igen sokféle, összesen akár 10-féle azonosítási módot tesz lehetővé.
- Jelölés: EA= Effektív (valódi) címe egy operandusnak



- Az utasítás egyértelműen, közvetlenül azonosítja az operandus helyét a memóriában. (effektív cím E<sub>A</sub>= valódi címén tárolt érték) Jel: E<sub>A</sub>=A.
- Jel: ADD<sub>2</sub> X,Y (X-ben tárolt op1 értéket hozzáadjuk az Y-ban tárolt op2 értékhez, az eredmény az Y-ban lesz.)

 $\square$  EA op1 = X

□ EA op2 = Y

Data:

Address: XXXXXX



## 2. Indirekt címzés (\*X)

- Az utasítás közvetett módon, (nem közvetlenül az operandus értékére), hanem az operandus helyére mutat egy cím segítségével a memóriában. Ez a cím a helyet azonosítja. Ez sokkal hatékonyabb megvalósítás.
- Jel: ADD2 \*X,\*Y (\*: indirekció)
  - $\square$  Ea op1 = MEM[X]
  - $\square$  E<sub>A</sub> op2 = MEM[Y]
- Ezt különböző gyártók többféleképpen jelölik. Általában az indirekt címzési módot (\*)-al jelölik:
- Példa: ADD2 \*X,\*Y (az első op1 értékének címe az X-ben található, a második op2 értékének címe az Y-ban lesz, és az eredmény is az Y-ban tárolódik el.) Az 1.), 2.), 3.), 4.), közül ez a leglassabb megvalósítás, de az indirekt címzés a memóriatömb elemeinek elérhetőségét biztosítja!



Direkt-indirekt kombináció is lehetséges:

PI: ADD<sub>2</sub> X, \*Y

### M

#### Példa: Összeadás két-című géppel ADD<sub>2</sub>(\*X,\*Y)

#### Időszükségletek feltüntetésével!

 $T_{MEM}$ =30ns,  $T_{ALU}$ =10ns,  $T_{REG}$ =5ns

Fetch: (regiszterek feltöltése, utasításhívások):

PC→MAR [5ns] PC-ből a következő utasítás címe a MAR-ba töltődik

M[MAR]→MBR

[30ns] Memóriában lévő utasítás beírása az MBR-be

PC+I\_len→PC

[5ns] Az utasítás hosszával (I\_len) növeli a PC értékét

MBR→IR

[5ns] Majd az MBR-ben lévő adatot az IR-be tesszük

Decode: (a dekódolást általában 0 idejűnek feltételezzük)

Execute: (végrehajtás)

PC→MAR [5ns] PC-vel a következő (X) címének címére mutatunk PC+X Alen →PC [5ns] X operandus címének hosszával növeljük a PC-t

M[MAR]→MBR [30ns] X címének címét az MBR-be írjuk

MBR→MAR [5ns] Ezt a címet a MAR-ba töltjük

M[MAR]→MBR [30ns] X címét megkapjuk az MBR-ben

MBR→MAR [5ns] X címét a MAR-ba töltjük

M[MAR]→MBR [30ns] X címén lévő értékét megkapjuk MBR-ben

MBR→T1 [5ns] X értékét T1-be töltjük

PC→MAR [5ns] PC-vel a következő (Y) címének címére mutatunk

PC+Y\_Alen →PC [5ns] Y operandus címének hosszával növeljük a PC-t

M[MAR]→MBR [30ns] Y címének címét az MBR-be írjuk

MBR→MAR [5ns] Ezt a címet a MAR-ba töltjük M[MAR]→MBR [30ns] Y *címét* megkapjuk az MBR-ben

MBR→MAR [5ns] Y címét a MAR-ba töltjük

M[MAR]→MBR [30ns] Y címén lévő értékét megkapjuk MBR-ben

MBR→T2 [5ns] Y értékét T2-be töltjük

T1 + T2→MBR [10+5ns] ADD2 művelet elvégzése, MBR-be töltjük MBR→M[MAR] [30ns] Eredményt a memóriában tároljuk el (ahol Y volt)

Σ 320ns

Indirekt

címzést

használunk

itt!

## 3. Regiszteres direkt címzés (R<sub>X</sub>)

Hasonló, mint a direkt címzés, de sokkal gyorsabb, mivel a memória intenzív-műveletek helyett a köztes eredményeket a gyors regiszterekben tárolja, és csak a számítási eredményt tölti át a memóriába. Az 1), 2), 3), 4) közül ez a leggyorsabb módszer.



## 4. Regiszteres indirekt címzés (\*R<sub>X</sub>)

Hasonló, mint az indirekt címzés, de sokkal gyorsabb, mivel a memória-intenzív műveletek helyett a köztes eredményeket a gyors regiszterekben tárolja, és csak a végén tölti át a memóriába. A 3.) regiszteres módszer után ez a második leggyorsabb.



## Példa: Összeadás kétcímű géppel ADD₂(\*R<sub>x</sub>,\*R<sub>y</sub>)

Időszükségletek feltüntetésével!

Execute: (végrehajtás)

 $T_{MEM}$ =30ns,  $T_{ALU}$ =10ns,  $T_{REG}$ =5ns

Fetch: (regiszterek feltöltése, utasításhívások):

PC→MAR [5ns] PC-ből a következő utasítás címe a MAR-ba töltődik

M[MAR]→MBR [30ns] Memóriában lévő utasítás beírása az MBR-be

PC+I\_len→PC [5ns] Az utasítás hosszával (I\_len) növeli a PC értékét

MBR→IR [5ns] Majd az MBR-ben lévő adatot az IR-be tesszük

Decode: (a dekódolást általában 0 idejűnek feltételezzük)

indirekt-

címzést

Regiszteres

**RX→MAR** [5ns] **RX címét** a MAR-ba töltjük

használunk itt!

M[MAR]→MBR [30ns] Kinyerjük az RX címén lévő értéket, amit MBR-be töltünk

MBR→T1 [5ns] RX értékét T1-be töltjük

RY→MAR [5ns] RY címét a MAR-ba töltjük

M[MAR]→MBR [30ns] Kinyerjük az RY címén lévő értéket, amit MBR-be töltünk

MBR→T2 [5ns] RY értékét T2-be töltjük

T1 + T2→MBR [10+5ns] ADD2 művelet elvégzése, MBR-be töltjük

MBR→ M[MAR] [30ns] eredményt a memóriában RY operandus helyén tároljuk el

## Összehasonlító táblázat – I.

Az 1.) – 4.) címzési módok időszükségleteinek összehasonlító táblázata:

| Címzési módszer      | Memória<br>hivatkozások<br>száma | Fetch<br>(ns) | Execute<br>(ns) | Total Time<br>(ns) |
|----------------------|----------------------------------|---------------|-----------------|--------------------|
| Direkt               | 6                                | 45            | 205             | 250                |
| Indirekt             | 8                                | 45            | 275             | 320                |
| Regiszteres direkt   | 1                                | 45            | 25              | 70                 |
| Regiszteres indirekt | 4                                | 45            | 125             | 170                |



## 5. Verem (Stack) címzés

- Verem (STACK) címzés, vagy regiszteres indirekt autoincrement címzési mód: indirekt módszerrel az operandus memóriában elfoglalt helyét a címével azonosítjuk, és akár az összes memóriatömbben lévő elem megcímezhető. Autoincrement is, mivel a címeket automatikusan növeli. Ezt (+) jellel jelöljük: \*Rx+
- Ezt a mechanizmust használjuk a verem esetében. A Stack-et a memóriában foglaljuk le. A stackben lévő információra a stack pointerrel (SP-mutatóval) hivatkozunk. A stack egy LIFO tároló: amit utoljára tettünk be, tehát ami a verem tetején van, azt vehetjük ki legelőször.
- A stack pointer címe jelzi a TOS verem tetejét, ahol a hivatkozott információ található, ill. címmel azonosítható a következő elérhető hely. A stack (az ábra szerint) lefelé növekszik a memóriában.





## Verem – PUSH, POP műveletek

POP művelet kivesszük a stack tetején lévő adatot (TOS), és egy Rx regiszterbe rakjuk. Ezután a stack pointer automatikusan inkrementálja a címet, amivel a következő elemet azonosítja a verem tetején. Jel: MOVE \*R (stack pointer)+, Rx

PUSH művelet: a stack pointer automatikusan dekrementálja a címet, amivel a verem tetején lévő elemet azonosítja. Majd ezután berakjuk az Rx regiszterben lévő elemet a stack tetejére, a pointer átlat mutatott címre.

Jel: MOVE Rx, \*R (stack pointer)-

Példa: POP műveletre





A PC közvetlenül azonosítja a memóriában lévő adatot és címet. Az utasítás végrehajtásakor visszakapjuk az utasításfolyamból magát az utasítást, amelyet a PC azonosít. Hívják még azonnali módszernek (imm X) is, mivel az adatok és címek azonnal a rendelkezésünkre állnak. Konstansok, előredefiniált címek szerepelhetnek az

utasítás-folyamban.



### 7. PC-relatív címzés

- Memóriabeli adat címét a regiszteren belüli PC értéke, és az utasítás eltolási (offset) értéke együttesen azonosítja.
  - □ Effektív cím = Regiszteren belüli PC értéke + Eltolás (offset) értéke





## 8. Regiszter relatív címzés

A PC-regiszter eltolási értékéhez hozzáadódik egy, vagy akár több másik, külső Szegmens-regiszter értéke. Tehát ez abban különbözik a PC-relatív címzéstől, hogy itt a címzés két különböző regiszter segítségével történik.

☐ Effektív cím = Regiszternek a PC eltolási értéke (offset) + Szegmens

regiszter értéke

PI: Intel 80x86 segments:

ds: data

cs: code

ss: stack

es: extra





#### 9. Indexelt címzési mód

A memóriában lévő operandus helyét legalább két érték összegéből kapjuk meg. Tehát a tényleges címet az indexelt bázisértékből, és az általános célú regiszter értékéből kapjuk meg. Ezt módszert használják adatstruktúrák indexelt tárolásánál. (PI: tömböknél)

□ Effektív cím= utasításfolyam bázis értéke + általános célú regiszter



## Összehasonlító táblázat – II.

 Címzési módok és jelöléseik összefoglaló táblázata

Table 4.1. Addressing Modes and their Nomenclatures.

| Addressing<br>Mode                    | Represented<br>By           | Comment                                                                                                       |  |
|---------------------------------------|-----------------------------|---------------------------------------------------------------------------------------------------------------|--|
| Direct                                | @ <address></address>       | Address is part of instruction.                                                                               |  |
| Register<br>Direct                    | Rn                          | Operand in found in register.                                                                                 |  |
| Indirect                              | *( <address>)</address>     | Address is part of instruction; operand is located in memory at that address.                                 |  |
| Register<br>Indirect                  | *Rn                         | Address found in register; operand in memory at that address.                                                 |  |
| Instruction<br>Stream                 | # <value></value>           | Value is stored in instruction stream.                                                                        |  |
| Register<br>Indirect<br>Autoincrement | *Rn+                        | Register used as address; value in register incremented at end of instruction.                                |  |
| Stack<br>Addressing                   | Push<br>Pop                 | Stack pointer indentifies location in main store for transfers; value in stack pointer adjusted as necessary. |  |
| PC Relative                           | \$ <offset></offset>        | Offset identifies target address relative to current location identified by program counter.                  |  |
| Memory-<br>Based<br>Index             | ( <address> i Rm)</address> | Operand is located in memory at address which is sum of <address> and Rm.</address>                           |  |
| Register-<br>Based<br>Index           | (Rn i Rm)                   | Operand is located in memory at address which is sum of Rn and Rm.                                            |  |



#### Példa 1: DEC PDP11 működése

- Különböző címzési módokat használt egyszerre
- 16-bites gép: utasítás opcode-ja + további infók (cím)
  - □ 3 biten: 8 általános célú regiszter ([2:0]) Rd-nek lefoglalt rész
  - □ További 3 biten: Rsource (regiszter specifikáció használathoz)
  - !Dupla operandus esetén: csak 4 bit marad az utasítások kódolására (opcode)
  - Egyszeres operandus esetén: 10 bites opcode
- Egyszeres- és dupla operandusú utasítás formátum







**Table 4.2.** Encoding of Instructions for the PDP 11 Architecture.

| Op Code | Function Performed                               |
|---------|--------------------------------------------------|
| 0 0 0 0 | Single address and special function instructions |
| 0 0 0 1 | Move instruction                                 |
| 0 0 1 0 | Compare instruction                              |
| 0 0 1 1 | Bit test instruction                             |
| 0 1 0 0 | Bit clear instruction                            |
| 0 1 0 1 | Bit set instruction                              |
| 0 1 1 0 | ADD2 instruction                                 |
| 0 1 1 1 | Single address instructions                      |
| 1 0 0 0 | Single address and special function instructions |
| 1 0 0 1 | Move instruction (byte)                          |
| 1 0 1 0 | Compare instruction (byte)                       |
| 1 0 1 1 | Bit test instruction (byte)                      |
| 1 1 0 0 | Bit clear instruction (byte)                     |
| 1 1 0 1 | Bit set instruction (byte)                       |
| 1 1 1 0 | Subtract instruction                             |
| 1 1 1 1 | Special purpose instructions                     |

Dupla operandusú címzés esetén a maradék felső 4-biten, [15...12]-ig azonosítja az utasításokat (itt összesen 16 lehet).

### PDP11 címzésének kódolása

**Table 4.3.** Encoding of Addressing Information in the PDP 11 Architecture.

Addressing modes for PDP 11 operands

| Addr bits | S |    | Addressing mode                            |
|-----------|---|----|--------------------------------------------|
| 0         | 0 | 0  | Register direct                            |
| 0         | 0 | 1  | Register indirect                          |
| 0         | 1 | 0  | Register indirect — autoincrement          |
| 0         | 1 | 1  | Two level indirect, autoincrement register |
| 1         | 0 | 0  | Register indirect — autodecrement          |
| 1         | 0 | 1  | Two level indirect, autodecrement register |
| 1         | 1 | 0  | Indexed                                    |
| 1         | 1 | 1  | Indexed indirect                           |
| 11        |   | 9. | bit                                        |

Addressing modes when PC is target register

| Addr bits  |     | Addressing mode                     |
|------------|-----|-------------------------------------|
| 0          | 1 0 | Immediate mode (Instruction stream) |
| 0          | 1 1 | PC absolute mode                    |
| 1          | 1 0 | PC relative                         |
| 1          | 1 1 | PC relative, indirect               |
| <b>Z</b> . |     | o. Oit                              |

### м

### Példa 2. NS32032 – bővíthető műveleti kód

 National Semiconductor – 32 bites processzora

Egy- (JUMP, JSR) és két-című utasítások dekódolása

> Format 1: általános használatra (Add, Sub, Comp, Mov. Stb)

Format 2: bővített (Div, Test, Shift, Abs)

- Több címzési mód
- Addr. Specifier(ek): 5 biten (32 lehetséges címkombináció)
- Addr. Displacement (eltolás): 1, 2, 4 byte-on.



Double Address Format 2

One Byte Displacement; Range: -64 to 63



Two Byte Displacment; Range: -8192 to 8191



Four Byte Displacement; Range: as an Address: Entire Address Space;

as a value: +/- 2<sup>29</sup>-1



### Programszervező utasítások



### Programszervező utasítások

- Program végrehajtásának szabályozása:
  - □ Feltételes, feltétel nélküli utasítások (IF BRANCH)
  - Szubrutin (eljárás) hívás (CALL) / visszatérés (RETURN)
  - □ Ciklus (iteratív végrehatás)
  - □ Ugró utasítások (JUMP)



## JUMP utasítás RTL leírása (pl. PDP 11 gépen)

Fetch: (regiszterek feltöltése, utasításhívások):

PC→MAR Elsőként a PC-ből az utasítás címe (tartalmazza a cél

címét is) a MAR-ba töltődik

M[MAR]→MBR Memóriában lévő utasítás beírása az MBR-be

PC+2→PC Az utasítás hosszával növeli a PC értékét

MBR→IR Majd az MBR-ben lévő adatot az IR-be tesszük

Decode:

Execute: (végrehajtás)

MBR→PC

PC→MAR PC-vel a cél (ugrás akt.+1) címét szeretnénk kiolvasni

M[MAR]→MBR Ezt az ugrási címet az MBR-be tesszük, majd ezzel

Aktualizáljuk a PC értékét (program számláló adott pontra

fog mutatni)

### M

# IF feltételes elágazás RTL leírása (pl. PDP 11 gépen)

```
Fetch: (regiszterek feltöltése, utasításhívások):
    PC→MAR
                                 Elsőként a PC-ből az utasítás címe (tartalmazza a cél
                                 címét is) a MAR-ba töltődik
    M[MAR]→MBR
                                 Memóriában lévő utasítás beírása az MBR-be
    PC+2→PC
                                 2-vel növeli a PC értékét
    MBR→IR
                                 Maid az MBR-ben lévő adatot az IR-be tesszük
Decode:
Execute: (végrehaitás)
    IF (carry == 1)
                                 feltételes elágazás (itt a carry bit/flag tartalmától függően)
                                 Feltétel ellenőrzés, ha Igaz akkor...
                                 PC-vel a következő utasítás (cél) címére mutatunk (PC+offset)
      PC+(2xIR<7:0>)\rightarrow PC
                                 IR<7:0> : 8 bites offset cím (előjel kiterjesztés 16-bitre ,páros
                                 szóhatárra)
    ELSE
       PC+2→PC
                                 Ha a feltétel Hamis, megváltoztatjuk PC címét
```

# Call (szubrutin hívás) RTL leírása (PDP 8 gépen)

Fetch: (regiszterek feltöltése, utasításhívások):

**PC→MAR** Elsőként a PC-ből az utasítás címe (tartalmazza a

cél címét is) a MAR-ba töltődik

PC+1→PC Az utasítás hosszával növeli a PC értékét

M[MAR]→MBR Memóriában lévő utasítás beírása az MBR-be

Majd az MBR-ben lévő adatot az IR-be tesszük

Decode:

Execute: (végrehajtás)

MBR→IR

IR→MAR Feltételezzük, hogy utasítás már tartalmazza a címet

PC→ M[MAR] A visszatérési címet a szubrutin elejére fogja tenni

(indirekt ugrás)

**IR→PC** Aktualizáljuk a PC értékét (az előző a visszatérési címet

fogja tartalmazni), majd

**PC+1→PC** A szubrutin első utasítására fogunk mutatni PC-vel (*hívás*)

"Subroutine linkage": biztosítja hogy az alprogram végrehajtása után a hívó (call) eljáráshoz vissza tudjunk térni (return)

### М

## Return (visszatérés) RTL leírása (PDP 8 gépen)

Fetch: (regiszterek feltöltése, utasításhívások):

PC→MAR Elsőként a PC-ből az utasítás címe (tartalmazza a cél címét is)

a MAR-ba töltődik

**PC+1→PC** Az utasítás hosszával növeli a PC (nem aktuálisan használt)

értékét

M[MAR]→MBR Memóriában lévő utasítás (mint ugrás) beírása az MBR-be

MBR→IR Majd az MBR-ben lévő adatot az IR-be tesszük

Decode:

Execute: (végrehaitás)

**IR→MAR** Feltételezzük, hogy utasítás már tartalmazza a címet

(szubrutin elejét azonosítja ez a cím)

M[MAR]→MAR A visszatérési címet kinyerjük és a MAR-ba tesszük (cím a

szubrutin elején található), majd ezzel

M[MAR]→PC Aktualizáljuk a PC értékét (program számláló a visszatérési címre

fog mutatni, amely után a főprogram folytatja feladatát, a

szubrutinból való visszatérés után) - visszatérés

"Subroutine linkage": biztosítja hogy az alprogram végrehajtása után a hívó (call) eljáráshoz vissza tudjunk térni (return)



### PDP-8 Call, Return utasításai

- Problémák:
  - Memóriát használ (lassú)
  - □ Egy időben csak egy hívó rutin "hívhatja" a szubrutint (visszatérési cím mindig a memória egy adott részén helyezkedik el) → nem biztosít "Time Sharing" üzemmódot
  - □ Nem lehet rekurzió (egymásba ágyazott hívás)
  - □ ROM-ot alkalmazó rendszerekben nem működik
- Megoldás: visszatérési cím tárolása általános célú regiszterben, Stack használatával (SP)
  - □ Példa: Motorola 68000 **JSR**, **RTS** műveletekkel

# További programvezérlési (program-control) módszerek

- I/O vezérlés:
  - □ memory-mapped I/O
  - □ DMA: Direct Memory Access (lásd. chapter6.pdf)
- Megszakítás (interrupt) [IRQ]
  - HW: nem-maszkolható interrupt (NMI) = nem / maszkolható (ignorable)
  - □ CPU
  - □ SW: ¬
- Trap (csapda): programvezérelt megszakítás
  - □ =Exception: kivétel (pl. 0-val osztás)

### Megszakítások



#### Megszakítás (interrupt)

HW: külső eszköz

 CPU: multiprocesszoros, társprocesszoros rendszerben másik
 CPU-tól érkező

• SW: speciális utasítás, vagy program végrehajtása végén küldi (exception is lehet)

Minden megszakításhoz saját "lekezelő" handler tartozik

## RISC és CISC processzorok utasításkészletei

### D/A

### Utasítás készletek

- Fontos paraméter: utasítások száma
- Kezdetben egyszerű felépítésű gépek
- Egyszerű utasítások és gépi nyelv
- Azonban a komplex problémákat kívántak megoldani (magasabb szintű leírással) → "Szemantikus rés"
- Megoldás: compiler
- ISA (Instruction Set Architecture): CISC, RISC architektúrák

### RISC processzorok jellemzői (1):

- Például: Motorola 88000 RISC rendszere, vagy Berkeley RISC-I rendszere, Alpha, SPARC, MicroChip PIC, ARM, DSP sorozatok, IBM PowerPC stb.
- RISC: Reduced Instruction Set Computer (Csökkentett utasításkészletű számítógép):
- Csak a kívánt alkalmazásra jellemző utasítástípusokat tartalmaz, az utasításkészlet összetettségének csökkentése végett kihagytak olyan utasításokat, amelyeket a program amúgy sem használ, ezáltal nő a sebesség.
- Minimális utasításkészletet és címzési módot (csak amit gyakran használ), gyors HW elemeket, optimalizált SW használ.
- Azonban, hogy a programozási nyelvek komplex függvényei leírhatók legyenek (ahogyan az a CISC-nél működik) szubrutinokra, és hosszabb utasítássorozatokra (sok egyszerű utasítás) van szükség.
- Hogyan tudjuk a rendszer erőforrásait hatékonyan kihasználni? Gyorsabb működés érhető el (MIPS), egyszerűbb architektúra megvalósítására kell törekedni.
- Azonos hosszúságú utasításformátum (korlátozott utasításformátum miatt a tárolt programú gépeknél az F-D-E folyamatban a dekódolás minimális idejű lesz (nullának feltételezzük), amely során azonosítani kell a végrehajtandó utasítást)

### м.

### RISC processzorok jellemzői (2):

- Huzalozott (hardwired) utasításdekódolás megvalósításához kombinációs logikát használ, azonban a mai memóriaalapú mikro-kódú gépeknél ez lassabb).
- Egyszeres ciklusvégrehajtás: (minden egyes ciklusban egy utasítást hajt végre, ha ezt sikerülne elérni optimális lenne az erőforrás kihasználás VLSI technológiafüggő. Egy lebegőpontos művelet rendkívül kis idő alatt végrehajtható. Hátránya, hogy vannak bizonyos műveletek, amelyeket egy ciklus alatt nem kapunk meg: pl. a memóriában lévő érték inkrementálásakor az értéket előbb ki kell venni, frissíteni, majd visszaírni a memóriába).
- LOAD/STORE memóriaszervezés: 2 művelet tölt és tárol (regiszter <-> memória). Regiszterre azért van szükség, mivel a betöltött adatot sokkal gyorsabban tudjuk kiolvasni, mint a memóriából. Az aritmetikai/logikai utasítások a regiszterekben tárolódnak. A regiszterek gyorsabbak, mint a memória-intenzív műveletek.
- További architektúra technikák: utasítás pipe-line (utasítás feldolgozás párhuzamosítása), többszörös adatvonalak, nagyszámú gyors regiszterek alkalmazásával.



- Utasítás szintű párhuzamosítás: A soros feldolgozással ellentétben, egy feladat egymástól független részei (fázisai) a rendszer különböző pontjain egyszerre, egy időben hajtódnak végre, ezáltal növekszik a sebesség. Az operandusokat gyors regiszterekben tároljuk. Azonos hosszúságú utasítások gyors F-D-E eljárása. Egy ciklusban egyszerre történik különböző utasításrészek Fetch-Decode-Execute fázisok feldolgozása (gyors fetch és dekódolás).
- <u>Többszörös adatvonalak</u> párhuzamos végrehajtást engednek meg (hardveres párhuzamosítás). Tehát egy órajelciklus alatt több utasítást tudnak feldolgozni. (pl. Sourcel-1,2, Destination adatbuszok a Motorola 88000 rendszerben.)

|            | 1 fázis | 2 fázis | 3 fázis |   |   |
|------------|---------|---------|---------|---|---|
| 1.utasítás | F       | D       | E       | F | D |
| 2.utasítás | -       | F       | D       | Е | F |
| 3.utasítás | -       | -       | F       | D | Е |

### Motorola 88000 RISC rendszere



Hardveres párhuzamosítás:

- Buszok
- Cache
- Data /Instruction Unit (Harvard Arch!)



- Regiszter ablak: a szubrutin híváshoz (call) / visszatéréshez (ret) szükséges processzor-időt kívánták minimalizálni nagy számú regiszter stack használatával.
- Regisztereknek csak egy kis része érhető el ("ablak"). Egy pointer mutat az ablakra, amely azonosítja a benne található aktuális regisztereket. Ha a szubrutinok között "átlapolódás" van az ablakon belül, akkor történhet paraméter átadás.



Routine Specific Registers Each level of subroutine call accesses different set, yet the sets overlap

Common Registers: Accessed by all routines as R0-R9



- Paraméter átadás "ablakozással": a globális regisztereken keresztül történik, amelyet mindkét (A,B) szubrutin elérhet.
- 5 bit → 32 regiszter A(R0-R31) címezhető meg B(R0-R31)
- közös (globális) regiszterek: R0-R9, minden szubrutin által elérhetők
- <u>rutin specifikus regiszterek</u>: R10-R31 mely további három részből áll (a regiszterek között történhet átlapolódás!)
  - Alacsony-szintű regiszterek: R10-R15
  - □ Lokális regiszterek: R16-R25
  - □ Magas-szintű regiszterek: R26-R31
- Ez az eljárás mindaddig jól működik, ameddig a paraméterek száma kisebb a regiszterek méreténél, mivel nem igényel memória-intenzív Stack műveletet.



## CISC Processzorok jellemzői

- CISC: Complex Instruction Set Computer
- Nagyszámú utasítás-típust, és címzési módot tartalmaz, egy utasítással több elemi feladatot végre tud hajtani. Változó méretű utasításformátum miatt a dekódolónak először azonosítania kell az utasítás hosszát, az utasításfolyamból kinyerni a szükséges információt, és csak ezután tudja végrehajtani a feladatát.
- A korai gépeknek egyszerű volt a felépítése, de bonyolult a nyelvezete. Összetett problémákat kívántak vele megoldani, a gépi kódnál magasabb szintű nyelven. Szemantikus rés= a gépi nyelv és felhasználó nyelve közötti különbség. Ennek áthidalására új nyelvek születtek: Fortran, Lisp, Pascal, C, amelyek bonyolultabb problémákat is egyszerűen képesek voltak kezelni. Komplexebb gépek születtek, amelyek gyorsak, sokoldalúak voltak.
- Compiler = Fordító: a bemenetén a probléma felhasználói nyelven van leírva, míg a kimenetén a megoldást gépi nyelvre fordítja le.
- Megfigyelték, hogy a processzor munkája során a rendelkezésre álló utasításoknak csak egy részét használja (20%-os használat, az idő 80%ában).
- Ugyanaz a komplex program, függvény kevesebb elemi utasítássorozattal is megvalósítható. Memória, vagy regiszter alapú technikát használ.

### .

### CISC Processzorok jellemzői (2)

- Közvetlen memória-elérés (DMA) és összetett/bonyolult műveletek jellemzők rá.
- Mikro-programozott vezérlési mód
  - a CISC processzor esetén a fordító (compiler) a programot egyszerűbb szintre fordítja, majd ezután a mikroprogram (ami meglehetősen összetett lehet) veszi át a vezérlést – mikroutasítások sorozata a mikrokódos memóriában.

#### Példák:

 System/360, VAX, DEC PDP-11/VAX rendszerei, Motorola 68000 család, és AMDx86-32/64 és Intel x86-32/64 CPUs



### Pl. MMX kiterjesztés

- MMX: Multi-Media Extension (Intel Pentium sorozat 1996) –
  - □ SIMD: Single Instruction / Multiple Data alapú *integer!* stream data feldolgozásra (jelfeldolgozás)
  - □ 8 db MM0..7 regiszter (8 bit/reg)
  - Regiszterek adatait 4 különböző formátumban lehet tárolni (packet)
  - 57 MMX utasítás, 6 fő műveleti osztályban:
    - ADD
    - SUBTRACT
    - MULTIPLY
    - MULTIPLY THEN ADD (MAC FIR)
    - COMPARISON
    - LOGICAL
      - □ AND, NAND, OR, XOR stb.



### M

### Pl. SSE, SSE2 kiterjesztés

Eredeti nevén KNI: Katmai New Instructions (első Intel Pentium III-nál, 1999)

- SSE: Streaming SIMD extension (lebegőpontos és fixpontos adat folyamra) // Intel, AMD
- 32-bites módban 8 db, de már 128-bites regiszter csomag
- SSE-1:
  - 128-bit packed IEEE single-precision floating-point operations (~70 utasítás).
  - □ 2 clock cycles
- SSE-2:
  - 128-bit packed IEEE double-precision SIMD floating-point (~144 utasítás)
  - □ 128-bit packed integer SIMD operations
    - support 8, 16, 32, and 64-bit operands
  - □ 2 clock cycles