درس معماری کامپیوتر نیمسال دوم ۲۰-۳۰ استاد: دکتر حسین اسدی



دانشکده مهندسی کامپیوتر

## تمرین سری چهارم

- پرسشهای خود را در صفحه quera مربوط به تمرین مطرح نمایید.
- سوالات نظری را حتماً به صورت انفرادی و سوالات عملی را میتوانید در گروههای دو نفر تحویل دهید.
  - پاسخها را به صورت تایپی بنویسید.
- اسکرین شاتها، عکسها و فایلهای مربوط به سوال عملی را در فایل فشرده مربوطه در cw و quera قرار دهید. هر گونه عدم تطابق بین دو تمرین آپلود شده در دو سایت منجر به از دست رفتن نمره تمرین مربوطه می شود.
  - پی دی اف قسمت تئوری را در سامانه cw و quera بارگذاری کنید.
  - هُرَ دانشجو ميتواند حداكثر سه تمرين را با دو روز تأخير بدون كاهش نمره ارسال نمايد.

درس معماری کامپیوتر صفحه ۲ از ۶

## تمارين تئوري

۱. جدول زیر که نشاندهنده ی مقدار سیگنالهای کنترلی در طول اجرای دستورات است را با توجه به مسیر داده ا معماری پردازنده MIPS که در کلاس طراحی شد(شکل زیر)، تکمیل نمایید. دقت کنید که اگر سیگنال کنترلی MUX برابر ۱ باشد ورودی پایین آن انتخاب می شود.
 باشد ورودی پایین آن انتخاب می شود و در صورتی که برابر ۱ باشد ورودی بالای آن انتخاب می شود.



| Instruction        | PCSrc | ALUSrc | MemWrite | MemToReg |
|--------------------|-------|--------|----------|----------|
| mult \$t0, \$t1    |       |        |          |          |
| bne \$t0, \$t1, 10 |       |        |          |          |
| lw \$t0, 0(\$t1)   |       |        |          |          |
| sw \$t0, 0(\$t1)   |       |        |          |          |

- طراحی مسیر داده برای پردازنده MIPS را در نظر بگیرید (شکل سوال ۱). میخواهیم با ایجاد تغییراتی، دو دستور زیر را به دستورات قابل پشتیبانی توسط این مسیر داده اضافه کنیم. ابتدا با ذکر دلیل نوع دستور مناسب برای هر کدام را مشخص کنید و سپس تغییرات لازم برای پشتیبانی از هر دستور را مشخص نمایید.
  - egetpc \$rd را در ثبات rd این دستورالعمل مقدار PC را در ثبات rd میریزد.
- را برابر PC را برسپس jof \$rt, imm(\$rs) را در ثبات PC را برابر ناستورالعمل ابتدا مقدار PC را برابر imm + \$rs
  - ۳. جدول تأخیرهای زیر را برای بخشهای مختلف پردازنده MIPS در نظر بگیرید:

| I-Mem             | Add              | Mux              | ALU   | Regs | D-Mem | Control          |
|-------------------|------------------|------------------|-------|------|-------|------------------|
| $200 \mathrm{ps}$ | $70 \mathrm{ps}$ | $20 \mathrm{ps}$ | 90 ps | 90ps | 250ps | $40 \mathrm{ps}$ |

فرض کنید ۴ درصد دستورات از نوع پرش، ۱۳ درصد Beq و ۱۴ درصد از نوع Load و ۱۷ درصد از نوع Store و بقیه از نوع R باشند. در صورتی که با تغییراتی بتوان تأخیر ALU را به ۷۵ و تأخیر D-Mem را به ۲۲۰ کاهش داد و تأخیر کنترل به ۵۰ برسد، میزان Speed Up چقدر خواهد بود؟

۴. با استفاده از دستورات پردازنده MIPS توانسته ایم CPU جدیدی را طراحی کنیم که به شکل single-cycle کار میکند و دستورات آن مطابق زیر است:

| Instruction             | Operation                          |
|-------------------------|------------------------------------|
| lw_add rd, (rs), rt     | rd = Mem[Reg[rs]] + Reg[rt]        |
| addi_st (rs), rs, imm   | Mem[Reg[rs]] = Reg[rs] + imm       |
| sll add rd, rs, rt, imm | $rd = (Reg[rs] \ll imm) + Reg[rt]$ |

<sup>&</sup>lt;sup>1</sup>data path

درس معماري کامپيوتر

و تمامی دستورات این پردازنده جدید ما در قالبی ۳۲ بیتی با شکل زیر در حافظه ذخیره میشوند:

| ор    | rs    | rt    | rd    | imm  |
|-------|-------|-------|-------|------|
| 31-26 | 25-21 | 20-16 | 15-11 | 10-0 |

حال تصور کنید تأخیر بخشهای مختلف پردازنده جدید به شکل جدول زیر باشد:

| Unit               | Latency |
|--------------------|---------|
| Register File      | 2.5     |
| Instruction Memory | 4       |
| Data Memory        | 6       |
| ALU                | 5.5     |

حداقل زمان مورد نیاز برای انجام هر یک از دستورات پردازنده جدید را محاسبه کنید. (فرض کنید که میتوان از دو ALU در طراحی استفاده کرد)

۵. مسیرداده Single-Cycle پردازنده MIPS را در نظر بگیرید. با توجه به دو دستور زیر به سوالات پاسخ دهید:

- 1. AND Rd,Rs,Rt
- 2. SW Rt, Offset(Rs)
- آ) مقادیر سیگنالهای کنترلی برای هر یک از این دو دستور را مشخص کنید.
- ب) از کدام یک از منابع (بلوکهای موجود در مدار) در این دستورات استفاده می شود.
- ج) کدام یک از منابع، خروجی مشخصی تولید میکنند ولی از آنها در این دستورات استفاده نمی شود؟
- د) فرض کنید دو سیستم مختلف با تأخیرهای مشخص شده در مدار مطابق جدول زیر را داریم. مسیر بحرانی ۲ برای دستورات AND و load را مشخص کنید.

|   | I-Mem | Add   | Mux              | ALU   | Regs  | D-Mem | Control          |
|---|-------|-------|------------------|-------|-------|-------|------------------|
| a | 200ps | 70ps  | $20 \mathrm{ps}$ | 90 ps | 90 ps | 250ps | $40 \mathrm{ps}$ |
| b | 750ps | 200ps | 50 ps            | 250ps | 300ps | 500ps | 300ps            |

۶. مسیر داده و واحد کنترل پردازنده میپس را در نظر بگیرید، فرض کنید بخواهیم دو دستور زیر را اضافه کنیم، چه تغییراتی در شماتیک باید ایجاد کنیم؟مقدار سیگنالهای خروجی از واحد کنترلی به جز ALUop را برای هر دستور مشخص کنید.

- Addm (rd), rs, rt : mem[rd] = rs + rt
- Xormi (rt),rs,i; mem[rt]  $\leftarrow$  rs XOR zero\_extend(i)

۲ مسیر بحرانی مسیری است که بیشترین تاخیر را ایجاد میکند

درس معماری کامپیوتر

## تمارين عملي

هدف از این تمرین، طراحی یک پردازنده ی شبه MIPS به کمک تمرینهای عملی قبلی است. پردازنده ی MIPS که قرار است طراحی کنید ۸ ثبات ۸ بیتی دارد که مانند پردازنده MIPS ثبات شماره صفرم همیشه صفر است و ثبات آخر (ثبات شماره کام) برای ذخیرهسازی آدرس برگشتی استفاده می شود. طول دستورات این پردازنده ۱۶ بیتی است و دو حافظه ی مجزا برای دستورات و داده ها دارد.

مانند پردازنده ی MIPS این پردازنده نیز سه نوع کدگذاری دستور دارد: Register, Immediate, Jump. تعریف هر کدام از این دستورات در زیر آمده است:

• Register Instructions: این دستورات همان طور که از اسم آنها پیدا است برای زمانی استفاده می شوند که قرار است به کمک محتوای دو ثبات، یک ثبات دیگر را مقدار دهی کنیم. این دستورات دارای فرمت زیر هستند:

| opcode | rs     | $\operatorname{rt}$ | $\operatorname{rd}$ | funct  |
|--------|--------|---------------------|---------------------|--------|
| 4 bits | 3 bits | 3 bits              | 3 bits              | 3 bits |

دقیقا مثل پردازندهی MIPS در تمامی دستورات این نوع، ثبات opcode آنها برابر صفر است و بر اساس مقدار سیگنال funct می توان نوع عملیات را تعیین کرد. جدول عملیات در زیر آمده است:

| Mnemonic | Operation                   | funct |
|----------|-----------------------------|-------|
| ADD      | $rd \leftarrow rs + rt$     | 000   |
| SUB      | $rd \leftarrow rs - rt$     | 001   |
| AND      | $rd \leftarrow rs \& rt$    | 010   |
| OR       | $rd \leftarrow rs \mid rt$  | 011   |
| MULT     | $rd \leftarrow rs * rt$     | 100   |
| XOR      | $rd \leftarrow rs \hat{r}t$ | 101   |
| JR       | $PC \leftarrow rs$          | 111   |

● Immediate Instructions: این دستورات خود سه نوع هستند: (۱) یا مسئول یک پرش شرطی ۴ هستند، (۲) یا برای load و store استفاده می شوند (۳) یا اینکه برای انجام دادن یک عملیات با یک مقدار ثابت و ثبات هستند. فرمت این دستورات مانند شکل زیر است:

| opcode | rs     | rt     | immediate |
|--------|--------|--------|-----------|
| 4 bits | 3 bits | 3 bits | 6 bits    |

لیست این دستورات و opcodeهای آن در زیر آمده است:

| Mnemonic | Operation                                                        | opcode |
|----------|------------------------------------------------------------------|--------|
| ADDi     | $rt \leftarrow rs + SIGN\_EXTEND(immediate)$                     | 0010   |
| SUBi     | $rt \leftarrow rs - SIGN\_EXTEND(immediate)$                     | 0011   |
| ANDi     | $\mathrm{rt} \leftarrow \mathrm{rs} \ \& \ \mathrm{immediate}$   | 0100   |
| ORi      | $rt \leftarrow rs \mid immediate$                                | 0101   |
| SB       | $MEM[rs + SIGN\_EXTEND(immediate)] \leftarrow rt$                | 0110   |
| LB       | $rt \leftarrow MEM[rs + SIGN\_EXTEND(immediate)]$                | 0111   |
| BEQ      | if (rt == rs): $PC \leftarrow PC + SIGN\_EXTEND(immediate << 1)$ | 1000   |
| BNQ      | if (rt != rs): $PC \leftarrow PC + SIGN\_EXTEND(immediate << 1)$ | 1000   |

در رابطه با این نوع دستورات به نکات زیر توجه کنید:

- دقت كنيد كه مقدار immediate در دستورات ANDi و ORi و sign extend نمي شوند.

<sup>&</sup>lt;sup>3</sup>return address

<sup>&</sup>lt;sup>4</sup>conditional branch

درس معماري کامپيوتر

- اگر به یاد داشته باشید زمانی که در پردازنده میپس پرش نسبی  $^{0}$  داشتیم به اندازه  $^{0}$  ۲ بیت مقدار byte aligned شیفت می دادیم چرا که دستورات  $^{0}$  4 byte aligned بودند. اما در اینجا از آنجا که دستورات که دستورات نیز علامت  $^{0}$  به معنای شیفت دادن هستند باید یک واحد مقدار immediate را شیفت دهید. در دستورات نیز علامت  $^{0}$  به معنای شیفت دادن است.

• Jump Instructions: این دستورات برای پرش استفاده می شوند. شکل این دستورات به صورت زیر است:

| opcode | NOT USED | address |
|--------|----------|---------|
| 4 bits | 5 bits   | 7 bits  |

همان طور که مشاهده میکنید در اینجا طول آدرس ۷ بیت است چرا که با توجه به طراحی ما و اندازه ی حافظه (که در قسمت بعد می بینید) این پردازنده می تواند حداکثر ۱۲۸ دستور را در خود ذخیره و اجرا کند. همچنین همان طور که از اسم آن پیدا است بیتهای NOT USED صرفا بدون استفاده هستند و به عبارتی dont care در نظر گرفته می شوند. این سری از دستورات شامل دو دستور زیر هستند:

| Mnemonic | Operation                                            | opcode |
|----------|------------------------------------------------------|--------|
| J        | $PC \leftarrow address << 1$                         | 1110   |
| JAL      | $R[7] \leftarrow PC + 2, PC \leftarrow address << 1$ | 1111   |

در نهایت نیز به این موضوع توجه کنید که تمامی مقادیرopcode و funct که نوشته شدهاند پیشنهادی هستند و در صورت نیاز میتوانید آنها را تغییر دهید. اما در صورتی که آنها را تغییر دهید حتما در گزارش خود ذکر کنید که دستورات شما چه opcode یا functهایی دارند.

در این تمرین قرار است صرفاً register file و حافظه این پردازنده را طراحی کنیم و در تمرینهای بعدی این طراحی را کاملتر خواهیم کرد.

- ۱. در ابتدا برای طراحی پردازنده میپس خود باید یک بانک ثبات طراحی کنید. لازم است که بانک ثبات شما حاوی ۸ ثبات
  ۸ بیتی باشد. دقیقا مانند خود پردازنده ی میپس باید ۵ ورودی داشته باشد:
  - د. Register 1: ثبات شماره اول که خروجی آن به Regout 1 میرود.
  - Register 2 .۲ : ثبات شماره دوم که خروجی آن به RegOut 2 میرود.
- ۳. Register 3: ثباتی که قرار است در آن عملیات write صورت بگیرد. (در صورتی که سیگنال Register 3: فعال باشد)
  - ۴. Data: مقداری که میخواهد در Register 3 نوشته شود.
- ۵. WriteReg: در صورتی که این سیگنال برابر ۱ باشد عملیات نوشتن Data در RegOut 1 صورت میگیرد.

همچنین مشخص است که سیگنالهای مربوط به شماره ثبات ۳ بیتی هستند و مقدار ۸ Data بیتی است. همچنین این بانک ثبات ۲ خروجی دارد:

- ۱. RegOut 1: مقدار ثبات شماره RegOut 1:
- .Register 2 مقدار ثبات شماره:RegOut 2 .۲

یک نکته ی خیلی مهم که باید به آن توجه کنید این است که خواندن در کلاک بالارونده انجام می شود ولی نوشتن در کلاک پایین رونده انجام می شود. در صورتی که این موضوع را رعایت نکنید ممکن است با مسائلی روبه رو شوید. این مسائل از مشکلات مربوط به race که در درس مدار منطقی با آن آشنا شدید سرچشمه می گیرد.

۲. در ادامه می خواهیم حافظه های مربوط به داده و دستورات را طراحی کنیم. دقت کنید که عملاً این دو حافظه از یک جنس هستند و صرفا لازم است که دو نمونه از یک حافظه یکی برای داده و یکی برای دستورات طراحی کنید. طراحی این حافظه باید ویژگی های زیر را داشته باشد:

<sup>&</sup>lt;sup>5</sup>relative jump

درس معماری کامپیوتر

۱. باید ۸ بیت را به عنوان آدرس ورودی بگیرد و با کلاک بالارونده ۱۶ بیت را به خروجی منتقل کند.

۲. باید  $\Lambda$  بیت را به عنوان آدرس ورودی بگیرد و با کلاک پایینرونده  $\Lambda$  بیت را در صورت فعال بودن سیگنال WriteMem

دقت کنید که خروجی باید ۱۶ بیتی باشد چرا که برای حافظه دستورات ۱۶ بیتی هستند. اما زمانی که این حافظه را برای داده استفاده میکنید میتوانید از ۸ بیت پرارزش صرف نظر کنید. در این قسمت مجاز به از استفاده RAM و ROMهای آماده ی Quartus هستید.