Homework 4 Dry

**Due Date: Sunday, August 8th, 2025**

Teaching assistant in charge: Tsvika Lazar

**Important:** the Q&A for the exercise will take place at a public forum Piazza only. Critical updates about HW will be published in pinned notes in the piazza forum. These notes are mandatory, and it is your responsibility to be updated. Guidelines to use the forum:

* Read previous Q&A carefully before asking the question; Repeated questions may go without answers.
* Be polite, remember that course staff do this as a service for the students.
* You are not allowed to post any kind of solution and/or source code in the forum as a hint for other students; In case you feel that you must discuss such a matter, please come to the reception hour.
* When posting questions regarding hw4, put them under the hw4 folder.

Only the TA in charge can authorize postponements. In case you need a postponement, fill in this form -<https://forms.office.com/r/rXUgsLhfnw?origin=lprLink>

Dry part submission instructions:

1. Please submit the dry part to the electronic submission of the dry part on the course website.
2. The dry part submission must contain a single dry.pdf file containing the following:
   1. The first page should contain the details about the submitters - Name, ID number and email address.
   2. Your answers to the dry part questions.
3. Only typed submissions will be accepted. Scanned handwritten submissions will not be accepted.
4. Only PDF format will be accepted.
5. You do not need to submit anything in the course cell.
6. When you submit, **retain your confirmation code and a copy of the PDF**, in case of technical failure. It is **the only valid proof** of your submission.  
     
   **יש לנמק כל תשובה אלא אם במפורש נאמר אחרת, תשובות ללא נימוק לא תתקבלנה.**

# שאלה 1 – מבנה זיכרון וירטואלי

אחרי שני כישלונות לעבור את חדו"א 1, יורם החליט לפרוש מהלימודים ולהקים חברת הזנק, שמפתחת את הדור הבא של המעבדים. יורם מתכנן מיקרו-מעבד חדש בארכיטקטורה של 24 ביט: הקומפיילר שיורם כותב מתייחס למצביעים ו-int כמילה ארכיטקטונית בת 24-ביט. יורם מנסה לקבל השראה מהארכיטקטורה של x86 ומחליט להשתמש בשתי רמות היררכיה: PGD בגודל 3KB עם כניסות שמצביעות בפוטנציה לטבלאות דפים בגודל 3KB, שמצביעות על מסגרות מידע בגודל של 3KB כ"א.   
כעת הוא מתקשה להמשיך ולתכנן את המנגנון של הזיכרון הווירטואלי ומבקש את עזרתכם.

הנה השאלות שיורם מציג. הסבירו את התשובה כך שיורם יוכל להבין אותה.

1. מה גודל הזיכרון הווירטואלי שאפשר למפות בארכיטקטורה של יורם?

בארכיטקטורה של יורם יש שימוש בכתובות וירטואליות של 24 ביטים. גודל הזיכרון הוירטואלי יהיה כמות הכתובות האפשריים אליהם נוכל להגיע.יש 24 ביט ולכל ביט יש שני אפשרויות ולכן גודל מרחב הזיכרון יהיה: .

1. כמה ביטים יידרשו ל-offset בתוך מסגרת מידע נתונה?

כיוון שכל מסגרת מידע בעלת גודל של 3KB, כלומר מכילה 3072 בתים

(1KB = 1024 bytes). נרצה שהoffset ייצג את המידע ממספר 0 עד 3071. המספר הקטן ביותר של ביטים היכול לייצג מספר זה הוא 12 ביטים ((, ולכן נדרש ל12 ביטים עבור הoffset בתוך מסגרת מידע נתונה.

1. כמה מצביעים / int-ים נכנסים ל-PTE?

כיוון שכל טבלאת דפים בגודל של 3KB (3072 בתים), ומצביעים וint מיוצגים ע"י מילה בת 24 ביט, כלומר 3 בתים נחלק ונקבל: , כלומר 1024 מצביעים/ int-ים (כניסות) נכנסים לPTE.

1. כמה PTEs יהיה צורך למפות?  
   כיוון שגודל כל טבלת דפים היא 3KB, וחישבנו בסעיף א שגודל מרחב הזיכרון הוירטואלי יהיה 16MB, נראה כי כמות הPTEs שנצטרך למפות יהיה . יצא מספר לא שלם שחסום בין ל-. כמות הPTEs תהיה 5461 (נעגל כלפי מטה).
2. כמה ביטים יידרשו כדי להצביע על PTE ספציפי?

כמות הPTEs יהיה חסום בין ל- לכן נצטרך ביטים **לפחות** כדי להצביע על PTE ספציפי.

1. האם אפשר לממש את הזיכרון הווירטואלי בארכיטקטורה של יורם?  
   לא נוכל לממש את הזיכרון הווירטואלי בארכיטקטורה של יורם. לפי החישובים מסעיפים קודמים נצטרך 13 ביטים על מנת להצביע על PTE (לא משנה באיזה דרך נחלק את הטבלאות השונות וכמה גודל אינדקסים מקסימלי נקצה לכל טבלה, תמיד נצטרך 13 ביטים לפחות כדי לייצג טבלאות אלו) ועוד 12 ביטים נוספים לoffset נוסף. סה"כ נצטרך 25 ביטים לפחות בזיכרון הווירטואלי כדי להגיע לכתובת הרצויה, אך נתון כי יש לנו 24 ביטים כדי לייצג כתובת שכזו בזיכרון, ולכן לא נוכל לממש.
2. בהנחה שאפשר היה לממש את הארכיטקטורה (בלי קשר לתשובה הקודמת), האם היית מציע ליורם לשנות כיוון ולמה?  
   הייתי מציעה ליורם לשנות כיוון מכמה סיבות:
3. ראשית, הוא מקטין את הארכיטקטורה ממה שמוכר (ארכיטקטורה של 32\64 ביטים). היו סיבות ללמה הרבה מהמערכות והמחשבים עברו ממעבדים של 32 ביט ל64 ביט לדוגמא ההגדלה של מספר הביטים פתר את בעיית החוסר מקום בזיכרון ואפשר אוטימיזציה חומרתית ותוכנתית. מעבר לכך כמעט כל הכלים המוכרים לנו היום עובדים לפי הכלים הסטנדרטיים של 32/64 ביט, ויצירת אריטקטורה שונה תדרוש התאמות מיוחדות מה שיקשה על העבודה.
4. אורך הכתובת בארכיטקטורה של יורם הינו 24 ביט, וזהו אינו חזקה של 2. חזקה של 2 מאפשרת למחשב לבצע חישובים אריתמטיים בצורה קלה יותר, bitmasking ומימושים של page tables שונים. יצירת ארכיטקטורה בגודל זה תיצור בעיות בתחומים שצוינו.
5. נבזבז שימוש בoffset שלנו. נתון כי כל דף בגודל 3KB, והמספר האמיתי של הoffset שנצטרך יהיה קטן מ, ולכן לא ננצל את המיפוי המירבי שהoffset נותן לנו.

# שאלה 2

1. תאר את ההבדל בין page walk אחרי TLB hit ו-page walk אחרי TLB miss.
   1. אין הבדל, תהליך ה-page walk לעולם יהיה זהה בכל מקרה.
   2. אחרי שמקלקלים את ה-TLB עם TLB hit, חייבים לבצע page walk, אחרת אין צורך.
   3. אחרי TLB miss חייבים לבצע page walk, אחרת אין צורך.
   4. TLB חוסך את הצורך ב-page walk ולכן אם כבר מחליטים לפנות ל-TLB, אין צורך ב-page walk.

**נימוק: אחרי TLB miss נבצע page walk שכן לא מצאנו את המיפוי כתובת ב-TLB. אם מצאנו את המיפוי ב-TLB נוכל להשתמש בו ואכן אין צורך לגשת ל-PGD ולבצע page walk.**

1. מה ההבדל בין מסגרות בגודל 4KB בארכיטקטורה 32-ביט ו-64-ביט?
   1. בארכיטקטורה של 64-ביט יש כפליים ביטים ולכן כפליים כניסות בכל מסגרת.
   2. בארכיטקטורה של 64-ביט יש מחצית ממספר הכניסות בכל מסגרת
   3. כל עוד מדובר באותו הגודל של המסגרת, אין הבדל בין המסגרות בשתי הארכיטקטורות
   4. זה תלוי בדגלים שמוגדים עם עליית המחשב

**נימוק: אכן כל עוד גודל המסגרת זהה אין הבדל בין המסגרות שכן רק גודל כתובת וירטואלית שונה ולא המסגרת עצמה בזיכרון.**

1. אם המסגרות והדפים הם באותו הגודל (4KB), מדוע צריך 12 ביט בשביל ה-offset ורק 10 ביט לציון הדף המתאים?
   1. צריך 12 ביט בשביל הדגלים ולכן כבר משתמשים בזה גם בשביל ה-offset. בסה"כ בזבוז של שני ביטים
   2. בגלל הדגלים, לא נותרו מספיק ביטים בשביל הדפים ולכן משתמשים רק ב-10 ביט.
   3. לא באמת צריך 12 ביט, אבל נותרו 12 ביט ולכן משתמשים בהם, אחרת 10 ביט היו מספיקים גם כן.
   4. יש פי 4 יותר כניסות במסגרות המידע לעומת הכניסות בדפים בשתי ההיררכיות ולכן צריך עוד 2 ביטים.

**נימוק: כעת מכיוון שגודל כל רשומת PTE גם הוא נשאר זהה: 4KB, אך הכתובת של המסגרת היא 64 ביטים ולא 32, כל כניסה ב-PTE תופסת 8 בתים ולא 4 ולכן ישנן 512 כניסות ב-PTE.**

1. מה קורה בזמן שמשתמש מבקש זיכרון ממערכת ההפעלה באמצעות malloc?
   1. מערכת ההפעלה תעדיף להקצות מקום מתוך המקום שמוקצה למחסנית ואם לא נותר מספיק מקום באזור המחסנית, היא תייצר page fault
   2. מערכת ההפעלה תגדיל את אזור המחסנית אם יהיה בכך צורך
   3. ההקצאה נעשית מתוך זיכרון הערימה של התהליך.
   4. מערכת ההפעלה "משאילה" מקום מתהליכים שרצים באותו הזמן ושאינם זקוקים לכל הזיכרון שהוקצה להם

**נימוק: האזור שממנו מוקצה הזיכרון הינו אזור זיכרון הערימה של התהליך שהוקצה בזמן יצירת התהליך. הערימה שמורה ברשימת אזורי הזיכרון של התהליך כשדה vm\_area\_struct. הרשימה נמצאת ב: task\_struct->mm->mmap.**

**אין אנו מקצים אזור זיכרון חדש. הקצאת אזור זיכרון מתבצעת על ידי mmap.**

1. כשתהליך רץ ויש פעולות על משתנים
   1. אם המשתנים אינם נמצאים בזיכרון ואין בהם צורך תכוף, אפשר לבצע את החישובים ישירות בדיסק
   2. אם המשתנים אינם נמצאים בזיכרון, page fault דואג להביא אותם לזיכרון. אם משנים את ערכם, כותבים מיד את הערכים לדיסק, כדי שלא ייווצר מצב שהערכים בדיסק ובזיכרון הם שונים.
   3. שינוי של הערכים גורם להדלקה של ביט שמציין זאת. אין צורך לעדכן מיידית את הדיסק, כי ייתכן ויהיו עוד שינויים נוספים בהמשך.
   4. גם אם המשתנים בזיכרון וערכם אינו משתנה, בזמן החלפת תהליכים חייבים לרשום אותם חזרה לדיסק.

**נימוק: שינוי של הערכים יגרום להדלקת ביט ה-dirty בטבלת הדפים (PGD) וכן בטבלת המסגרות. ההחלטה האם ומתי לכתוב לדיסק תתבצע בהתאם להחלטת אלגוריתם PFRA, האלגוריתם ידע לפנות את המסגרת לדיסק ולא למחוק אותה. אנו לא נכתוב לדיסק מיד (write through) אלא נשתמש במנגנון write-back שיעדכן את המידע בדיסק רק כל מספר כתיבות לזיכרון.**