### Spectre & Meltdown

Борисав Живановић

12. фебруар 2023.

## Садржај

- Архитектура и микроархитектура
- Кеширање
- Предвиђање гранања и прекоредно извршавање
- Основни мехнанизми изолације
- Употреба кеша као side-channel
- Spectre
- Meltdown

### Шта рачунар заиста зна да ради?

- Језик рачунара: скуп инструкција (енгл. ISA, Instruction Set Architecture)
- Аритметичке операције: add, sub, div, mul, . . .
- Померање података:
  - са улазног уређаја у меморију
  - из меморије на излазни уређај
  - са једне меморијске локације на другу
- Условно гранање: извршавање кода уколико је логички услов испуњен

#### Условно гранање

- Кључни механизам омогућава имплементацију било ког алгоритма
- Концпети виших програмских језика као што су if, else, for, while, switch се своде на условно гранање

#### Instruction Set Architecture

- Представља слој апстракције изнад микроархитектуре
- Главна разлика између различитих ISA је у количини логике коју појединачна инструкција може да садржи
- Подела: CISC (Complex Instruction Set Computer), RISC (Reduced Instruction Set Computer)
- x86 је иницијално био класична CISC архитектура
- Данас x86 инструкције на нивоу ISA се преводе у микроинструкције налик на RISC инструкције
  - ово се дешава на нивоу микроархитектуре и програмер тога није свестан!

## Микроархитектура

- Представља конкретну имплементацију ISA
- Замисао је да се кроз време имплементација побољшава, а да се задржи компатибилност са постојећим софтвером
- Неке разлике између различитих микроархитектура:
  - параметри кеша (капацитет, асоцијативност, величина линије, број нивоа)
  - број језгара
  - подршка за механизме који крше секвенцијалан модел извршавања

## Меморијска хијерархија I

Ideally one would desire an indefinitely large memory capacity such that any particular... word would be immediately available... We are... forced to recognize the possibility of constructing a hierarchy of memories each of which has greater capacity than the preceding but which is less quickly accessible.

Burks, Goldstine, von Neumann (1946)

## Меморијска хијерархија II

- Проблем: не постоји бесконачно брза и бесконачно велика меморија
- Чињеница: постоје технологије меморије које омогућавају релативно велики капацитет, по цену релативно мале брзине
  - ...као и обрнуто!
  - брзина и капацитет меморије су, по правилу, обрнуто сразмерни
- Да ли је могуће добити највећи капацитет уз највећу брзину, по најмањој цени?
- Меморијска хијерархија нам ово донекле омогућава
  - цена: приближно најспорија меморија
  - брзина: приближно најбржа меморија



# Меморијска хијерархија III





#### Локалитет I

- **Просторни локалитет**: уколико је некој локацији приступљено, вероватно ће бити приступљено и суседним локацијама
  - пример: приступање суседним елементима низа, извшавање наредних инструкција
- Временски локалитет: уколико је некој локацији приступљено, вероватно ће јој бити приступљено поново у скоријем временском периоду
  - пример: позив методе у петљи, приступ елементима linked list
- Мерењима је доказано да програми поштују наведене особине

#### Локалитет II

- Цео меморијски подсистем је оптимизован за програме који поштују локалитет
  - уколико покренемо заједно један програм који поштује локалитет (Matlab) са другим који не поштује (GCC), може да дође до давања предности оном који поштује!
- Поједине специјализоване архитектуре избацују кеш меморију уколико није могуће направити решење које поштује локалитет
  - у овом случају, кеширање би успорило програм
- Занимљивост: постоје случајеви у којима су операције над *array list* брже него над *linked list*, јер иако је временска сложеност операција већа, операције се далеко брже извршавају уколико је цео низ у кешу!

## Кеш меморија I

- Сваки приступ меморији иде кроз кеш
- Линија кеша: најмања јединица (64 бајта)
- Чува тренутно потребан подскуп радне меморије
  - подскуп се динамички одређује уз претпоставку локалитета
  - иницијално: приступ меморијској локацији довлачи линију у кеш
  - касније: предвиђање шаблона меморијских приступа, кеширање унапред (Intel Prefetch)
- Програмер не мора да буде свестан конкретне имплементације кеша
  - али је то, у одређеним случајевима, пожељно
  - постоје инструкције које омогућавају измену стања кеша (CLFLUSH, PREFETCHW)



## Кеш меморија II



## Кеш меморија III

- Cache hit: тражени податак је пронађен у кешу
- Cache miss: тражени податак није пронађен у кешу
- **Hit time**: време које је потребно да се утврди да ли је тражени податак у кешу
- Miss time: време које је потребно да се тражени податак добави у кеш

### Предвиђање гранања

- if(x < y) {...} else {...}
- Променљиве х и у представљају вредности из радне меморије
- Одређивање гране коју треба извршити није могуће док обе вредности не буду добављене у кеш
- Условно гранање често изазива cache miss
  - ...и на тај начин зауставља рад процесора
- Идеја:
  - извршавање гране за коју се претпоставља да ће бити изабрана док се чека IO
  - чување или одбацивање резултата након утврђивања да ли је извршавање гране требало да се деси

#### Прекоредно извршавање

- a1 = b1 + c1; a2 = b2 + c2; a = a1 + a2;
- Шта ако су вредности **b2** и **c2** у кешу, а потребно је прво сачекати добављање **b1** и **c1**?
- У секвенцијалном моделу извршавања, процесор би био заустављен
- Идеја:
  - на нивоу ISA задржавамо секвенцијални модел извршавања
  - на нивоу микроархитектуре инструкције извршавамо у редоследу који зависи од доступних података
  - резултат програма мора остати исти!



## Индирекција

- Било који проблем у рачунарству може бити решен још једним нивоом индирекције, осим наравно проблема превише индирекција (David J. Wheeler)
- Индирекција омогућава имплементацију контроле приступа
- Извршавање акције мора да одобри посредник који дефинише правила приступа

### Контрола приступа у хардверу

- Рачунар без контроле приступа би донекле био употребљив у једнокорисничком окружењу
  - ...али неупотребљив у вишекорисничком
  - чак и у једнокорисничком окружењу, одсуство изолације процеса представља велику опасност
- Основне градивне блокове је неопходно имплементирати у хардверу
  - софтвер можда неће бити рад да сарађује!
- Кључни механизми: режими рада процесора, виртуелна меморија

#### Режими рада процесора

- Привилеговани: Ю, меморијске табеле, табеле прекида
  - кернел
- Неривилеговани: аритметичко/логичке операције, условно гранање, ограничен приступ меморији, системски позив
  - кориснички софтвер
- Прелазак из непривилегованог у привилеговани режим је могућ приликом прекида или системског позива
- Кернел одбија захтев уколико кориснички процес нема потребне привилегије и убија га

## Виртуелна меморија I

- Додељивање виртуелног адресног простора сваком процесу омогућава:
  - изолацију процеса
  - употребу већег капацитета радне меморије од доступног
  - дељење заједничког кода код динамички везаних програма
- Меморија се дели на странице
  - више процеса могу да деле исту физичку страницу
  - права приступа је могуће подесити на нивоу странице
- Недозвољен приступ изазива segmentation fault



## Виртуелна меморија II



#### Покретање оперативног система 1

- Процесор се буди у привилегованом режиму
- Учитава се кернел
- Иницијализују се табеле прекида
- Иницијализују се меморијске табеле
- Контрола се предаје корисничким програмима, прелази се у непривилегован режим
- Овако подешен посредник (кернел) више није могуће уклонити или заобићи
  - …под претпоставком да нема багова у имплементацији кернела и хардвера

### Покретање оперативног система II



## Употреба кеша као side-channel

- До сада смо причали о механизмима који нам омогућавају безбедно дељење рачунара и побољшање перформанси секвенцијалног модела
- Безбедност и перформасе су често супротни захтеви у дизајну!
- Приступ вредности учитаној у кеш је видно брже од вредности из радне меморије
- Заједничко за оба напада је да извршавају недозвољен меморијски приступ спекулативно
  - пошто је извршавање спекулативно, процесор ефекте чува/одбацује накнадно
  - комплетно одбацивање резултата није могуће
  - стање ISA се успешно поништава, али остаје видљиво стање микроархитектуре (вредности у кешу!)

## Flush/Evict + Time I

- Алоцирамо низ
- Изазивамо недозвољен приступ меморији
- Приступамо елементу низа чији индекс одговара тајној вредности
- Итерирамо кроз низ и меримо време потребно за приступ елементима
  - уколико је приступ брз, вредност је кеширана
  - успешно смо пренели тајну вредност
- Уклањамо цео низ из кеша и приступамо наредној недозвољеној адреси
  - Flush+Time: низ уклањамо из кеша инструкцијом CLFLUSH
  - Evict+Time: низ уклањамо из кеша циљаним меморијским приступима

# Flush/Evict + Time II

| елемент    | кодирана вредност | време приступа |
|------------|-------------------|----------------|
| a[x * 0]   | 0                 | 300 ns         |
| a[x * 1]   | 1                 | 300 ns         |
| a[x * 2]   | 2                 | 5 ns           |
| a[x * 3]   | 3                 | 300 ns         |
|            |                   |                |
| a[x * 254] | 254               | 300 ns         |

Скалирање за вредност x је неопхондно јер би у супротном једна линија кеша представљала 16 вредности, јер је **int** ширине 32 бита, а величина линије кеша је углавном 64 бајта

# Flush/Evict + Time III

```
for (i = 0; i < pow(2, 32); i++) {
    t1 = time():
    y = side chan arr[i * 4096];
    t2 = time();
    elapsed = t2 - t1;
    if(elapsed < CACHE HIT TRESHOLD) {</pre>
        println("Stolen_value:", i);
```

#### Spectre: увод

- Мета напада: кориснички део меморије активног процеса
- Због чега ово представља проблем?
  - процес би требало да види своју корисничку меморију
- Проблем: Web/JavaScript
  - све скрипте се извршавају у оквиру истог процеса
  - у оквиру истог адресног простора се налазе тајне вредности различитих веб апликација
  - интерпретер онемогућава недозвољен приступ
  - ...али нема начин да спречи спекулативно извршавање



### Spectre: напад I

```
if(x < arr_size) {
    y = side_chan_arr[arr[x] * 4096];
}</pre>
```

х: вредност коју бира нападач

у: додела вредности која се успешно одбацује

arr: помоћни низ који користимо како би приступили недозвољеној адреси

side\_chan\_arr: низ који користимо као side-channel. присуство елемента низа у кешу се не одбацује!

### Spectre: напад II

```
if(x < arr_size) {
    y = side_chan_arr[arr[x] * 4096];
}</pre>
```

Напад почињемо тако што прво као x бирамо валидну вредност ( $x < arr\_size$ ). Овиме *убеђујемо* предиктор гранања да је грану углавном потребно извршити.

#### Spectre: напад III

```
if(x < arr_size) {
    y = side_chan_arr[arr[x] * 4096];
}</pre>
```

Потом, бирамо вредност  $\mathbf{x}$  која излази из граница низа. Добијена адреса представља потенцијално скривену вредност из адресног простора нашег процеса.

## Spectre: напад IV

```
if(x < arr_size) {
    y = side_chan_arr[arr[x] * 4096];
}</pre>
```

Уколико је предиктор гранања одлучио да изврши грану, долази до приступа елементу из **side\_chan\_arr** који одговара добијеној вредности.

Ово изазива довлачење дела низа side\_chan\_arr у кеш.

## Spectre: напад V

```
if(x < arr_size) {
    y = side_chan_arr[arr[x] * 4096];
}</pre>
```

Процесор накнадно закључује да извршавање гране није требало да се деси јер се  $x < arr\_size$  евалуира у false.

Додела вредности променљивој y се успешно одбацује.

Стање кеша се не одбацује! Линија је добављена и њено присуство је могуће проверити.

### Meltdown: увод

- Мета напада: кернелски део меморије активног процеса
- Због чега ово представља проблем?
  - кернелски део меморије садржи криптографске кључеве и остале тајне вредности сакривене од корисничког процеса
  - тајне вредности је могуће употребити за стицање већих привилегија
- Представља баг у Intel имплементацији
  - при спекулативном извршавању нема провере права приступа меморијској локацији
  - процесор пријављује грешку тек по покушају чувања резултата
  - AMD и ARM нису подложни овом нападу



## Meltdown: напад I

```
; rcx = kernel address, rbx = probe array
    xor rax, rax
retry:
    mov al, byte [rcx]
    shl rax, 0xc
jz retry
    mov rbx, qword [rbx + rax]
```

У раду је представљена имплементација у асемблеру.

Ради лакшег разумевања, ми ћемо представити имплементацију у С.

## Meltdown: напад II

```
kernel_addr = 0x1234;
stolen_val = *kernel_addr;
y = side_chan_arr[stolen_val * 4096];
```

```
kernel_addr: кернелска адреса коју бира нападач stolen_val: вредност ускладиштена на кернелској адреси у: додела вредности која се успешно одбацује side_chan_arr: низ који користимо као side-channel. присуство елемента низа у кешу се не одбацује!
```

### Meltdown: напад III

```
kernel_addr = 0x1234;
stolen_val = *kernel_addr;
y = side_chan_arr[stolen_val * 4096];
```

Страница којој адреса припада је означена као кернелска. Уколико се код извршава спекулативно, процесор накнадно пријављује грешку.

Временски опсег од недозвољног приступа до пријављивања грешке није велики, али је извођење напада и даље могуће.

### Meltdown: напад IV

```
kernel_addr = 0x1234;

stolen_val = *kernel_addr;

y = side_chan_arr[stolen_val * 4096];
```

Уколико се код извршава спекулативно, приступ се десио и учитана је вредност са кернелске адресе.

Долази до приступа елементу из side\_chan\_arr који одговара добијеној вредности.

Додела вредности променљивој  ${f y}$  се успешно одбацује.

Стање кеша се не одбацује! Линија је добављена и њено присуство је могуће проверити.



#### Литература

- Spectre Attacks: Exploiting Speculative Execution
- Meltdown: Reading Kernel Memory from User Space
- Computer Organization and Design: The Hardware/Software Interface, David A. Patterson & John L. Hennessy
- Системски софтвер (презентације), Иван Нејгебауер
- Напади на модерне процесоре (презентација), Иван Нејгебауер
- Operating Systems: Internals and Design Principles, William Stallings
- Preliminary Discussion of the Logical Design of an Electronic Computing Instrument