# Ассемблер х86

### Програмное управление

- Программа и данные хранятся в оперативной памяти
- Программа кодируется в виде инструкций процессора
- Шаги выполнения инструкции:
  - i. Instruction fetch
  - ii. Instruction decode and register fetch
  - iii. Execute
  - iv. Memory access
  - v. Register write back

## Ассемблер

- Максимально приближен к машинному коду
- Вследствие этого платформозависимый

#### CISC vs RISC

- Complex(Reduced) Instruction Set Computers
- x86 CISC, ARM RISC
- Переменная длина инструкции и больше набор инструкций
- Сложности с пайпланингом
- Инструкции исполняются разное число тактов

#### Регистры

- Очень быстрые ячейки памяти на самом процессоре
- по 64 бита на х86-64
- числа в two-complement little endian
- Регистры общего назначения: rax, rbx, rcx, rdx, rsi, rdi, r8-r15
- Специальные: rbp, rsp, rip, rflags,...

## Вложенность регистров

| 7   | 6 | 5 | 4 | 3 | 2 | 1  | 0  |
|-----|---|---|---|---|---|----|----|
| rax |   |   |   |   |   |    |    |
| eax |   |   |   |   |   |    |    |
| ax  |   |   |   |   |   | X  |    |
|     |   |   |   |   |   | ah | al |

#### Команды

```
label_name:
cmd op1, op2, ...
```

#### Типы операндов команд:

- імм константы
- r регистры
- m память

Хотя бы один из операндов должен быть регистром.

#### Intel vs AT&T синтаксисы

Intel: mov rax, [rax, 2 \* rcx + 0x10]

AT&T: mov 0x10(%rax, %rcx, 2), %rax

#### Работа с памятью

- то загружает значение ячейки памяти
- lea загружает адрес ячейки памяти

Hапример: mov rax, [rsi]

## Арифметика

- add
- sub
- mul
- div

Например: add dst, src

#### Флаги

- Регистр EFLAGS содержит специальные биты-флаги результата операции
- Основные флаги:
  - ZF в результате операции получился 0
  - sf результат отрицательный
  - оғ знаковое переполнение
  - сғ беззнаковое переполнение

### Примеры выставления флагов

Для простоты будем рассуждать в терминах 4-битных чисел:

- 0x0001 0x0001 = 0x0000 (Bыставится ZF)
- $0 \times 00000 0 \times 00001 = 0 \times 1111$  (ВЫСТАВИТСЯ SF)
- 0x1111 + 0x0001 = 0x0000 (выставится СF)
- $0 \times 0111 + 0 \times 00001 = 0 \times 1000$  (ВЫСТАВИТСЯ OF)

### Вычисление флагов

- Есть инструкции для вычисления флагов без изменения регистров общего назначения
- Результат используется для условных переходов
- cmp (аналог sub)
- test (аналог and)

#### Переходы

- j\*\* label\_name перейти на метку
- јтр безусловный переход
- ј перейти, если выставлен ZF
- Для знакомых чисел jl, jle и т. д.
- Для беззнаковых чисел jb, jbe и т. д.

#### **Godbolt**



### **Calling conventions**

- rsp указывает на вершину стека
- Первые 6 аргументов передаются в регистрах rdi, rsi, rdx, rcx, r8, r9, остальные на стеке
- Возвращается значение в гах
- При вызове функции через call на вершину кладётся адрес возврата
- ret достаёт со стека адрес возврата и переходит по нему



### **Calling conventions**

- При вызове функций вершин стека ( rsp ) должна быть выровнена по 16 байт
- Нужно сохранить значения rax, rdi, rsi, rdx, rcx, r8, r9, r10, r11, если они вам нужны
- rbx, rsp, rbp, r12, r13, r14, r15 нужно вернуть в неизменном виде после выхода из функции

#### Векторные регистры

- SIMD (single instruction multiple data)
- SSE/AVX/AVX-512
- xmm0-xmm15, ymm0-ymm15, zmm0-zmm15, caller-saved
- Аргументы передаются в хммо-хмм7
- Возвращаемое значение в хмм0

#### Скалярные инструкции

Суффикс sd означает double, ss означает float.

- Арифметика: addsd dst, src
- Преобразование типов: cvtsi2sd dst, src
- Сравнение: comisd dst, src

#### Векторные инструкции

Общий вид: op[ap|up][s|d] dst, src

- ар для загрузки из памяти, выровненной по длине регистра
- s для float, d для double

Пример: addps xmm0, xmm1

Для AVX: vaddps xmm0, xmm1, xmm2

#### **Intrinsics**

Расширения компилятора, позволяющие использовать векторные инструкции в коде на с.

```
for (int i = 0; i < n; i+= 8) {
    __m256 r1 = _mm256_load_ps(a + i);
    __m256 r2 = _mm256_load_ps(b + i);
    __m256 r3 = _mm256_add_ps(r1, r2);
    _mm256_store_ps(&c[i], r3);
}</pre>
```

## The End