#### Aulas 25, 26 e 27

- Memória Virtual
  - Motivações para a sua utilização
  - Endereço virtual, endereço físico
  - Page table. Tradução de endereços. Page fault
  - "Translation-lookaside buffer" (TLB)
  - Integração da memória virtual com TLB e cache

José Luís Azevedo, Arnaldo Oliveira, Tomás Silva, Bernardo Cunha

# Introdução

• Num sistema apenas com memória física



• Os endereços gerados pelo CPU apontam diretamente para as posições de memória a que este pretende aceder

# Introdução

- Num sistema multi-processo, a memória disponível tem de ser partilhada pelos processos em execução
  - Cada processo tem as suas próprias necessidades de memória
- A memória pode facilmente ser corrompida se um processo escrever (de forma involuntária ou intencional) na zona de memória atribuída a outro processo
  - O processo que viu a sua zona de memória alterada falhará por razões que nada têm a ver com a sua lógica de funcionamento
- Como gerir adequadamente a memória disponível entre os vários processos?
- O que fazer se a memória necessária para executar todos os processos for superior à memória física disponível?
- Como garantir que um processo n\u00e3o escreve na zona de mem\u00f3ria atribu\u00edda a outro processo?

#### Memória virtual

- É uma abstração que permite uma utilização eficiente do sistema de memória em sistemas multi-processo (mantendo o modelo de memória hierárquica)
- Esta técnica é usada em sistemas de computação geral baseados em microprocessador, com sistema operativo (não usado em sistemas simples baseados em microcontrolador)
- O conceito de "memória virtual" não é novo: descrito pela primeira vez por Kilburn et al. em 1962

# Motivações para a utilização de Memória virtual

- Eficiência na utilização da memória
  - Memória deve ser partilhada pelos vários processos em execução
  - Em memória apenas deve residir a informação necessária
- Segurança
  - Devem existir mecanismos de segurança que impeçam que um processo altere as zonas de memória dos outros processos
- Transparência
  - Um processo tem acesso a muita memória (eventualmente mais do que a memória física DRAM)
  - Um processo corre como se toda a memória lhe pertencesse
- Partilha de memória
  - Vários processos podem aceder à mesma zona de memória (de forma controlada)

#### Memória virtual

- Utilização eficiente da memória física:
  - Vários programas podem estar em execução "simultânea" no computador
  - A quantidade de memória total necessária para executar todos os programas pode ser superior à memória física disponível
  - No entanto, apenas uma fração dessa quantidade de memória está ativamente a ser usada num determinado instante de tempo
  - Assim, na memória principal apenas é necessário ter as "zonas ativas" de todos os programas (instruções e dados) a correr no computador (a restante pode estar em disco)
  - O sistema operativo pode reservar mais memória para um processo ou libertar memória que já não esteja a ser usada, de acordo com as necessidades

#### Memória virtual

#### • Segurança:

- Múltiplos processos partilham a mesma memória física
- É necessário usar mecanismos de proteção que assegurem que um dado processo apenas acede (leitura e/ou escrita) às zonas de memória que lhe foram atribuídas
- Endereços usados pelos processos não são endereços da memória física
- Transparência
  - Cada processo tem o seu próprio espaço de endereçamento que pode usar na totalidade, de forma exclusiva
  - Cada processo executa como se fosse o único a ocupar a memória
- Partilha de memória
  - Com a implementação de mecanismos de proteção torna-se possível a partilha de zonas de memória entre processos



- Os endereços virtuais gerados pelo CPU são convertidos para endereços físicos através de uma tabela – "Page Table"
- A tradução de endereços tem que ser temporalmente eficiente

#### Nomenclatura-base

- Endereço físico (physical address)
  - Um endereço da memória principal (e.g. DRAM)
- Endereço virtual (virtual address)
  - Um endereço que corresponde a uma posição num espaço de endereçamento virtual. Este endereço é traduzido num endereço físico quando o CPU acede à memória
- Tradução de endereços (address translation)
  - O processo pelo qual um endereço virtual é traduzido num endereço físico

- Os espaços de endereçamento virtual e físico são divididos em blocos; os blocos têm a mesma dimensão nos dois espaços de endereçamento
  - Na terminologia de memória virtual estes blocos designam-se por "páginas"
- Cada processo tem o seu próprio espaço de endereçamento virtual
  - O espaço de endereçamento virtual de todos os processos pode seguir o mesmo modelo
    - Ter início no mesmo endereço, ter o data segment na mesma zona, etc.
  - A atribuição de páginas físicas a páginas virtuais é controlada pelo sistema operativo
  - Quando o processo é carregado em memória, o sistema operativo faz a atribuição dos endereços físicos a endereços virtuais (relocation – construção da "page table")
  - A relocação permite que um programa possa ser carregado em qualquer página de memória

• Espaço de endereçamento virtual de N bits Espaço de endereçamento físico de M bits (com M < N)</li> **Address** 0 **Translation** VP<sub>1</sub> **Virtual Address** PP 2 VP 2 Space for VP3 **Process 1:** 2N-1 **Physical PP 7 Address Space** 0 VP<sub>1</sub> **Virtual Address PP 10** VP<sub>2</sub> **Space for Process 2:** VP3 **9M\_1** 2N-1 Neste exemplo a página física 7 é partilhada pelos dois processos VP ≡ Virtual page

VP ≡ Virtual page PP ≡ Physical page Neste exemplo a página física 7 é partilhada pelos dois processos com endereços virtuais diferentes (exemplo de um zona de memória partilhada: leitura ou leitura/escrita)

 Mapeamento entre um endereço virtual (N bits) e um endereço físico (M bits) - exemplo c/ N = 32 bits e M = 30 bits



- Espaço de endereçamento virtual:  $2^{32} = 4$  GB
- Espaço de endereçamento físico:  $2^{30} = 1$  GB
- Dimensão da página: 2<sup>12</sup> = 4 KB
- Número de páginas da memória física:  $2^{18} = 256K$
- Número de páginas da memória virtual: 2<sup>20</sup> = 1 M

# Tradução de endereços

- A tradução de endereços tem que ser rápida, uma vez que ocorre em cada acesso do CPU à memória
- A *page table* contém um número de entradas igual ao número máximo de páginas virtuais (para o exemplo dado anteriormente, a tabela teria 2<sup>20</sup> entradas). Por esta razão não é necessária uma "tag"
- O número da página virtual (VPN) é utilizado para indexar diretamente a page table

### Tradução de endereços



# Operação

- Tradução
  - Uma *page table* por processo
  - O Virtual Page Number (VPN), emitido pelo processador, forma o índice de acesso à *page table*
- Determinação do endereço físico da página
  - A entrada da tabela correspondente ao VPN contém informação sobre a página:
  - Se "valid bit = 1" a página reside na memória
    - O endereço de acesso é obtido da entrada da tabela correspondente ao VPN concatenado com o "page offset"
  - Se "valid bit = 0" a página reside no disco
    - Page fault
    - Substituição de uma página residente em memória pela página pretendida (que reside em disco)
- Proteção
  - Os privilégios de acesso à página (Read, Read/Write, Execute) são verificados em cada tradução (para cada VPN)

### Tradução de endereços







- Se a página que o CPU pretende aceder não está em memória ("Valid bit" da *page table* com o valor 0), é gerado um *page fault*
- Um page fault tem um custo elevado em termos temporais
- Os *page faults* são tratados por software:
  - O gestor de memória (MMU) gera uma interrupção que transfere o controlo para o Sistema Operativo
  - O Sistema Operativo decide onde colocar, na memória, a página em falta e desencadeia a respetiva transferência a partir do disco (tarefa que pode demorar milhões de ciclos de relógio...)
  - O Sistema Operativo suspende o processo corrente e lança outro
  - O processo suspenso poderá ser retomado quando a transferência terminar
- Estrutura mantém posição das páginas virtuais em disco

- Política de substituição de páginas na memória:
  - LRU (least recently used é substituída a página que está há mais tempo sem ser referenciada)
- Implementação do LRU
  - Cada VPN de uma "Page table" contém um "reference bit"
  - Periodicamente os "reference bits" são colocados a zero
  - Quando uma página é acedida (touched) o "reference bit" é colocado a 1
  - As páginas candidatas a serem substituídas são as que têm o "reference bit" a 0

### Parte do processamento de um "page fault"

- 1. SO configura o "I/O controller" para transferir, para memória, a página em falta (bloco):
  - Dimensão do bloco
  - Endereço de início no disco
  - Endereço destino na memória (escolhido pelo SO)
- 2. A transferência processa-se por DMA
- 3. O "I/O controller" sinaliza o fim da transferência:
  - Gera uma interrupção
  - O SO retoma a execução do processo suspenso



### Implementação de mecanismos de proteção

- Os espaços de endereçamento de cada processo são independentes
- Um processo não pode interferir com o funcionamento de outro, seja de forma involuntária ou de forma intencional
- Zonas diferentes do espaço de endereçamento podem ter diferentes permissões de acesso (e.g.: uma zona de instruções não pode ter permissão de escrita, uma zona de dados não pode ter permissão de execução, etc.)
- Um processo não pode (se não tiver permissões para tal) aceder a uma zona de informação privilegiada
- Os privilégios de acesso à página (Read, Read/Write, Execute) são verificados em cada tradução (para cada VPN)

### Implementação de mecanismos de proteção

- Cada entrada da "page table" contém informação relativa a privilégios de acesso do processo respetivo:
  - Read
  - Read / Write
  - Execute

#### **Page Table**



**Process** 

### Implementação de mecanismos de proteção

• O hardware gera uma interrupção se ocorrer uma tentativa de violação do privilégio de acesso (e.g. "General protection fault", "Segmentation fault") **Page Table** Read? Write? Physical Addr **Memory** XX No **Process** i PP 9 Yes **PP 4** XX No • • • **Page Table Read? Write? Physical Addr** XX No *(...)* **Process** j **PP 6** 2N-1 Yes **PP 9** VP<sub>3</sub> No XX

#### Política de escrita

- Write-back a utilização de um esquema do tipo "write-through" seria impraticável uma vez que a escrita de uma página no disco demora um tempo que penalizaria fortemente o desempenho do sistema
  - Escrita em disco página a página
  - Página só é escrita em disco quando necessita de ser retirada da memória física

#### Dirty bit

- Se "dirty bit" = 0, a página não necessita de ser escrita em disco aquando da sua substituição (overwrite)
- Se "dirty bit" = 1, a página que vai ser substituída foi alterada. Antes de ser substituída, essa página é copiada para o disco; após essa operação, a nova página é então copiada do disco para a zona da memória que ficou livre

#### Write-allocate

• Escrita numa página que não reside em memória física: carrega essa página para a memória e escreve

#### **Problema**



- A(s) page table(s) residem na memória principal. Isso significa que cada acesso à memória virtual implica dois acessos à memória física:
  - 1 acesso para indexar a *page table* e obter o endereço físico
  - 1 acesso para ler/escrever os dados

# Solução: Translation-lookaside buffer (TLB)

- Os acessos à memória virtual contêm localidade espacial e temporal
- Uma forma de resolver o problema é ter uma parte da *page table* numa memória rápida, semelhante a uma cache, onde se encontram as entradas da tabela mais recentemente utilizadas
- Esta memória é normalmente designada por "translation-lookaside buffer" - TLB
- A TLB é uma memória associativa com procura paralela
- Em cada acesso o TLB é verificado
  - "Hit" continua
  - "Miss" a *page table* é verificada pode originar (ou não) um *page fault*
- Páginas residentes em disco não são referenciadas na TLB

#### Translation-lookaside buffer (TLB)



#### TLB + Memória virtual + cache



# Operação da hierarquia de memória



# Tradução de endereços com a TLB

- Combinações possíveis dos eventos iniciados por
  - TLB (miss / hit)
  - Page Table (miss / hit, miss ≡ page fault)
  - Cache (miss / hit)

| TLB  | Page<br>Table | Cache | Possível?                                                       |  |  |
|------|---------------|-------|-----------------------------------------------------------------|--|--|
| miss | miss          | miss  | Sim! Os dados não estão em memória                              |  |  |
| miss | miss          | hit   | Não! A página não está em memória, hit na cache impossível      |  |  |
| miss | hit           | miss  | Sim! A página está memória, dados não disponíveis na cache      |  |  |
| miss | hit           | hit   | Sim! A página está em memória, dados na cache                   |  |  |
| hit  | miss          | miss  | Não! A página não está referenciada na "page table"             |  |  |
| hit  | miss          | hit   | Não! A página não está referenciada na "page table"             |  |  |
| hit  | hit           | miss  | Sim! Página referenciada na TLB, dados não disponíveis na cache |  |  |
| hit  | hit           | hit   | Sim! Página referenciada na TLB, dados disponíveis na cache     |  |  |

# Tradução de endereços com a TLB



# Tradução de endereços com a TLB - Exemplo

- Memória virtual:
  - Espaço de endereçamento virtual: 32 bits
  - Espaço de endereçamento físico: 30 bits
  - Dimensão da página: 4 KB (12 bits)
    - VPN 20 bits
    - PPN 18 bits
- Cache:
  - Mapeamento direto
  - Dimensão do bloco 64 bytes (6 bits)
  - No de linhas: 256 (8 bits)

# Tradução de endereços com a TLB - Exemplo



• Complete a seguinte tabela, preenchendo as quadrículas em falta e substituindo o ? pelo valor adequado. Utilize as seguintes unidades:  $K = 2^{10}$  (Kilo),  $M = 2^{20}$  (Mega),  $G = 2^{30}$  (Giga),  $T = 2^{40}$  (Tera),  $P = 2^{50}$  (Peta) ou  $E = 2^{60}$  (Exa).

| Virtual address size (n) | # Virtual addresses (N) | Maior endereço virtual (hexadecimal) |
|--------------------------|-------------------------|--------------------------------------|
| 8                        | $2^8 = 256$             | 0xFF                                 |
|                          | 2 <sup>?</sup> = 64 K   |                                      |
|                          |                         | 0xFFFFFFF                            |
|                          | 2 <sup>?</sup> = 256 T  |                                      |
| 64                       |                         |                                      |

• Determine o número de entradas da *page table* (PTE) para as seguintes combinações de número de bits do espaço de endereçamento virtual (n) e dimensão da página (P):

| n  | P    | # PTEs |
|----|------|--------|
| 16 | 4 KB |        |
| 16 | 8 KB |        |
| 32 | 4 KB |        |
| 32 | 8 KB |        |
| 48 | 4 KB |        |

- Suponha um espaço de endereçamento virtual de 32 bits e um espaço de endereçamento físico de 24 bits:
  - determine o número de bits dos campos: VPN (virtual page number), VPO (virtual page offset), PPN (physical page number), PPO (physical page offset) para as dimensões de página P:

| Р    | VPN | VPO | PPN | PPO | # virtual pages | # physical pages |
|------|-----|-----|-----|-----|-----------------|------------------|
| 1 KB |     |     |     |     |                 |                  |
| 2 KB |     |     |     |     |                 |                  |
| 4 KB |     |     |     |     |                 |                  |
| 8 KB |     |     |     |     |                 |                  |

• para cada dimensão de página, determine o número de páginas virtuais e físicas

• Considere um sistema de memória virtual com um espaço de endereçamento virtual de 26 bits, páginas de 512 bytes, em que cada entrada da "page table" está alinhada em endereços múltiplos de 2, tem 16 bits de dimensão, e está organizada do seguinte modo:

#### Valid bit, Dirty bit, Read flag, Write flag, PPN

- em quantas páginas está organizado o espaço de endereçamento virtual? Quantas entradas tem a "page table"?
- qual a dimensão do espaço de endereçamento físico?
- em quantas páginas está organizado o espaço de endereçamento físico?
- Suponha que o "page table register" do processo em execução tem o valor 0x1A0 e que no endereço 0x252 (e 0x253) está armazenado o valor 0xA26C
  - quais os atributos da página física referenciada por essa entrada da tabela? Onde reside a página física?
  - qual é o VPN representado nessa entrada da "page table"?
  - qual o endereço inicial e final da página física?
  - qual a gama de endereços virtuais que indexa esta entrada da "page table"?