# Prova 2023

* [exercicios de sequência de acesso com simuladores](https://youtu.be/um9Se1Nub6Y)


* [aula de revisão para **questão 1 e 2** da prova 2023](https://youtu.be/knAflJ3Qmz0)

* [colab de treino de questoes de tamanho dos campos](https://colab.research.google.com/drive/1dmRzbEnBkj3LgcAaKjobFRPek_aPJ_aa?usp=sharing)

# Cache

![](https://raw.githubusercontent.com/arduinoufv/inf450/master/figures/Captura%20de%20tela%20de%202022-08-21%2010-25-21.png)

# Cache and Star Wars

A long time ago, in a galaxy far, far away, the Empire was struggling with high latency memories. They knew they needed to act quickly to save their systems from failing completely. The solution they found was to exploit the spatial and temporal locality of their data by implementing a cache.

Through the power of the Force, they utilized associativity to reduce cache conflicts and increase the efficiency of their system. By using medium size blocks, they were able to reduce the miss rate and avoid unnecessary trips to memory.

The Empire also knew that they needed to avoid constantly writing to memory, which would only slow down their system even further. So they implemented the write back method to reduce writes to memory, and keep their system running smoothly.

Finally, the Empire used the power of the Dark Side to implement the LRU (Least Recently Used) method, ensuring that the most recent data was always kept in the cache.

Thanks to these powerful techniques, the Empire was able to save their systems from the brink of failure. They could continue to rule the galaxy with ease, knowing that their cache was always working to keep their systems running smoothly and efficiently.

In [None]:
#@title Criando a pasta local com as figuras
!mkdir caches
%cd caches
!wget https://github.com/arduinoufv/inf450/raw/master/cache/figuras/cache1.png &> /dev/null
!wget https://github.com/arduinoufv/inf450/raw/master/cache/figuras/cache2.png &> /dev/null
!wget https://github.com/arduinoufv/inf450/raw/master/cache/figuras/cache3.png &> /dev/null
!wget https://github.com/arduinoufv/inf450/raw/master/cache/figuras/cache4.png &> /dev/null
%cd /content

/content/caches
/content


## Qual é a cache do Processador do Colab ?

In [None]:
!lscpu | grep cache

L1d cache:                       32 KiB
L1i cache:                       32 KiB
L2 cache:                        256 KiB
L3 cache:                        55 MiB


In [None]:
#@title Mostra uma animação da sequencia de figuras com controle manual para algumas figuras de Cache
import os
from IPython.display import Image

import ipywidgets as widgets
from ipywidgets import interact, interact_manual

fdir = "/content/caches/"
@interact
def show_images(file=os.listdir('caches/')):
    display(Image(fdir+file,height=400))

interactive(children=(Dropdown(description='file', options=('cache1.png', 'cache3.png', 'cache2.png', 'cache4.…

In [None]:
#@title Instalando plugin externos para suporte com Comandos mágicos a outras linguagens
!pip install git+https://github.com/lesc-ufv/cad4u &> /dev/null
!git clone https://github.com/lesc-ufv/cad4u &> /dev/null
%load_ext plugin



In [None]:
#@title Imprime
import pandas as pd
import ipywidgets as widgets
from IPython.display import display, clear_output

def Imprime(filename):
# create checkbox widget
  checkbox = widgets.Checkbox(
    value=False,
    description='Edit table',
    indent=False
  )

  # Lê o arquivo CSV e carrega em um dataframe
  df = pd.read_csv(filename, delimiter=';')
  df = df.fillna("-")
  from google.colab import data_table
  # define function to display dataframe
  def show_df(use_display):
    clear_output()  # clear current output
    if use_display:
        display(df)
    else:
        print(df)
    display(checkbox)
  # display checkbox and dataframe
  display(checkbox)
  show_df(checkbox.value)

  # define callback for checkbox widget
  def on_checkbox_change(change):
    show_df(change.new)

  # attach callback to checkbox widget
  checkbox.observe(on_checkbox_change, names='value')


# Simuladores

## Simulador do NTU

Ferramenta desenvolida pela 	Dr. Smitha Kavallur Pisharath Gopi
Nanyang Technological University com [vários tipos de Cache, escrita, sequências e tem um exemplo de memoria virtual](https://www3.ntu.edu.sg/home/smitha/ParaCache/Paracache/dmc.html)

In [None]:
#@title Demo
from IPython.display import YouTubeVideo
YouTubeVideo('4twk9S9nKQs')

## Simulador do Grupo do Prof. Sam Wolfson

The Hardware/Software Interface
Winter 2023 (wolfson@cs.uw.edu)

* [Cache Simulator](https://courses.cs.washington.edu/courses/cse351/cachesim/)

# Simuladores para apoio de exercícios




* [Simulador de Michigan](https://vhosts.eecs.umich.edu/370simulators/cache/simulator.html)


[Slides e Vídeos da avaliação de simuladores da turma de 2020](https://docs.google.com/presentation/d/1LNsp_3ZWud4W_AGfWaYfViiDl8C3dVWJSXZGu1XD2wI/edit?usp=sharing)

* [Colab Cache Mapeamento Direto em Verilog](https://colab.research.google.com/drive/1bh5ODMjvlMs8Zem0-SQ6tOvOpMCL16Ob?usp=sharing)

* [Colab Cache 2 way e Gradio em Verilog](https://colab.research.google.com/drive/1ELlrZ0N4BvWV8JeeCjpqECF8oA79znWk?usp=sharing)

* [Colab com o Simulador Valgrind](https://colab.research.google.com/drive/1FrlRcZ_Shg1IZSh-PPHvJZLSy0rLDR5N?usp=sharing)

# Exercicios de Cache para Treinamento

Para fazer o exercício, voce deve digitar a matricula. Para quem fizer pelo menos três vezes (com valores diferentes) cada um dos três exercícios (mínimo de 9, então), com a solução correta, ganha 1 ponto extra.

[link para o colab](https://colab.research.google.com/drive/1dmRzbEnBkj3LgcAaKjobFRPek_aPJ_aa?usp=sharing)

# Caches

Ideia: subconjunto da memória que é mais frequemente acessado (localidade temporal, localidade espacial dos dados e instruções).

* Tempo de acesso
* Tipos: onde será mapeado o dado
   * Direto: rápida e baixo custo, porém tem conflitos
   * N-way: reduz conflito, um pouco mais cara, continua rápida
   * Totalmente Associativa: sem conflitos, porém alto custo e mais lenta quando o dado está na cache.
* Política de Escrita
* Política de Substituição
* Múltiplas caches com Múltiplos Núcleos

# Cache Mapeamento Direto

## Definição

![](https://www.researchgate.net/profile/Philip-Shirvani/publication/3800962/figure/fig1/AS:669950486274049@1536740051086/Block-diagram-of-a-direct-mapped-cache.png)

* Uma cache de mapeamento direto é um tipo de memória cache em que cada bloco de dados da memória principal é mapeado para uma **única linha** da cache.

* O endereço de memória é dividido em **três partes**: o **índice da linha** da cache, o **deslocamento dentro da linha** da cache e o **tag** de identificação.
  * O índice da linha é usado para localizar a linha correspondente na cache
  * O deslocamento é usado para acessar o dado específico dentro da linha.
  * O tag de identificação é usado para verificar se o dado na linha da cache corresponde ao dado na memória principal.

* Se o **tag corresponder**, o dado é considerado válido e pode ser usado diretamente da cache, evitando a necessidade de acessar a memória principal.

* Se o **tag não corresponder**, é necessário buscar o dado na memória principal e atualizar a linha correspondente na cache.

* Uma cache de mapeamento direto é mais simples e fácil de implementar do que outros tipos de caches, mas pode levar a conflitos de cache se dois blocos de memória forem mapeados para a mesma linha da cache.

## Cálculo dos Campos de endereço para um exemplo

Para determinar a divisão do endereço em índice, tag e deslocamento, precisamos levar em consideração o tamanho da cache e o tamanho dos blocos.

No caso descrito, temos uma cache de 32 KBytes, o que equivale a 2^15 bytes. Como os blocos são de 8 bytes, a cache tem 2^15 / 8 = 2^12 blocos ou linhas.

$linhas = \frac{Tamanho Cache}{Tamanho Bloco} = \frac{2^{15}}{2^3}= 2^{12}=4096$ linhas

Já a memória principal tem 4 GBytes, o que equivale a 2^32 bytes.

Para a divisão do endereço em índice, tag e deslocamento, podemos usar a seguinte fórmula:

Endereço = Tag + Índice + Deslocamento

Onde:
- Tag é o número de bits necessário para identificar exclusivamente cada bloco na memória principal.
- Índice é o número de bits necessário para identificar qual linha da cache deve ser usada.
- Deslocamento é o número de bits necessário para identificar a posição do byte dentro do bloco.

Para encontrar a divisão adequada, precisamos encontrar o número de bits necessário para representar cada um desses valores. Como temos 2^12 blocos na cache, precisamos de 12 bits para o índice. O deslocamento é de 3 bits (2^3 = 8).

Para encontrar o número de bits necessários para a tag, podemos subtrair o número de bits do índice e do deslocamento do tamanho total do endereço. Assim, temos:

$Tag = Tamanho$ $do$ $Endereço - Índice - Deslocamento=$

$= 32 bits - 12 bits  - 3 bits= 17$ bits

Portanto, o endereço é dividido em:
- 17 bits para o tag
- 12 bits para o índice ou número da linha
- 3 bits para o deslocamento ou acesso dentro do bloco

## Custo da Cache

Para calcular o custo temos que considerar os recursos:
* Decodificador de linha
* Decodificador de bloco
* comparador
* Area para dados na Cache
* Area para Tag na Cache

Como parametros temos o tamanho do bloco, tamanho da cache e o tamanho da memória.

Iremos fazer os seguintes passos:

1. Dado o exemplo: 2 GB RAM, bloco 32 bytes e cache de 64 Kbytes.
2. Calcular o número de bits do endereço da RAM. 2 GB = $2^{31}$ Bytes, portanto são 31 bits de endereçamento.
3. Calcular número de linhas da cache. Cada linha tem um bloco. Portanto, número de linhas é o tamanho da cache dividido pelo tamanho do bloco. Linhas = $\frac{Cache}{bloco}=\frac{64K}{32}=2k$.
4. Calcular o número de bits para endereçar as linhas, que será 2k=$2^{11}$ Bytes. Portanto serão 11 bits.
5. Para o bloco precisaremos de 5 bits, pois $32=2^5$.
6. Finalmente, podemos calcular o tamanho do **tag**, total de bits para ram menos os bits de endereçamento da linha e do bloco. Portanto, para nosso exemplo será 31-11-5=15 bits.

[desenho fonte](https://excalidraw.com/#json=62He8nsHNcwPHmqj2liCi,1XASuUVlpmc10T9Hd5-wTQ)


<img src= "https://github.com/arduinoufv/inf450/blob/master/cache/figuras/cache_direto_2GB_64k_bloco_32.png?raw=true" width = "400px">


Para o custo teremos
* decodificador de linha 11:2K
* decodificador de bloco 5:32
* comparador de 15 bits
* 64 Kbytes de dados
* 2k * 15 bits para armazenar os **tags**


### Decoder

![](https://github.com/arduinoufv/inf450/blob/master/cache/figuras/decoder3to8.gif?raw=true)

[video](https://www.youtube.com/watch?v=GdghEJ2WT-w)

### Exercicios

1. RAM de 16 GB, Cache de 128KB, Bloco de 16 bytes, calcule os custos.

2. RAM de 4 GB, Cache de 512KB, Bloco de 8 bytes, calcule os custos.

1. RAM de 32 GB, Cache de 256KB, Bloco de 64 bytes, calcule os custos.



## Exemplos de Mapeamento na Cache

### Exemplo 1

Pequena cache e memória para fins didáticos. Cache com blocos de 2 bytes, memoria Ram de 256 bytes e uma cache de 8 bytes (4 linhas).

* supor que a memória $i$ tem o dado $i$, por exemplo m[4] = 4

Supor o conteudo inicial ilustrado abaixo:

In [None]:
#@title Execute para carregar a cache inicial
%%writefile exemplo.csv
Tag; Dados
 - ; -
 - ; -
 - ; -
 - ; -


Overwriting exemplo.csv


In [None]:
Imprime("exemplo.csv")

Unnamed: 0,Tag,Dados
0,-,-
1,-,-
2,-,-
3,-,-


Checkbox(value=True, description='Edit table', indent=False)

#### Sequencia de leituras

Ler posições 0x32 e 0x21. Iremos usar hexadecimal para facilitar as conversões.

* 0x32 = 0011 0010 em binário. Dividindo nos campos tag=$00110$, linha=$01$, dentro do bloco na posição =$0$

$ \begin{array}{lcc}
Tag & Linha   & Bloco  \\
\boxed{00110} & \boxed{01} & \boxed{0} \\
\end{array} $

Portanto teremos

$ \begin{array}{lccc}
Linha & Tag   & Dados  \\
      &       & 0 & 1 \\
\mbox{1 ou 01} & \boxed{00110} & \boxed{0x32} & \boxed{0x33} \\
\end{array} $


* 0x21 = 0010 0001 em binário. Dividindo nos campos tag=$00100$, linha=$00$, dentro do bloco na posição=$1$

Resulta na cache abaixo:


In [None]:
#@title Apos ler 0x32 e 0x21
%%writefile exemplo1.csv
Tag; Dados
 00100 ; 0x20,0x21
 00110 ; 0x32,0x33
 - ; -
 - ; -


Writing exemplo1.csv


In [None]:
Imprime("exemplo1.csv")

       Tag       Dados
0   00100    0x20,0x21
1   00110    0x32,0x33
2       -            -
3       -            -


Checkbox(value=False, description='Edit table', indent=False)

In [None]:
#@title Apos ler 0x04 e 0x0F
%%writefile exemplo2.csv
Tag; Dados
 00100 ; 0x20,0x21
 00110 ; 0x32,0x33
 00000 ; 0x4,0x5
 00001 ; 0xE,0xF


Writing exemplo2.csv


In [None]:
Imprime("exemplo2.csv")

   Tag       Dados
0  100   0x20,0x21
1  110   0x32,0x33
2    0     0x4,0x5
3    1     0xE,0xF


Checkbox(value=False, description='Edit table', indent=False)

In [None]:
#@title Apos ler 0x05 e 0x20
%%writefile exemplo3.csv
Tag; Dados
 00100 ; 0x20,0x21
 00110 ; 0x32,0x33
 00000 ; 0x4,0x5
 00001 ; 0xE,0xF

Writing exemplo3.csv


In [None]:
Imprime("exemplo3.csv")

Unnamed: 0,Tag,Dados
0,100,"0x20,0x21"
1,110,"0x32,0x33"
2,0,"0x4,0x5"
3,1,"0xE,0xF"


Checkbox(value=True, description='Edit table', indent=False)

In [None]:
#@title Apos ler 0x0C e 0x06
%%writefile exemplo4.csv
Tag; Dados
 00100 ; 0x20,0x21
 00110 ; 0x32,0x33
 00001 ; 0xC,0xD
 00000 ; 0x6,0x7

Overwriting exemplo4.csv


In [None]:
Imprime("exemplo4.csv")

   Tag       Dados
0  100   0x20,0x21
1  110   0x32,0x33
2    1     0xC,0xD
3    0     0x6,0x7


Checkbox(value=False, description='Edit table', indent=False)

### Exemplo 2

Pequena cache e memória para fins didáticos. Cache com blocos de 4 bytes, memoria Ram de 256 bytes e uma cache de 32 bytes (8 linhas).

* supor que a memória $i$ tem o dado $i$, por exemplo m[4] = 4

Supor o conteudo inicial ilustrado abaixo:

In [None]:
#@title Execute para carregar a cache inicial
%%writefile exemplo.csv
Tag; Dados
 - ; -
 - ; -
 - ; -
 - ; -
  - ; -
 - ; -
 - ; -
 - ; -


Overwriting exemplo.csv


In [None]:
Imprime("exemplo.csv")

    Tag  Dados
0    -       -
1    -       -
2    -       -
3    -       -
4    -       -
5    -       -
6    -       -
7    -       -


Checkbox(value=False, description='Edit table', indent=False)

#### Sequencia de leituras

Ler posições 0x32 e 0x21. Iremos usar hexadecimal para facilitar as conversões.

* 0x32 = 0011 0010 em binário. Dividindo nos campos tag=$001$, linha=$100$, dentro do bloco na posição =$10$

$ \begin{array}{lcc}
Tag & Linha   & Bloco  \\
\boxed{001} & \boxed{100} & \boxed{10} \\
\end{array} $

Portanto teremos

$ \begin{array}{lccccc}
Linha & Tag   & Dados  \\
      &       & 0 & 1 & 2 & 3 \\
\mbox{4 ou 100} & \boxed{001} & \boxed{0x30} & \boxed{0x31} & \boxed{0x32} & \boxed{0x33} \\
\end{array} $


* 0x21 = 0010 0001 em binário. Dividindo nos campos tag=$001$, linha=$000$, dentro do bloco na posição=$01$

Resulta na cache abaixo:


In [None]:
#@title Apos ler 0x32 e 0x21
%%writefile exemplo1.csv
Tag; Dados
 001 ; 0x20,0x21,0x22,0x23
 - ; -
 - ; -
- ; -
 001 ; 0x30,0x31,0x32,0x33
 - ; -
 - ; -
- ; -

Writing exemplo1.csv


In [None]:
Imprime("exemplo1.csv")

     Tag                 Dados
0   001    0x20,0x21,0x22,0x23
1     -                      -
2     -                      -
3     -                      -
4   001    0x30,0x31,0x32,0x33
5     -                      -
6     -                      -
7     -                      -


Checkbox(value=False, description='Edit table', indent=False)

In [None]:
#@title Apos ler 0x04=000 001 00 e 0x0F = 000 011 11
%%writefile exemplo2.csv
Tag; Dados
 001 ; 0x20,0x21,0x22,0x23
 000 ; 0x04,0x05,0x06,0x07
 - ; -
000 ; 0x0C,0x0D,0x0E,0x0F
 001 ; 0x30,0x31,0x32,0x33
 - ; -
 - ; -
- ; -


Overwriting exemplo2.csv


In [None]:
Imprime("exemplo2.csv")

     Tag                 Dados
0   001    0x20,0x21,0x22,0x23
1   000    0x04,0x05,0x06,0x07
2     -                      -
3   000    0x0C,0x0D,0x0E,0x0F
4   001    0x30,0x31,0x32,0x33
5     -                      -
6     -                      -
7     -                      -


Checkbox(value=False, description='Edit table', indent=False)

In [None]:
#@title Apos ler 0x05 e 0x20
%%writefile exemplo3.csv
Tag; Dados
 001 ; 0x20,0x21,0x22,0x23
 000 ; 0x04,0x05,0x06,0x07
 - ; -
000 ; 0x0C,0x0D,0x0E,0x0F
 001 ; 0x30,0x31,0x32,0x33
 - ; -
 - ; -
- ; -

Overwriting exemplo3.csv


In [None]:
Imprime("exemplo3.csv")

     Tag                 Dados
0   001    0x20,0x21,0x22,0x23
1   000    0x04,0x05,0x06,0x07
2     -                      -
3   000    0x0C,0x0D,0x0E,0x0F
4   001    0x30,0x31,0x32,0x33
5     -                      -
6     -                      -
7     -                      -


Checkbox(value=False, description='Edit table', indent=False)

In [None]:
#@title Apos ler 0x0C e 0x06
%%writefile exemplo4.csv
Tag; Dados
  001 ; 0x20,0x21,0x22,0x23
 000 ; 0x04,0x05,0x06,0x07
 - ; -
000 ; 0x0C,0x0D,0x0E,0x0F
 001 ; 0x30,0x31,0x32,0x33
 - ; -
 - ; -
- ; -

Overwriting exemplo4.csv


In [None]:
Imprime("exemplo4.csv")

      Tag                 Dados
0    001    0x20,0x21,0x22,0x23
1    000    0x04,0x05,0x06,0x07
2      -                      -
3    000    0x0C,0x0D,0x0E,0x0F
4    001    0x30,0x31,0x32,0x33
5      -                      -
6      -                      -
7      -                      -


Checkbox(value=False, description='Edit table', indent=False)

### Exercicios

1. Cache de 16 bytes e blocos de 8 bytes. Executar a mesma sequência de acessos. Mostrar passo a passo o conteúdo.
2. Cache de 32 bytes e blocos de 8 bytes. Executar a mesma sequência de acessos. Mostrar passo a passo o conteúdo.
3. Cache de 16 bytes e blocos de 2 bytes. Executar a mesma sequência de acessos. Mostrar passo a passo o conteúdo.
4. Cache de 16 bytes e blocos de 4 bytes. Executar a mesma sequência de acessos. Mostrar passo a passo o conteúdo.


# Cache Totalmente associativa



## Definição e comparação com Mapeamento direto


A cache **totalmente associativa** é um tipo de cache em que cada bloco da memória principal pode ser armazenado em qualquer local da cache. Isso significa que, quando o processador faz uma solicitação, a cache deve verificar todos os blocos da cache para ver se os dados estão presentes nela. Como resultado, a cache totalmente associativa é muito mais cara e difícil de implementar do que outros tipos de cache. Porém não terá falhas devido a colisão de dados na mesma posição da cache. Apenas terá falhas por capacidade, quando a área de dados que o processador estiver fazendo acesso é maior que o tamanho da cache.

Por outro lado, o mapeamento direto é um tipo de cache em que cada bloco da memória principal é mapeado em uma posição específica na cache. Quando o processador faz uma solicitação, a cache verifica apenas a posição da cache em que o bloco deve estar localizado. Esse tipo de cache é mais fácil de implementar e mais barato do que a cache totalmente associativa, mas pode levar a conflitos de cache quando dois blocos da memória principal são mapeados para a mesma posição na cache. O tempo de acerto é menor na mapeamento direto, pois consulta apenas uma posição.

Em resumo, a cache totalmente associativa é mais flexível e não gera colisões, mas também é mais cara e difícil de implementar do que o mapeamento direto, que é mais simples e mais barato. A escolha do tipo de cache a ser utilizado depende das necessidades específicas do sistema e das restrições de recursos.

## Custo

[desenho para editar com "uma" linha](https://excalidraw.com/#json=6rcvG2r3UQuAO2RWk8uRR,F4cgyQNC5vtDg1tVNHqQVg)


Podemos pensar que a cache totalmente associativa tem uma única linha, então não teremos decodificador de linha. Esta linha terá N conjuntos. Temos que olhar em todos os conjuntos ao mesmo tempo, que requer um comparador por conjunto. Portanto seu custo é bem elevado como ilustrado para o nosso exemplo de 2GB de Ram, bloco de 32 bytes e cache de 64Kbytes.

<img src="https://github.com/arduinoufv/inf450/blob/master/cache/figuras/cache_FAlinha_2GB_64k_bloco_32.png?raw=true" width="900px">

* conjuntos = $\frac{cache}{bloco}=\frac{64K}{32}=2k$
* Tag = $endereço_{ram} - endereço_{bloco}= 31-5 = 26$
* 2k comparadores de 26 bits
* 2k * 26 bits de area de TAG
* 64K de dados
* 1 decodificador de 5:32 de bloco
* um mux de 2K:1 para selecionar a resposta


[desenho para editar com um "módulo"](https://excalidraw.com/#json=SonJzpNVoWon3V1bmay7u,jV9Bt51vlvY1GvhPPo5FKQ)


### Exemplo 1

Pequena cache e memória para fins didáticos. Cache com blocos de 2 bytes, memoria Ram de 256 bytes e uma cache totalmente assoaciativa de 8 bytes.

* supor que a memória $i$ tem o dado $i$, por exemplo m[4] = 4

Supor o conteudo inicial ilustrado abaixo:

In [None]:
#@title Execute para carregar a cache inicial
%%writefile exemplo.csv
Tag; Dados
 - ; -
 - ; -
 - ; -
 - ; -


Writing exemplo.csv


In [None]:
Imprime("exemplo.csv")

   Tag  Dados
0   -       -
1   -       -
2   -       -
3   -       -


Checkbox(value=False, description='Edit table', indent=False)

#### Sequencia de leituras

Ler posições 0x32 e 0x21. Iremos usar hexadecimal para facilitar as conversões.

* 0x32 = 0011 0010 em binário. Dividindo nos campos tag=$0011001$, dentro do bloco na posição =$0$

$ \begin{array}{lc}
Tag  & Bloco  \\
\boxed{0011001}  & \boxed{0} \\
\end{array} $

Portanto teremos

$ \begin{array}{lcc}
Linha & Tag & Dados  \\
           & & 0 & 1 \\
\mbox{0} & \boxed{0011001} & \boxed{0x32} & \boxed{0x33} \\
\end{array} $


* 0x21 = 0010 0001 em binário. Dividindo nos campos tag=$0010000$, dentro do bloco na posição=$1$

Resulta na cache abaixo:


In [None]:
#@title Apos ler 0x32 e 0x21
%%writefile exemplo1.csv
Tag; Dados
0011001 ; 0x32,0x33
0010000 ; 0x20,0x21
 - ; -
 - ; -


Overwriting exemplo1.csv


In [None]:
Imprime("exemplo1.csv")

        Tag       Dados
0  0011001    0x32,0x33
1  0010000    0x20,0x21
2        -            -
3        -            -


Checkbox(value=False, description='Edit table', indent=False)

In [None]:
#@title Apos ler 0x03 e 0x0F
%%writefile exemplo2.csv
Tag; Dados
0011001 ; 0x32,0x33
0010000 ; 0x20,0x21
0000001; 0x02,0x03
0000111; 0x0E,0x0F


Overwriting exemplo2.csv


In [None]:
Imprime("exemplo2.csv")

     Tag       Dados
0  11001   0x32,0x33
1  10000   0x20,0x21
2      1   0x02,0x03
3    111   0x0E,0x0F


Checkbox(value=False, description='Edit table', indent=False)

In [None]:
#@title Apos ler 0x00 e 0x06, politica FIFO
%%writefile exemplo3.csv
Tag; Dados
0000000 ; 0x00,0x01
0000011 ; 0x06,0x07
0000001; 0x02,0x03
0000111; 0x0E,0x0F

Overwriting exemplo3.csv


In [None]:
Imprime("exemplo3.csv")

   Tag       Dados
0    0   0x00,0x01
1   11   0x06,0x07
2    1   0x02,0x03
3  111   0x0E,0x0F


Checkbox(value=False, description='Edit table', indent=False)

In [None]:
#@title Apos ler 0x04 e 0x0c
%%writefile exemplo4.csv
Tag; Dados
0000000 ; 0x00,0x01
0000011 ; 0x06,0x07
0000010; 0x04,0x05
00001; 0x0E,0x0F

Overwriting exemplo4.csv


In [None]:
Imprime("exemplo4.csv")

   Tag       Dados
0    0   0x00,0x01
1   11   0x06,0x07
2   10   0x04,0x05
3    1   0x0E,0x0F


Checkbox(value=False, description='Edit table', indent=False)

# Cache Associativa por conjunto ou n-way

[desenho para editar](https://excalidraw.com/#json=CR1GbnHwKak7erZcdeWlq,izojGq73BAb5Yxagseffkw)
<img src="https://github.com/arduinoufv/inf450/blob/master/cache/figuras/cache_2way_2GB_64k_bloco_32.png?raw=true" width="600px">

## Definição

**mapeamento direto** $\rightarrow$ **n-way** $\rightarrow$ **totalmente associativa**

**rapida, barata, -----** $\rightarrow$ **n-way** $\rightarrow$ **lenta, cara**

**muita colisão, -----** $\rightarrow$ **n-way** $\rightarrow$ **sem colisão**


Uma cache **n-way** ou **associativa por conjunto** é uma técnica de cache que combina os benefícios da cache de **mapeamento direto** e da cache **totalmente associativa**.

Na cache de **mapeamento direto**, cada bloco de memória principal é mapeado para uma única linha de cache, com base em um cálculo simples de endereço. No entanto, esse mapeamento pode resultar em **colisões frequentes**, onde dois ou mais blocos diferentes de memória principal são mapeados para a mesma linha de cache. Isso pode levar a uma **alta taxa de substituição de cache**, o que **reduz o desempenho** geral da cache.

Por outro lado, na cache **totalmente associativa**, cada bloco de memória principal pode ser mapeado para qualquer linha de cache disponível. Isso reduz as colisões de cache, mas também aumenta o custo e a complexidade da implementação.

A cache n-way ou associativa por conjunto é uma solução **intermediária**. Ela divide a cache em conjuntos de linhas, com cada conjunto contendo n linhas. Cada bloco de memória principal é mapeado para um conjunto específico, e pode ser armazenado em qualquer uma das n linhas desse conjunto.

Essa abordagem reduz as colisões de cache em comparação com a cache de mapeamento direto, mas mantém um **nível razoável de complexidade e custo** em comparação com a cache totalmente associativa. A escolha de n depende de vários fatores, incluindo o tamanho total da cache e o tamanho dos blocos de memória principal.

## Cálculo dos campos de endereço com um exemplo

Para calcular a divisão dos campos de endereço para uma cache 2-way de 64 KB e blocos de 32 bytes, podemos seguir os seguintes passos:

1. Calcular o tamanho do conjunto:
  - Como a cache é 2-way, temos 2 linhas por conjunto, ou podemos pensar em uma cache com duas colunas (conjuntos).
  - O tamanho total da cache é de 64 KB, que pode ser expresso como 2^16 bytes.
  - Cada linha da cache armazena um bloco de 32 bytes, então o número total de linhas da cache é de $\frac{2^{16}}{32 \cdot 2}= 1024$ linhas.

2. Dividir o endereço em três campos:
  - O campo de **tag**, que identifica o bloco de memória principal correspondente à linha da cache, que agora tem duas opções (uma em cada conjunto ou coluna)
  - O campo de índice (ou **linha**), que identifica a linha na cache onde o bloco pode ser encontrado.
  - O campo de deslocamento, que identifica a posição do byte dentro do bloco de memória principal.

3. Para calcular o número de bits necessários para cada campo, podemos usar a fórmula:
  - Número de bits = log2 (tamanho do campo)

  Então, temos:

  - Tamanho do bloco: 32 bytes = $2^5$ bytes
  - Tamanho do conjunto: 1024 conjuntos = $2^{10}$ conjuntos, que é o tamanho da cache dividido pelo tamanho do bloco vezes o número de conjunto (ou **ways**).
  - Tamanho da memória RAM: 2 GB = $2^{31}$ bytes

  - Campo de deslocamento: 5 bits (32 = $2^5$)
  - Campo de índice (ou linha): 10 bits (1024 = $2^{10}$)
- Campo de tag: 16 bits (2^31 / 2^5 / 2^10 = 2^16)

4. Portanto, a divisão dos campos de endereço fica da seguinte forma:
  - Tag: bits 15 a 0 (16 bits)
  - Linha: bits 25 a 16 (10 bits)
  - Deslocamento: bits 4 a 0 (5 bits)


$ \begin{array}{lcc}
Tag & Linha   & Bloco  \\
\boxed{16 bits} & \boxed{10 bits} & \boxed{5 bits} \\
\end{array} $

Um cache de mapeamento direto teria a seguinte distribuição:

$ \begin{array}{lcc}
Tag & Linha   & Bloco  \\
\boxed{15 bits} & \boxed{11 bits} & \boxed{5 bits} \\
\end{array} $

Onde teríamos o dobro de linhas, pois é apenas **1 coluna**, ou seja, só tem uma opção para cada endereço na linha, que pode gerar uma colisão.



## Custo com um exemplo

<img src="https://github.com/arduinoufv/inf450/blob/master/cache/figuras/cache_2way_2GB_64k_bloco_32.png?raw=true" width="600px">

Similar a cache de mapeamento direto, a cache 2-way, neste exemplo, podemos ver que são 2 conjuntos ou duas colunas. Portanto a cache fica mais "curta" e mais "larga" ao ter duas opções para cada entrada de linha. Os dois decodificadores podem ser compartilhados. Agora precisamos de 2 comparadores, um para cada conjunto ou coluna. O tag aumenta de um bits que aumenta um pouco o custo da area do tag e dos comparadores.

Custo:
* decodificador de linha 10:1k
* decodificador de bloco 5:32
* 2 comparadores de 16 bits
* 64 K bytes de dados
* 2K * 16 bits para armazenar os **tags**


### Exemplo com 4 way

[desenho para editar](https://excalidraw.com/#json=bGYdkSP9jlNI_YI5E4bP1,IfcuLVdiOFErjfgTHGrOKQ)

<img src="https://github.com/arduinoufv/inf450/blob/master/cache/figuras/cache_4way_2GB_64k_bloco_32.png?raw=true" width = "800px">

Similar a cache 2-way, a cache 4-way, neste exemplo, podemos ver que são 4 conjuntos ou 4 colunas. Portanto a cache fica mais "curta" e mais "larga" ao ter 4 opções para cada entrada de linha. Os dois decodificadores podem ser compartilhados. Agora precisamos de 4 comparadores, um para cada conjunto ou coluna. O tag aumenta de um bit que aumenta um pouco o custo da area do tag e dos comparadores.

* Tag = $Endereço_{ram} - Endereço_{bloco} - Endereço_{linha}$

* Linha  = $\frac{Cache}{way \times bloco}=\frac{64K}{4 \times 32}=512$ ou 9 bits de endereço de linha.

* Custo:
  * decodificador de linha 9:512
  * decodificador de bloco 5:32
  * 4 comparadores de 17 bits
  * 64 K bytes de dados
  * 4* 512 * 17 bits para armazenar os **tags**

---

  Para **8-way**, O tag aumenta de um bit que aumenta um pouco o custo da area do tag e dos comparadores.


* Linha  = $\frac{Cache}{way \times bloco}=\frac{64K}{8 \times 32}=256$ ou 8 bits de endereço de linha.

* Tag = $Endereço_{ram} - Endereço_{bloco} - Endereço_{linha} = 31 - 5 - 8 = 18$ bits


* Custo:
  * decodificador de linha 8:256
  * decodificador de bloco 5:32
  * 8 comparadores de 18 bits
  * 64 K bytes de dados
  * 8* 256 * 18 bits para armazenar os **tags**


### Exemplo 1

Pequena cache e memória para fins didáticos. Cache com blocos de 2 bytes, memoria Ram de 256 bytes e uma cache 2-way de 16 bytes (4 linhas e duas colunas).

* supor que a memória $i$ tem o dado $i$, por exemplo m[4] = 4

Supor o conteudo inicial ilustrado abaixo:

In [None]:
#@title Execute para carregar a cache inicial
%%writefile exemplo.csv
Tag; Dados;Tag; Dados
 - ; -;- ; -
 - ; -;- ; -
 - ; -;- ; -
 - ; -;- ; -


Writing exemplo.csv


In [None]:
Imprime("exemplo.csv")

   Tag  Dados Tag.1  Dados.1
0   -       -    -         -
1   -       -    -         -
2   -       -    -         -
3   -       -    -         -


Checkbox(value=False, description='Edit table', indent=False)

#### Sequencia de leituras

Ler posições 0x32 e 0x21. Iremos usar hexadecimal para facilitar as conversões.

* 0x32 = 0011 0010 em binário. Dividindo nos campos tag=$00110$, linha=$01$, dentro do bloco na posição =$0$

$ \begin{array}{lcc}
Tag & Linha   & Bloco  \\
\boxed{00110} & \boxed{01} & \boxed{0} \\
\end{array} $

Portanto teremos

$ \begin{array}{lccc}
Linha & Tag   & Dados  \\
      &       & 0 & 1 \\
\mbox{1 ou 01} & \boxed{00110} & \boxed{0x32} & \boxed{0x33} \\
\end{array} $


* 0x21 = 0010 0001 em binário. Dividindo nos campos tag=$00100$, linha=$00$, dentro do bloco na posição=$1$

Resulta na cache abaixo:


In [None]:
#@title Apos ler 0x32 e 0x21
%%writefile exemplo1.csv
Tag; Dados;Tag; Dados
 00100 ; 0x20,0x21;- ; -
 00110 ; 0x32,0x33;- ; -
 - ; -;- ; -
 - ; -- ; -


Writing exemplo1.csv


In [None]:
Imprime("exemplo1.csv")

       Tag       Dados Tag.1  Dados.1
0   00100    0x20,0x21    -         -
1   00110    0x32,0x33    -         -
2       -            -    -         -
3       -          --      -        -


Checkbox(value=False, description='Edit table', indent=False)

In [None]:
#@title Apos ler 0x03 e 0x0F
%%writefile exemplo2.csv
Tag; Dados;Tag; Dados
 00100 ; 0x20,0x21; -;-
 00110 ; 0x32,0x33;00000 ;0x02,0x03
 -;- ;-;-
 00001 ; 0xE,0xF;-;-


Overwriting exemplo2.csv


In [None]:
Imprime("exemplo2.csv")

       Tag       Dados   Tag.1    Dados.1
0   00100    0x20,0x21       -          -
1   00110    0x32,0x33  00000   0x02,0x03
2        -          -        -          -
3   00001      0xE,0xF       -          -


Checkbox(value=False, description='Edit table', indent=False)

In [None]:
#@title Apos ler 0x00 e 0x06
%%writefile exemplo3.csv
Tag; Dados;Tag; Dados
 00100 ; 0x20,0x21; 00000 ; 0x00,0x01
 00110 ; 0x32,0x33;00000;0x02,0x03
 -;- ;-;-
 00001 ; 0xE,0xF; 00000; 0x06,0x07

Writing exemplo3.csv


In [None]:
Imprime("exemplo3.csv")

       Tag       Dados    Tag.1     Dados.1
0   00100    0x20,0x21   00000    0x00,0x01
1   00110    0x32,0x33    00000   0x02,0x03
2        -          -         -           -
3   00001      0xE,0xF    00000   0x06,0x07


Checkbox(value=False, description='Edit table', indent=False)

In [None]:
#@title Apos ler 0x04 e 0x0c
%%writefile exemplo4.csv
 00100 ; 0x20,0x21; 00000 ; 0x00,0x01
 00110 ; 0x32,0x33;00000;0x02,0x03
 00000; 0x04,0x05 ; 00001 ; 0x0C, 0x0D
 00001 ; 0xE,0xF; 00000; 0x06,0x07

Writing exemplo4.csv


In [None]:
Imprime("exemplo4.csv")

    00100     0x20,0x21   00000     0x00,0x01
0      110    0x32,0x33        0    0x02,0x03
1        0   0x04,0x05         1   0x0C, 0x0D
2        1      0xE,0xF        0    0x06,0x07


Checkbox(value=False, description='Edit table', indent=False)

# Tempo de Acesso

Certamente, a equação do tempo médio de acesso à cache é dada por:

Tmédio = $T_c + (1 - h) × T_m$

onde:

- h é a taxa de acertos (hit rate) da cache, ou seja, a fração das solicitações que encontram os dados na cache.
- Tc é o tempo de acesso à cache, que é geralmente muito menor do que o tempo de acesso à memória principal.
- Tm é o tempo de acesso à memória principal, que é geralmente muito maior do que o tempo de acesso à cache.

Na cache totalmente associativa, a taxa de falhas (miss rate) é menor do que no mapeamento direto, porque cada bloco pode ser armazenado em qualquer local da cache. Isso significa que a cache pode armazenar mais dados que poderiam ter conflitos nas outras cache. No entanto, a busca pelo bloco na cache é mais complexa e demorada, porque a cache deve procurar em todos os blocos para encontrar o bloco desejado. Portanto, o tempo de acesso $T_c$ à cache é maior do que no mapeamento direto.

Assim, a cache totalmente associativa reduz a taxa de falhas e, portanto, aumenta a taxa de acertos (hit rate), mas ao mesmo tempo aumenta o tempo de acesso $T_c$ em comparação com o mapeamento direto. A escolha entre os dois tipos de cache depende do trade-off entre a taxa de acertos e o tempo de acesso médio, bem como de outros fatores, como a complexidade e o custo de implementação.

## Cache com 2 níveis

Quando uma cache é dividida em dois ou mais níveis, a equação do tempo médio de acesso se torna mais complexa, mas ainda pode ser calculada usando a seguinte fórmula:

Tmédio =  Tc1 + (1 - h1) × ( Tc2 + (1 - h2) × Tm)

onde:

- h1 é a taxa de acertos (hit rate) da cache L1, ou seja, a fração das solicitações que encontram os dados na cache L1.
- Tc1 é o tempo de acesso à cache L1, que é geralmente muito menor do que o tempo de acesso à memória principal.
- h2 é a taxa de acertos (hit rate) da cache L2, ou seja, a fração das solicitações que encontram os dados na cache L2.
- Tc2 é o tempo de acesso à cache L2, que é geralmente maior do que o tempo de acesso à cache L1, mas ainda menor do que o tempo de acesso à memória principal.
- Tm é o tempo de acesso à memória principal, que é geralmente muito maior do que o tempo de acesso à cache L2.

Nessa fórmula, a cache L1 é a cache mais rápida e menor, que é usada para armazenar os dados mais frequentemente usados ​​pelo processador. Se a solicitação não encontrar os dados na cache L1, a cache L2 é verificada. Se os dados também não estiverem na cache L2, a memória principal é acessada.

A eficácia de uma cache de dois níveis depende do tamanho, da organização e das políticas de substituição usadas em cada nível. Em geral, uma cache L1 menor e mais rápida é mais eficaz para armazenar os dados mais frequentemente usados, enquanto uma cache L2 maior e mais lenta é mais eficaz para armazenar os dados menos frequentemente usados. A escolha dos tamanhos e políticas de substituição ideais para cada cache depende das características do sistema e dos padrões de acesso aos dados.

## Cache com três niveis

Quando uma cache é dividida em três ou mais níveis, a equação do tempo médio de acesso se torna ainda mais complexa, mas ainda pode ser calculada usando a seguinte fórmula:

Tmédio = Tc1 + (1 - h1) × [Tc2 + (1 - h2) × (  Tc3 + (1 - h3) × Tm)]

onde:

- h1 é a taxa de acertos (hit rate) da cache L1, ou seja, a fração das solicitações que encontram os dados na cache L1.
- Tc1 é o tempo de acesso à cache L1, que é geralmente muito menor do que o tempo de acesso à memória principal.
- h2 é a taxa de acertos (hit rate) da cache L2, ou seja, a fração das solicitações que encontram os dados na cache L2.
- Tc2 é o tempo de acesso à cache L2, que é geralmente maior do que o tempo de acesso à cache L1, mas ainda menor do que o tempo de acesso à memória principal.
- h3 é a taxa de acertos (hit rate) da cache L3, ou seja, a fração das solicitações que encontram os dados na cache L3.
- Tc3 é o tempo de acesso à cache L3, que é geralmente maior do que o tempo de acesso à cache L2, mas ainda menor do que o tempo de acesso à memória principal.
- Tm é o tempo de acesso à memória principal, que é geralmente muito maior do que o tempo de acesso à cache L3.

Nessa fórmula, a cache L1 é a cache mais rápida e menor, que é usada para armazenar os dados mais frequentemente usados ​​pelo processador. Se a solicitação não encontrar os dados na cache L1, a cache L2 é verificada. Se os dados também não estiverem na cache L2, a cache L3 é verificada. Se os dados ainda não estiverem na cache L3, a memória principal é acessada.

A eficácia de uma cache de três níveis (ou mais) depende do tamanho, da organização e das políticas de substituição usadas em cada nível. Em geral, uma cache L1 menor e mais rápida é mais eficaz para armazenar os dados mais frequentemente usados, enquanto caches maiores e mais lentas, como L2 e L3, são mais eficazes para armazenar os dados menos frequentemente usados. A escolha dos tamanhos e políticas de substituição ideais para cada cache depende das características do sistema e dos padrões de acesso aos dados.

## Tempo considerando politica de escrita na Cache

Em uma cache com política write-back, quando um bloco de dados é atualizado, ele não é imediatamente escrito de volta para a memória principal, mas sim marcado como "sujo" (dirty), indicando que ele foi modificado e precisa ser escrito de volta em algum momento no futuro. Isso permite reduzir o tráfego de escrita na memória principal e melhorar o desempenho da cache.

No entanto, a política write-back também introduz uma complexidade adicional no cálculo do tempo médio de acesso à cache. Além da taxa de acertos (hit rate) e do tempo de acesso à cache (Tc), precisamos considerar a taxa de escrita (write rate), o tempo de escrita na cache (Tw), o tempo de escrita na memória principal (Tm_write), o tempo de leitura na memória principal (Tm_read) e a taxa de substituição (miss rate), que é a fração das solicitações que não encontram os dados na cache e precisam ser buscadas na memória principal. A equação do tempo médio de acesso à cache em uma cache com política write-back é dada por:

Tmédio = Tc + miss_rate × (Tw + h_clean × Tm_read + (1 - h_clean) × (Tm_read + Tm_write))

onde:

- h é a taxa de acertos (hit rate) da cache, ou seja, a fração das solicitações que encontram os dados na cache sem precisar acessar a memória principal.
- Tc é o tempo de acesso à cache, que é geralmente muito menor do que o tempo de acesso à memória principal.
- miss_rate é a taxa de substituição (miss rate) da cache, ou seja, a fração das solicitações que não encontram os dados na cache e precisam ser buscadas na memória principal.
- Tw é o tempo de escrita na cache, que é geralmente menor do que o tempo de escrita na memória principal.
- h_clean é a taxa de dados limpos na cache para as solicitações de substituição, que não precisam ser atualizados em memória.
- Tm_read é o tempo de leitura na memória principal, que é geralmente muito maior do que o tempo de acesso à cache.
- Tm_write é o tempo de escrita na memória principal, que é geralmente muito maior do que o tempo de escrita na cache.

Na política write-back, quando um bloco de dados é substituído, se ele foi modificado (sujo), é necessário escrevê-lo de volta na memória principal antes que o novo bloco possa ser carregado na cache. Isso é feito durante a operação de escrita na cache (Tw). Se a solicitação de substituição encontra o bloco limpo a ser substituído na cache (h_clean), não é necessário acessar a memória principal para escrever os dados, mas ainda é necessário ler da memória principal (Tm_read). Se a solicitação de substituição acha um  bloco  sujo, deve escrever na memória principal (Tm_write) e depois buscar o bloco solicitado.



## Write back e Write Throught

Em geral, a política write-back é mais eficiente do que a política write-through em termos de desempenho e tráfego na memória principal, pois reduz a quantidade de escritas na memória principal e aproveita melhor a capacidade da cache.

Na política write-through, sempre que um bloco de dados é atualizado na cache, ele é imediatamente escrito de volta na memória principal. Isso significa que cada escrita na cache gera uma escrita na memória principal, o que pode resultar em um alto tráfego na memória principal e um atraso significativo no desempenho do sistema. Além disso, se um bloco de dados é atualizado várias vezes na cache antes de ser escrito de volta na memória principal, isso pode resultar em uma quantidade excessiva de escritas na memória principal, reduzindo ainda mais o desempenho do sistema.

Por outro lado, na política write-back, os dados são atualizados apenas na cache e marcados como "sujo" (dirty) quando são modificados. Os dados só são escritos de volta na memória principal quando o bloco é substituído na cache. Isso reduz a quantidade de escritas na memória principal e aproveita melhor a capacidade da cache, pois vários acessos ao mesmo bloco de dados na cache não resultam em escritas repetidas na memória principal. Além disso, a política write-back permite que os dados sejam atualizados com mais frequência na cache, reduzindo a probabilidade de que um dado esteja desatualizado quando é lido. Isso pode melhorar significativamente o desempenho do sistema em aplicações que fazem muitas atualizações na cache.

# Politica de substituição

A política de substituição **LRU** (Least Recently Used) e a política de substituição **FIFO** (First-In, First-Out) são duas estratégias comuns usadas em caches para decidir qual bloco de dados deve ser removido quando a cache está cheia e precisa fazer espaço para acomodar novos blocos.

Na política LRU, cada bloco da cache é marcado com um contador de tempo que indica a última vez que ele foi acessado. Quando um novo bloco precisa ser carregado na cache e não há espaço disponível, o bloco com o contador mais antigo (ou seja, o bloco que não foi acessado há mais tempo) é removido da cache para dar lugar ao novo bloco.

A ideia por trás da política LRU é que os blocos que foram acessados recentemente são mais propensos a serem acessados novamente no futuro próximo. Portanto, remover os blocos menos recentemente usados pode ajudar a maximizar o número de hits na cache e reduzir o número de misses.

Já na política FIFO, os blocos são organizados em uma fila, e o bloco mais antigo na fila é sempre o primeiro a ser removido quando um novo bloco precisa ser carregado na cache. Essa política é baseada na suposição de que os blocos que foram carregados mais cedo na cache são mais propensos a não serem usados novamente no futuro próximo, enquanto os blocos mais recentes são mais prováveis de serem usados novamente.

Embora a política LRU geralmente ofereça um melhor desempenho de cache do que a política FIFO, a política FIFO é mais fácil de implementar e requer menos hardware para manter o estado de cada bloco. Além disso, a política FIFO pode ser mais adequada para certos tipos de aplicações onde a ordem temporal dos dados é importante, como em sistemas de streaming de vídeo ou áudio.

## Exemplo

Um exemplo usando a sequência de acessos "2 5 8 2 9 1 5 2 8 2 4 6 1 2 5 9 8 7 1 2".

Feito para ChatGPT (errado)

Suponha que a cache tenha 4 posições (ou seja, pode armazenar 4 blocos de dados). Inicialmente, a cache está vazia. Vamos acompanhar o comportamento da cache usando as políticas de substituição LRU e FIFO.

Com a política LRU, o comportamento da cache seria o seguinte:

1. Acesso ao bloco 2 - cache miss (2 é carregado na posição 1)
2. Acesso ao bloco 5 - cache miss (5 é carregado na posição 2)
3. Acesso ao bloco 8 - cache miss (8 é carregado na posição 3)
4. Acesso ao bloco 2 - cache hit (2 está na posição 1)
5. Acesso ao bloco 9 - cache miss (9 é carregado na posição 4, substituindo o bloco 2)
6. Acesso ao bloco 1 - cache miss (1 é carregado na posição 1, substituindo o bloco 5)
7. Acesso ao bloco 5 - cache hit (5 está na posição 2)
8. Acesso ao bloco 2 - cache hit (2 está na posição 1)
9. Acesso ao bloco 8 - cache hit (8 está na posição 3)
10. Acesso ao bloco 2 - cache hit (2 está na posição 1)
11. Acesso ao bloco 4 - cache miss (4 é carregado na posição 5, substituindo o bloco 9)
12. Acesso ao bloco 6 - cache miss (6 é carregado na posição 9, substituindo o bloco 1)
13. Acesso ao bloco 1 - cache miss (1 é carregado na posição 2, substituindo o bloco 2)
14. Acesso ao bloco 2 - cache hit (2 está na posição 1)
15. Acesso ao bloco 5 - cache hit (5 está na posição 2)
16. Acesso ao bloco 9 - cache hit (9 está na posição 4)
17. Acesso ao bloco 8 - cache hit (8 está na posição 3)
18. Acesso ao bloco 7 - cache miss (7 é carregado na posição 5, substituindo o bloco 4)
19. Acesso ao bloco 1 - cache hit (1 está na posição 2)
20. Acesso ao bloco 2 - cache hit (2 está na posição 1)



In [None]:
#@title Código de simulação de LRU e FIFO com 4 entradas e aleatório
import random

# Definindo o tamanho da cache e a sequência de acessos
cache_size = 4
#acessos = [random.randint(1, 9) for i in range(20)]
acessos = [0, 1, 2, 1, 2, 3, 4, 2, 5, 1, 4, 5, 6, 7, 1, 8] # criar um exemplo
# otima    F  F  F       F  F     F           F  F      F
#                          0     3,2

# Inicializando as caches (com "-")
cache_lru = ["-" for i in range(cache_size)]
cache_fifo = ["-" for i in range(cache_size)]

# Contadores de falhas
falhas_lru = 0
falhas_fifo = 0

# Função para atualizar a cache usando a política LRU
def atualizar_cache_lru(cache, bloco):
    global falhas_lru
    if bloco in cache:
        cache.remove(bloco)
    elif len(cache) == cache_size:
        cache.pop()
        falhas_lru += 1
    cache.insert(0, bloco)

# Função para atualizar a cache usando a política FIFO
def atualizar_cache_fifo(cache, bloco):
    global falhas_fifo
    if bloco not in cache:
        if len(cache) == cache_size:
            cache.pop(0)
            falhas_fifo += 1
        cache.append(bloco)

# Realizando os acessos
print("Acessos:")
for i, acesso in enumerate(acessos):
    print("Acesso #{}: {}".format(i+1, acesso))

    # Atualizando a cache LRU
    atualizar_cache_lru(cache_lru, acesso)
    print("Cache LRU: ", cache_lru)

    # Atualizando a cache FIFO
    atualizar_cache_fifo(cache_fifo, acesso)
    print("Cache FIFO:", cache_fifo)

# Imprimindo os resultados
print("\nTotal de falhas:")
print("LRU:  ", falhas_lru)
print("FIFO: ", falhas_fifo)


Acessos:
Acesso #1: 0
Cache LRU:  [0, '-', '-', '-']
Cache FIFO: ['-', '-', '-', 0]
Acesso #2: 1
Cache LRU:  [1, 0, '-', '-']
Cache FIFO: ['-', '-', 0, 1]
Acesso #3: 2
Cache LRU:  [2, 1, 0, '-']
Cache FIFO: ['-', 0, 1, 2]
Acesso #4: 1
Cache LRU:  [1, 2, 0, '-']
Cache FIFO: ['-', 0, 1, 2]
Acesso #5: 2
Cache LRU:  [2, 1, 0, '-']
Cache FIFO: ['-', 0, 1, 2]
Acesso #6: 3
Cache LRU:  [3, 2, 1, 0]
Cache FIFO: [0, 1, 2, 3]
Acesso #7: 4
Cache LRU:  [4, 3, 2, 1]
Cache FIFO: [1, 2, 3, 4]
Acesso #8: 2
Cache LRU:  [2, 4, 3, 1]
Cache FIFO: [1, 2, 3, 4]
Acesso #9: 5
Cache LRU:  [5, 2, 4, 3]
Cache FIFO: [2, 3, 4, 5]
Acesso #10: 1
Cache LRU:  [1, 5, 2, 4]
Cache FIFO: [3, 4, 5, 1]
Acesso #11: 4
Cache LRU:  [4, 1, 5, 2]
Cache FIFO: [3, 4, 5, 1]
Acesso #12: 5
Cache LRU:  [5, 4, 1, 2]
Cache FIFO: [3, 4, 5, 1]
Acesso #13: 6
Cache LRU:  [6, 5, 4, 1]
Cache FIFO: [4, 5, 1, 6]
Acesso #14: 7
Cache LRU:  [7, 6, 5, 4]
Cache FIFO: [5, 1, 6, 7]
Acesso #15: 1
Cache LRU:  [1, 7, 6, 5]
Cache FIFO: [5, 1, 6, 7]
Acesso #