# **Trabalho Pr√°tico 3 - Simulador de Mem√≥ria Cache**

Neste trabalho, voc√™s deveram desenvolver um programa que funcione como um **simulador de mem√≥ria cache**. O objetivo deste trabalho √© proporcionar a pr√°tica dos conceitos de **mapeamento direto, associatividade por conjunto e associatividade completa** que foram abordados durante o curso. A pr√°tica desses conceitos ser√° essencial para compreender as diferen√ßas entre os m√©todos de mapeamento e como eles afetam a efici√™ncia e o desempenho da mem√≥ria cache.

Para simplificar o escopo do trabalho, o simulador n√£o tratar√° os dados reais armazenados na mem√≥ria. Em outras palavras, apenas o gerenciamento e o posicionamento das linhas na mem√≥ria cache ser√£o simulados, ignorando o conte√∫do dos blocos.


**Aluno(s):**

### **üìö Fundamentos de Cache**

Um endere√ßo de mem√≥ria (por exemplo: 0xDEADBEEF) precisa ser dividido em partes para sabermos onde ele ser√° mapeado na cache. Sendo assim, temos:

1. A mem√≥ria principal √© dividida em blocos (do tamanho da linha de cache);

2. A cache √© dividida em linhas;

3. Cada linha pode armazenar 1 bloco da mem√≥ria principal;

4. As linhas s√£o agrupadas em conjuntos, dependendo do grau de associatividade;

<br>

### **üî¢ Exemplo pr√°tico**

Considere:
```
O tamanho total da cache: 4096
O tamanho de cada linha: 1024
Total de linhas: 4096 / 1024 = 4
```


**1. MAPEAMENTO DIRETO**

* 4 linhas ‚áí 4 grupos
* Cada endere√ßo mapeia em um √∫nico grupo fixo
* N√∫mero de bits de √≠ndice = log2(4) = 2 bits
* Offset = log2(1024) = 10 bits
* TAG = 32 - 2 - 10 = 20 bits

  ```
  ENDERE√áO = [TAG = 20 BITs | √çNDICE = 2 BITs | OFFSET = 10 BITs ]
  ```

**2. ASSOCIATIVIDADE POR CONJUNTO**

* 4 linhas / 2 linhas por grupo ‚áí 2 grupos
* N√∫mero de bits de √≠ndice = log2(2) = 1 bit
* Offset = log2(1024) = 10 bits
* TAG = 32 - 1 - 10 = 21 bits

  ```
  ENDERE√áO = [TAG = 21 BITs | √çNDICE = 1 BIT | OFFSET = 10 BITs ]

**3. ASSOCIATIVIDADE COMPLETA**

* 4 linhas / 4 linhas por grupo ‚áí 1 grupo
* N√∫mero de bits de √≠ndice = 0 (n√£o h√° indice)
* Offset = log2(1024) = 10 bits
* TAG = 32 - 10 = 22 bits

  ```
  ENDERE√áO = [TAG = 22 BITs | OFFSET = 10 BITs ]
  ```


### **Especifica√ß√£o do simulador**

Neste trabalho, o objetivo √© desenvolver um programa que funcione como um simulador de mem√≥ria cache. O simulador ser√° respons√°vel por gerenciar uma cache de apenas um n√≠vel, processando acessos √† mem√≥ria RAM, preenchendo as linhas da cache conforme necess√°rio e contabilizando a quantidade de HITS e MISSES ocorridos durante a execu√ß√£o. O programa dever√° verificar se um determinado bloco de mem√≥ria j√° est√° presente na cache (HIT) ou se precisa ser carregado da mem√≥ria principal (MISS). Al√©m disso, o simulador determinar√° em qual linha da cache um bloco de mem√≥ria ser√° armazenado, quando necess√°rio.


Para simplificar o escopo do trabalho, o simulador n√£o tratar√° os dados reais armazenados na mem√≥ria. Em outras palavras, apenas o gerenciamento e o posicionamento das linhas na mem√≥ria cache ser√£o simulados, ignorando o conte√∫do dos blocos.


O simulador dever√° ser desenvolvido em Python, podendo utilizar qualquer biblioteca adicional que os alunos considerem necess√°ria.


**Par√¢metros de entrada:**



1. **O tamanho total da cache, em bytes**. Se tivermos uma cache de 4KB, por exemplo, iremos digitar 4096.
2. **O tamanho de cada linha, em bytes**. Uma linha de 1KB, por exemplo, seria entrada digitando-se 1024.
3. **O tamanho de cada grupo, em unidades**. Pensando em uma mem√≥ria cache de 4KB, e p√°ginas de 1KB, teremos 4 linhas. Se tivermos uma linha por grupo, teremos um sistema de mapeamento direto.  Se tivermos 4 por grupo, teremos um sistema de associatividade completa.




**Par√¢metros de saida:**


A sa√≠da do simulador desenvolvido dever√° ser salva em uma estrutura de lista de dicion√°rios como o nome `history`, onde cada dicion√°rio representa um acesso individual √† cache, contendo as seguintes informa√ß√µes:


* **addr:** Endere√ßo de mem√≥ria acessado, no formato hexadecimal de 32 bits (exatamente 8 d√≠gitos com prefixo 0x e letras mai√∫sculas). Esse valor corresponde ao identificador do bloco, obtido a partir do endere√ßo original com os bits de deslocamento e, se aplic√°vel, de conjuntos ignorados.


* **group:** N√∫mero do grupo (ou conjunto) da cache ao qual o bloco foi mapeado. Em caches com associatividade total (fully associative), este valor ser√° sempre 0.


* **idx_line:** √çndice da linha dentro do grupo utilizada para armazenar o bloco acessado.


* **result:** Resultado da opera√ß√£o de leitura na cache. Pode ser "HIT" se o bloco j√° estiver presente na cache, ou "MISS" se for necess√°rio carreg√°-lo da mem√≥ria principal.





### **Par√¢metros fixos do simulador**


1. O espa√ßo de endere√ßamento ser√° de **32 bits**;
2. Os endere√ßos sempre referenciam **bytes**, e n√£o palavras;
3. A pol√≠tica de substitui√ß√£o de p√°ginas √© a **FIFO (First In First Out)**;
4. A aloca√ß√£o de linhas em um conjunto **seguir√° a ordem**. Ou seja, se tivermos um conjunto de tamanho dois, vamos primeiro armazenar o bloco na primeira linha do conjunto, e em seguida na segunda;
5. As linhas de um conjunto ser√£o armazenadas de **forma consecutiva** na cache (uma atr√°s da outra);
6. Teremos **menos de mil linhas** de cache.


# **Simulador de Mem√≥ria Cache**

In [1]:
import math
from collections import deque

class SimuladorCache:
    def __init__(self, cache_size, line_size, associativity):
        # Inicializa os par√¢metros principais da cache
        self.tamanho_cache = cache_size
        self.tamanho_linha = line_size
        self.associatividade = associativity
        self.num_linhas = cache_size // line_size
        self.num_grupos = self.num_linhas // associativity
        self.bits_offset = int(math.log2(line_size))
        self.bits_indice = int(math.log2(self.num_grupos)) if self.num_grupos > 1 else 0

        # Cria a estrutura da cache e a fila FIFO para substitui√ß√£o
        self.cache = [ [None] * associativity for _ in range(self.num_grupos) ]
        self.fifo = [ deque() for _ in range(self.num_grupos) ]  # FIFO por grupo
        self.historico = []

    # Fun√ß√£o auxiliar: calcula a TAG, o n√∫mero do grupo e o identificador do bloco
    def obter_tag_grupo_identificador(self, endereco_hex):
        endereco = int(endereco_hex, 16)

        endereco_bloco = endereco >> self.bits_offset
        grupo = (endereco_bloco & ((1 << self.bits_indice) - 1)) if self.bits_indice > 0 else 0
        tag = endereco_bloco >> self.bits_indice

        bloco = endereco >> (self.bits_offset + self.bits_indice)
        identificador_hex = f"0x{bloco:08X}"

        return tag, grupo, identificador_hex

    # Realiza um acesso √† cache com base em um endere√ßo hexadecimal
    def acessar_cache(self, endereco_hex):
        tag, grupo, id_bloco = self.obter_tag_grupo_identificador(endereco_hex)
        cache_grupo = self.cache[grupo]
        fila_grupo = self.fifo[grupo]

        # Verifica se houve HIT
        for linha, tag_armazenada in enumerate(cache_grupo):
            if tag_armazenada == tag:
                self.historico.append({
                    "addr": id_bloco,
                    "group": grupo,
                    "idx_line": linha,
                    "result": "HIT"
                })
                return

        # MISS ‚Äî substitui√ß√£o FIFO se necess√°rio
        if len(fila_grupo) >= self.associatividade:
            idx_antigo = fila_grupo.popleft()
            cache_grupo[idx_antigo] = tag
            fila_grupo.append(idx_antigo)
            linha = idx_antigo
        else:
            # Encontra a pr√≥xima linha vazia
            for linha in range(self.associatividade):
                if cache_grupo[linha] is None:
                    cache_grupo[linha] = tag
                    fila_grupo.append(linha)
                    break

        self.historico.append({
            "addr": id_bloco,
            "group": grupo,
            "idx_line": linha,
            "result": "MISS"
        })

    # Retorna o hist√≥rico completo dos acessos (HITs e MISSes)
    def obter_historico(self):
        return self.historico

### **Fun√ß√£o de visualizac√£o da Cache**

In [2]:
import pandas as pd
from IPython.display import display, HTML, clear_output
import ipywidgets as widgets

def imprimir_resultados(historico, cache_size, line_size, associativity):
    df = pd.DataFrame(historico)

    num_lines = cache_size // line_size
    num_groups = num_lines // associativity

    # === Hist√≥rico ===
    print("\n=== Hist√≥rico de Acessos ===")
    def color_result(val):
        if val == "HIT":
            return "background-color: lightgreen; text-align: center"
        elif val == "MISS":
            return "background-color: lightcoral; text-align: center"
        else:
            return ""

    styled_df = df.style.map(color_result, subset=["result"]).set_properties(**{
        'text-align': 'center'
    }).set_table_attributes('style="margin: auto"')

    display(styled_df)

    # === Contadores ===
    hits = (df["result"] == "HIT").sum()
    misses = (df["result"] == "MISS").sum()

    print(f"\nHITs: {hits}")
    print(f"MISSes: {misses}")

    # === Estado final da cache ===
    ultima_ocorrencia = (
        df[df["result"] == "MISS"]
        .drop_duplicates(subset=["group", "idx_line"], keep='last')
    )

    estado_cache = []
    for group in range(num_groups):
        for idx_line in range(associativity):
            match = ultima_ocorrencia.query("group == @group and idx_line == @idx_line")
            addr = match.iloc[0]["addr"] if not match.empty else "-"
            estado_cache.append({
                'group': group,
                'idx_line': idx_line,
                'addr': addr
            })

    estado_df = pd.DataFrame(estado_cache)

    print("\n=== Estado Final da Cache ===")
    styled_estado = estado_df.style.map(
        lambda v: "background-color: lightgray; text-align: center" if v == "-" else "text-align: center",
        subset=["addr"]
    ).set_properties(**{
        'text-align': 'center'
    }).set_table_attributes('style="margin: auto"')

    display(styled_estado)

    # === Interatividade: passo a passo ===
    print("\n=== Evolu√ß√£o da Cache (passo a passo) ===")

    slider = widgets.IntSlider(
        value=0,
        min=0,
        max=len(df),
        step=1,
        description='Passo:',
        continuous_update=False
    )

    output = widgets.Output()

    def atualizar_cache(passo):
        with output:
            clear_output(wait=True)

            if passo == 0:
                print("‚ö†Ô∏è Nenhum acesso realizado ainda.")
                return

            parcial = df.iloc[:passo]
            ult_parcial = (
                parcial[parcial["result"] == "MISS"]
                .drop_duplicates(subset=["group", "idx_line"], keep='last')
            )

            estado_parcial = []
            for group in range(num_groups):
                for idx_line in range(associativity):
                    match = ult_parcial.query("group == @group and idx_line == @idx_line")
                    addr = match.iloc[0]["addr"] if not match.empty else "-"
                    estado_parcial.append({
                        'group': group,
                        'idx_line': idx_line,
                        'addr': addr
                    })

            parcial_df = pd.DataFrame(estado_parcial)

            print(f"üìç Acesso {passo}/{len(df)}: addr = {df.iloc[passo-1]['addr']} | result = {df.iloc[passo-1]['result']}")
            styled_parcial = parcial_df.style.map(
                lambda v: "background-color: lightgray; text-align: center" if v == "-" else "text-align: center",
                subset=["addr"]
            ).set_properties(**{
                'text-align': 'center'
            }).set_table_attributes('style="margin: auto"')

            display(styled_parcial)

    slider.observe(lambda change: atualizar_cache(change["new"]), names="value")

    display(slider, output)
    atualizar_cache(0)

### **EXEMPLO 1**

In [4]:
# Par√¢metros de entrada
cache_size = 4096
line_size = 1024
associativity = 4

entrada1 = [
'0x0CB886CA',
'0x06BC89BA',
'0x379CBAD1',
'0x28F3123B',
'0x06F98ED5'
]

simulator = SimuladorCache(cache_size, line_size, associativity)
for addr in entrada1:
    simulator.acessar_cache(addr)

history = simulator.obter_historico()
imprimir_resultados(history, cache_size, line_size, associativity)


=== Hist√≥rico de Acessos ===


Unnamed: 0,addr,group,idx_line,result
0,0x00032E21,0,0,MISS
1,0x0001AF22,0,1,MISS
2,0x000DE72E,0,2,MISS
3,0x000A3CC4,0,3,MISS
4,0x0001BE63,0,0,MISS



HITs: 0
MISSes: 5

=== Estado Final da Cache ===


Unnamed: 0,group,idx_line,addr
0,0,0,0x0001BE63
1,0,1,0x0001AF22
2,0,2,0x000DE72E
3,0,3,0x000A3CC4



=== Evolu√ß√£o da Cache (passo a passo) ===


IntSlider(value=0, continuous_update=False, description='Passo:', max=5)

Output()

### **EXEMPLO 2**

In [5]:
# Par√¢metros de entrada
cache_size = 4096
line_size = 1024
associativity = 4

entrada2 = [
  '0x0CB886CA',
  '0x06BC89BA',
  '0x379CBAD1',
  '0x28F3123B',
  '0x06F98ED5',
  '0x06F98ED8',
  '0x06BC89BA'
]

simulator = SimuladorCache(cache_size, line_size, associativity)
for addr in entrada2:
    simulator.acessar_cache(addr)

history = simulator.obter_historico()
imprimir_resultados(history, cache_size, line_size, associativity)


=== Hist√≥rico de Acessos ===


Unnamed: 0,addr,group,idx_line,result
0,0x00032E21,0,0,MISS
1,0x0001AF22,0,1,MISS
2,0x000DE72E,0,2,MISS
3,0x000A3CC4,0,3,MISS
4,0x0001BE63,0,0,MISS
5,0x0001BE63,0,0,HIT
6,0x0001AF22,0,1,HIT



HITs: 2
MISSes: 5

=== Estado Final da Cache ===


Unnamed: 0,group,idx_line,addr
0,0,0,0x0001BE63
1,0,1,0x0001AF22
2,0,2,0x000DE72E
3,0,3,0x000A3CC4



=== Evolu√ß√£o da Cache (passo a passo) ===


IntSlider(value=0, continuous_update=False, description='Passo:', max=7)

Output()

### **EXEMPLO 3**

In [6]:
# Par√¢metros de entrada
cache_size = 4096
line_size = 1024
associativity = 4

entrada3 = [
  '0x0CB886CA',
  '0x06BC89BA',
  '0x379CBAD1',
  '0x28F3123B',
  '0x06F98ED5',
  '0x06F98ED8',
  '0x17AA08A2'
]

simulator = SimuladorCache(cache_size, line_size, associativity)
for addr in entrada3:
    simulator.acessar_cache(addr)

history = simulator.obter_historico()
imprimir_resultados(history, cache_size, line_size, associativity  )


=== Hist√≥rico de Acessos ===


Unnamed: 0,addr,group,idx_line,result
0,0x00032E21,0,0,MISS
1,0x0001AF22,0,1,MISS
2,0x000DE72E,0,2,MISS
3,0x000A3CC4,0,3,MISS
4,0x0001BE63,0,0,MISS
5,0x0001BE63,0,0,HIT
6,0x0005EA82,0,1,MISS



HITs: 1
MISSes: 6

=== Estado Final da Cache ===


Unnamed: 0,group,idx_line,addr
0,0,0,0x0001BE63
1,0,1,0x0005EA82
2,0,2,0x000DE72E
3,0,3,0x000A3CC4



=== Evolu√ß√£o da Cache (passo a passo) ===


IntSlider(value=0, continuous_update=False, description='Passo:', max=7)

Output()

### **EXEMPLO 4**

In [7]:
# Par√¢metros de entrada
cache_size = 4096
line_size = 1024
associativity = 4

entrada4 = [
  '0x0CB886CA',
  '0x06BC89BA',
  '0x379CBAD1',
  '0x28F3123B',
  '0x06F98ED5',
  '0x06F98ED8',
  '0x17AA08A2',
  '0x06BC89BA'
]

simulator = SimuladorCache(cache_size, line_size, associativity)
for addr in entrada4:
    simulator.acessar_cache(addr)

history = simulator.obter_historico()
imprimir_resultados(history, cache_size, line_size, associativity  )


=== Hist√≥rico de Acessos ===


Unnamed: 0,addr,group,idx_line,result
0,0x00032E21,0,0,MISS
1,0x0001AF22,0,1,MISS
2,0x000DE72E,0,2,MISS
3,0x000A3CC4,0,3,MISS
4,0x0001BE63,0,0,MISS
5,0x0001BE63,0,0,HIT
6,0x0005EA82,0,1,MISS
7,0x0001AF22,0,2,MISS



HITs: 1
MISSes: 7

=== Estado Final da Cache ===


Unnamed: 0,group,idx_line,addr
0,0,0,0x0001BE63
1,0,1,0x0005EA82
2,0,2,0x0001AF22
3,0,3,0x000A3CC4



=== Evolu√ß√£o da Cache (passo a passo) ===


IntSlider(value=0, continuous_update=False, description='Passo:', max=8)

Output()

### **EXEMPLO 5**

In [8]:
# Par√¢metros de entrada
cache_size = 4096
line_size = 1024
associativity = 2

entrada5 = [
  '0x0CB886CA',
  '0x06BC89BA'
]

simulator = SimuladorCache(cache_size, line_size, associativity)
for addr in entrada5:
    simulator.acessar_cache(addr)

history = simulator.obter_historico()
imprimir_resultados(history, cache_size, line_size, associativity  )


=== Hist√≥rico de Acessos ===


Unnamed: 0,addr,group,idx_line,result
0,0x00019710,1,0,MISS
1,0x0000D791,0,0,MISS



HITs: 0
MISSes: 2

=== Estado Final da Cache ===


Unnamed: 0,group,idx_line,addr
0,0,0,0x0000D791
1,0,1,-
2,1,0,0x00019710
3,1,1,-



=== Evolu√ß√£o da Cache (passo a passo) ===


IntSlider(value=0, continuous_update=False, description='Passo:', max=2)

Output()

### **EXEMPLO 6**

In [9]:
# Par√¢metros de entrada
cache_size = 4096
line_size = 1024
associativity = 1

entrada6 = [
  '0x0CB886CA',
  '0x06BC89BA',
  '0x379CBAD1',
  '0x28F3123B',
  '0x06F98ED5',
  '0x06F98ED8',
  '0x17AA08A2',
]

simulator = SimuladorCache(cache_size, line_size, associativity)
for addr in entrada6:
    simulator.acessar_cache(addr)

history = simulator.obter_historico()
imprimir_resultados(history, cache_size, line_size, associativity  )


=== Hist√≥rico de Acessos ===


Unnamed: 0,addr,group,idx_line,result
0,0x0000CB88,1,0,MISS
1,0x00006BC8,2,0,MISS
2,0x000379CB,2,0,MISS
3,0x00028F31,0,0,MISS
4,0x00006F98,3,0,MISS
5,0x00006F98,3,0,HIT
6,0x00017AA0,2,0,MISS



HITs: 1
MISSes: 6

=== Estado Final da Cache ===


Unnamed: 0,group,idx_line,addr
0,0,0,0x00028F31
1,1,0,0x0000CB88
2,2,0,0x00017AA0
3,3,0,0x00006F98



=== Evolu√ß√£o da Cache (passo a passo) ===


IntSlider(value=0, continuous_update=False, description='Passo:', max=7)

Output()