

Instituto Tecnológico de Costa Rica Área Académica de Ingeniería en Computadores CE4301— Arquitectura de Computadores I Johnny Zaet Agüero Sandí

# Taller #5

Se genera el diagrama de configuración del sistema.



Se procede a realizar la ejecución de ejemplo.

```
(johnnyzaet@ Kali)-[~/Documents/GEMS/gem5]
$ build/X86/gem5.opt configs/deprecated/example/se.py -c tests/test-progs/hello/bin/x86/linux/hello
gem5 Simulator System. https://www.gem5.org
gem5 Simulator System. https://www.gem5.org
gem5 is copyrighted software; use the --copyright option for details.

gem5 version 23.0.0.1
gem5 compiled Oct 26 2023 12:50:53
gem5 started Oct 26 2023 13:12:50
gem5 executing on Kali, pid 1461384
command line: build/X86/gem5.opt configs/deprecated/example/se.py -c tests/test-progs/hello/bin/x86/linux/hello
warn: The `get_runtime_isa` function is deprecated. Please migrate away from using this function.
warn: The se.py script is deprecated. It will be removed in future releases of gem5.
warn: The `get_runtime_isa` function is deprecated. Please migrate away from using this function.
Global frequency set at 1000000000000 ticks per second
src/mem/dram_interface.cc:690: warn: DRAM device capacity (8192 Mbytes) does not match the address range assigned (512 M bytes)
src/base/statistics.hh:279: warn: One of the stats is a legacy stat. Legacy stat is a stat that does not belong to any s tatistics::Group. Legacy stat is deprecated.
system.remote_gdb: Listening for connections on port 7000
***** REAL SIMULATION ****
src/sim/simulate.cc:194: info: Entering event queue @ 0. Starting simulation...
Hello world!
Exiting @ tick 5943000 because exiting with last active thread context
```



Instituto Tecnológico de Costa Rica Área Académica de Ingeniería en Computadores CE4301— Arquitectura de Computadores I Johnny Zaet Agüero Sandí

Posterior a esto, luego se genera una lista de los posibles procesadores que se pueden utilizar. Para poder utilizarlos y analizar su respectivo stats.txt.

```
gem5 compiled Oct 26 2023 12:50:53
gem5 started Oct 26 2023 13:17:43
   em5 executing on Kali, pid 1463982
 ommand line: build/X86/gem5.opt configs/deprecated/example/se.py -c tests/test-progs/hello/bin/x86/linux/hello --list-c
u-types
 arn: The `get_runtime_isa` function is deprecated. Please migrate away from using this function.
arn: The se.py script is deprecated. It will be removed in future releases of gem5.
vailable BaseCPU classes:
              AtomicSimpleCPU
              Simple CPU model executing a configurable number of instructions per cycle. This model uses the simplified 'atomic' memory mode.

BaseAtomicSimpleCPU
                            Simple CPU model executing a configurable number of instructions per cycle. This model uses the simplified 'atomic' memory mode.
              BaseMinorCPU
                             CatchingsImpleced
Simple CPU model based on the atomic CPU. Unlike the atomic CPU,
this model causes the memory system to bypass caches and is
therefore slightly faster in some cases. However, its main purpose
is as a substitute for hardware virtualized CPUs when stress-testing
                             the memory system.
              Base03CPU
              BaseTimingSimpleCPU
DerivO3CPU
              NonCachingSimpleCPU
                             Simple CPU model based on the atomic CPU. Unlike the atomic CPU,
                             this model causes the memory system to bypass caches and is
therefore slightly faster in some cases. However, its main purpose
is as a substitute for hardware virtualized CPUs when stress-testing
                             the memory system.
              03CPU
              TimingSimpleCPU
                            Trace CPU model which replays traces generated in a prior simulation using Deriv03CPU or its derived classes. It interfaces with L1
              X86AtomicSimpleCPU
                            Simple CPU model executing a configurable number of instructions per cycle. This model uses the simplified 'atomic' memory mode.
              X86KvmCPU
              X86MinorCPU
              X86NonCachingSimpleCPU
                             Simple CPU model based on the atomic CPU. Unlike the atomic CPU, this model causes the memory system to bypass caches and is therefore slightly faster in some cases. However, its main purpose is as a substitute for hardware virtualized CPUs when stress-testing
```

Posteriormente se procede ejecutar los comandos cambiando el CPU.

## AtomicSimple Example:

```
| Sulld/X86/gem5.opt -d ou_atomic/ configs/deprecated/example/se.py -c tests/test-progs/hello/bin/x86/linux/hello --cp u-type=AtomicSimpleCPU --caches gem5 Simulator System. https://www.gem5.org gem5 is copyrighted software; use the --copyright option for details.

| gem5 version 23.0.0.1 gem5 compiled Oct 26 2023 12:50:53 gem5 started Oct 26 2023 13:23:24 gem5 executing on Kali, pid 1467028 command line: build/X86/gem5.opt -d ou_atomic/ configs/deprecated/example/se.py -c tests/test-progs/hello/bin/x86/linux/hello --cpu-type=AtomicSimpleCPU --caches |
| warn: The `get_runtime_isa` function is deprecated. Please migrate away from using this function. |
| warn: The `se.py script is deprecated. It will be removed in future releases of gem5. |
| warn: The `get_runtime_isa` function is deprecated. Please migrate away from using this function. |
| diobal frequency set at 1000000000000 ticks per second |
| src/base/statistics.hi:279: warn: One of the stats is a legacy stat. Legacy stat is a stat that does not belong to any statistics::Group. Legacy stat is deprecated. |
| system.remote_gdb: Listening for connections on port 7000 |
| src/base/statistics.hi:279: info: Entering event queue @ 0. Starting simulation... |
| the continuation | since | sin
```



Instituto Tecnológico de Costa Rica Área Académica de Ingeniería en Computadores CE4301– Arquitectura de Computadores I Johnny Zaet Agüero Sandí

# Timing Example:

```
—(johnnyzaet® Kali)-[~/Documents/GEM5/gem5]
-$ build/X86/gem5.opt -d out_timing/ configs/deprecated/example/se.py -c tests/test-progs/hello/bin/x86/linux/hello --c
ou-type=TimingSimpleCPU --caches
gem5 Simulator System. https://www.gem5.org
gem5 is copyrighted software; use the --copyright option for details.
gem5 version 23.0.0.1
gem5 compiled Oct 26 2023 12:50:53
gem5 started Oct 26 2023 13:19:54
gem5 executing on Kali, pid 1465138
command line: build/X86/gem5.opt -d out_timing/ configs/deprecated/example/se.py -c tests/test-progs/hello/bin/x86/linux
/hello --cpu-type=TimingSimpleCPU --caches
warn: The `get_runtime_isa` function is deprecated. Please migrate away from using this function.
warn: The se.py script is deprecated. It will be removed in future releases of gem5.
warn: The `get_runtime_isa` function is deprecated. Please migrate away from using this function.
Global frequency set at 10000000000000 ticks per second
src/mem/dram_interface.cc:690: warn: DRAM device capacity (8192 Mbytes) does not match the address range assigned (512 M
bytes)
src/base/statistics.hh:279: warn: One of the stats is a legacy stat. Legacy stat is a stat that does not belong to any s
tatistics::Group. Legacy stat is deprecated.
system.remote_gdb: Listening for connections on port 7000
**** REAL SIMULATION ****
src/sim/simulate.cc:194: info: Entering event queue @ 0. Starting simulation...
Hello world!
Exiting @ tick 31497000 because exiting with last active thread context
```

### O3 Example:

```
- (johnnyzaet& Kali) - [~/Documents/GEMS/gem5]
- $ build/XB8/gem5.opt - d out_o3/ configs/deprecated/example/se.py - c tests/test-progs/hello/bin/xB6/linux/ --cpu-type-DerivOSCPU --caches
gem5 iscopylighted software; use the --copyright option for details.

gem5 version 23.0.0.1

gem5 version 23.0.0.0.0

gem5 version 23.0.0.0

gem5 version 23.0.0.0.0

gem5 version 23.0.0.0

gem5 version 23.0.0

gem5 version 23.0
```



Instituto Tecnológico de Costa Rica Área Académica de Ingeniería en Computadores CE4301– Arquitectura de Computadores I Johnny Zaet Agüero Sandí

Se procede a realizar el benchmark para utilizarlo, en este caso se correrá primero el benchmark 401.bzip2. Para esto se procede a modificar el runGem.sh de la siguiente forma.

```
(johnnyzaet® Kali)-[~/Documents/spec/Project1_SPEC/401.bzip2]

$ cat runGem5.sh

# -- an example to run SPEC 429.mcf on gem5, put it under 429.mcf folder --
export GEM5_DIR=/home/johnnyzaet/Documents/GEM5/gem5
export BENCHMARK=./src/benchmark
export ARGUMENT=./data/input.program

time $GEM5_DIR/build/X86/gem5.opt -d m5out/ $GEM5_DIR/configs/deprecated/example/se.py -c $BENCHMARK -o $ARGUMENT -I 100
000000 --cpu-type=TimingSimpleCPU --caches --l2cache --l1d_size=128kB --l1i_size=128kB --l2_size=1MB --l1d_assoc=2 --l1i
_assoc=2 --l2_assoc=1 --cacheline_size=64
```

Posterior a la modificación, se ejecuta el BenchMark.

```
iohnnyzaet@Kali: ~/Documents/spec/Project1_SPEC/401.bzip2
                                                                                                                                                                gem5 is copyrighted software; use the --copyright option for details.
gem5 version 23.0.0.1
gem5 compiled Oct 26 2023 12:50:53
gem5 started Oct 26 2023 13:53:19
gem5 executing on Kali, pid 1482908
command line: /home/johnnyzaet/Documents/GEM5/gem5/build/X86/gem5.opt -d m5out/ /home/johnnyzaet/Documents/GEM5/gem5/con
figs/deprecated/example/se.py -c ./src/benchmark -o ./data/input.program -I 100000000 --cpu-type=TimingSimpleCPU --cache
s --l2cache --l1d_size=128kB --l1i_size=128kB --l2_size=1MB --l1d_assoc=2 --l1i_assoc=2 --l2_assoc=1 --cacheline_size=64
warn: The `get_runtime_isa` function is deprecated. Please migrate away from using this function.
warn: The se.py script is deprecated. It will be removed in future releases of gem5
warn: The `get_runtime_isa` function is deprecated. Please migrate away from using this function.
Global frequency set at 1000000000000 ticks per second
src/mem/dram_interface.cc:690: warn: DRAM device capacity (8192 Mbytes) does not match the address range assigned (512 M
bytes)
src/base/statistics.hh:279: warn: One of the stats is a legacy stat. Legacy stat is a stat that does not belong to any s
tatistics::Group. Legacy stat is deprecated.
system.remote_gdb: Listening for connections on port 7000
  *** REAL SIMULATION ****
src/sim/simulate.cc:194: info: Entering event queue @ 0. Starting simulation...
src/sim/syscall_emul.cc:74: warn: ignoring syscall set_robust_list(...)
src/sim/syscall_emul.cc:74: warn: ignoring syscall rseq(...)
src/sim/syscall_emul.cc:74: warn: ignoring syscall mprotect(...)
src/sim/mem_state.cc:443: info: Increasing stack size by one page.
src/sim/mem_state.cc:443: info: Increasing stack size by one page.
Exiting @ tick 196940953500 because a thread reached the max instruction count
 real
           3m55.685s
           3m55.312s
 user
           0m0.273s
```



Instituto Tecnológico de Costa Rica Área Académica de Ingeniería en Computadores CE4301— Arquitectura de Computadores I Johnny Zaet Agüero Sandí

Por último, en la siguiente parte se tratará con el benchmark 740.lbm, para el cual se proponen 3 diferentes cambios que podrían mejorar el rendimiento del sistema.

## Qué es el Benchmark 740.lbm

El benchmark 470.lbm es parte del conjunto SPEC CPU2006, que es una colección de programas de computadora utilizada para evaluar el rendimiento de la CPU en tareas computacionales. 470.lbm es un programa que simula la dinámica de fluidos utilizando el método Lattice Boltzmann. Este método es útil para simular la dinámica de fluidos en situaciones complejas, como flujos en medios porosos.

Dado que 470.lbm simula la dinámica de fluidos, es computacionalmente intensivo y depende en gran medida de la capacidad de la CPU para realizar cálculos rápidos y acceder eficientemente a la memoria

# Propuestas de Cambio

Aumento del Tamaño de Caché L1: Dado que 470.lbm es computacionalmente intensivo, un aumento en el tamaño de la caché L1 podría reducir la cantidad de fallos de caché y, por lo tanto, mejorar el rendimiento. Al tener más datos almacenados en la caché L1, la CPU podría acceder a ellos más rápidamente sin tener que buscar en cachés de nivel superior o en la memoria principal.

Aumento de la Asociatividad de Caché: Un aumento en la asociatividad de la caché puede reducir los fallos de caché, especialmente en programas con patrones de acceso a memoria no uniformes. Al aumentar la asociatividad, se permite que más bloques de datos ocupen un conjunto particular en la caché, lo que puede reducir los conflictos y, por lo tanto, los fallos de caché.

Aumento del Tamaño de Caché L2: Si el tamaño de la caché L1 no es suficiente para contener todos los datos necesarios, un aumento en el tamaño de la caché L2 podría ser beneficioso. La caché L2 actúa como un respaldo para la caché L1 y almacena datos que no caben en L1. Un tamaño de caché L2 más grande podría reducir el número de veces que la CPU necesita acceder a la memoria principal, que es más lenta.

## **Implementaciones**

### Aumento del Tamaño de Caché L1:

```
$ cat runGem5.sh
# -- an example to run SPEC 429.mcf on gem5, put it under 429.mcf folder
--
export GEM5_DIR=/home/johnnyzaet/Documents/GEM5/gem5
export BENCHMARK=./src/benchmark
export ARGUMENT=./data/input.program
time $GEM5_DIR/build/X86/gem5.opt -d m5out/ $GEM5_DIR/configs/deprecated
/example/se.py -c $BENCHMARK -o $ARGUMENT -I 100000000 --cpu-type=Timing
SimpleCPU --caches --l2cache --l1d_size=512kB --l1i_size=128kB --l2_size
=1MB --l1d_assoc=2 --l1i_assoc=2 --l2_assoc=1 --cacheline_size=64
```



Instituto Tecnológico de Costa Rica Área Académica de Ingeniería en Computadores CE4301- Arquitectura de Computadores I Johnny Zaet Agüero Sandí

### Aumento de la Asociatividad de Caché:

```
$ cat runGem5.sh
# -- an example to run SPEC 429.mcf on gem5, put it under 429.mcf folder
--
export GEM5_DIR=/home/johnnyzaet/Documents/GEM5/gem5
export BENCHMARK=./src/benchmark
export ARGUMENT=./data/input.program
time $GEM5_DIR/build/X86/gem5.opt -d m5out/ $GEM5_DIR/configs/deprecated
/example/se.py -c $BENCHMARK -o $ARGUMENT -I 1000000000 --cpu-type=Timing
SimpleCPU --caches --l2cache --l1d_size=128kB --l1i_size=128kB --l2_size
=1MB --l1d_assoc=4 --l1i_assoc=2 --l2_assoc=1 --cacheline_size=64
```

### Aumento del Tamaño de Caché L2:

```
$ cat runGem5.sh
# -- an example to run SPEC 429.mcf on gem5, put it under 429.mcf folder
--
export GEM5_DIR=/home/johnnyzaet/Documents/GEM5/gem5
export BENCHMARK=./src/benchmark
export ARGUMENT=./data/input.program
time $GEM5_DIR/build/X86/gem5.opt -d m5out/ $GEM5_DIR/configs/deprecated
/example/se.py -c $BENCHMARK -o $ARGUMENT -I 100000000 --cpu-type=Timing
SimpleCPU --caches --l2cache --l1d_size=128kB --l1i_size=128kB --l2_size
=4MB --l1d_assoc=2 --l1i_assoc=2 --l2_assoc=1 --cacheline_size=64
```

## Resultados obtenidos y explicación

Aumento del Tamaño de Caché L1: El aumento del tamaño de la caché L1D de 128kB a 512kB tuvo un impacto positivo mínimo en la reducción de la tasa de fallos de caché L1D. Sin embargo, la tasa de fallos de la caché L2 se vio afectada negativamente, alcanzando el 100%. Esto sugiere que los datos que antes estaban en L2 ahora están en L1D, pero a costa de aumentar los fallos en L2.

**Aumento de la Asociatividad de Caché**: El aumento en la asociatividad de la caché L1D de 2 a 4 no tuvo un impacto en la tasa de fallos de caché L1D. Sin embargo, la tasa de fallos de la caché L2 se mantuvo en el 100%, lo que indica que la mayor asociatividad no ayudó en este caso.

**Aumento del Tamaño de Caché L2**: El aumento del tamaño de la caché L2 de 1MB a 4MB no tuvo un impacto en la tasa de fallos de caché L1D ni en la tasa de fallos de caché L2 para datos. Esto sugiere que el benchmark no está utilizando eficientemente el espacio adicional en L2.

#### Conclusión

A pesar de las modificaciones realizadas en la caché L1D y L2, el IPC se mantuvo constante en todas las configuraciones, lo que indica que estos cambios no tuvieron un impacto significativo en el rendimiento general del benchmark 470.lbm en este escenario particular.