

Instituto Tecnológico de Costa Rica Área Académica de Ingeniería en Computadores CE 4302 — Arquitectura de Computadores II

# Proyecto Individual

Protocolos de coherencia en sistemas multiprocesador

Fecha de asignación: 1 de octubre 2020
Grupos: 1 persona
Fecha de entrega: 22 de octubre 2020
Profesores: Luis Barboza Artavia
Luis Chavarría Zamora

# 1. Objetivo

Mediante el desarrollo de este proyecto, el estudiante aplicará los conceptos de coherencia de caché y sistemas multiprocesador en el diseño de un modelo en software con un protocolo basado en monitoreo (snooping) para un sistema multiprocesador simultáneo.

#### 2. Atributos relacionados

A continuación se describen los atributos del graduado que se pretenden abordar con el desarrollo del proyecto.

#### 2.1. Diseño (DI)

Capacidad para diseñar soluciones de problemas complejos de ingeniería, con final abierto y diseñar sistemas, componentes o procesos que cumplan con necesidades específicas, considerando la salud pública, seguridad, estándares pertinentes, así como los aspectos culturales, sociales, económicos y ambientales.

El atributo de diseño será evaluado tanto formativamente (reuniones de seguimiento con el profesor) como sumativamente, en especial en la sección de documentación de diseño de los entregables.

### 2.2. Habilidades de comunicación (HC)

Capacidad para comunicar conceptos complejos de Ingeniería, dentro de la profesión y con la sociedad en general. Estas habilidades incluyen: la habilidad de comprender y escribir efectivamente informes, documentación de diseños, realizar presentaciones efectivas, dar y recibir instrucciones claras. Es conveniente incentivar la capacidad de comunicarse en un segundo idioma.

El atributo de habilidades de comunicación será evaluado sumativamente en las secciones de artículo (paper) y presentación de los resultados de los entregables.



# 3. Descripción general

Los sistemas multiprocesador corresponden a la base funcional de los computadores modernos. Se pueden encontrar en cualquier sistema como los en chip, embebidos y clusters que permiten una computación de alto desempeño y procesamiento masivo en paralelo. Uno de los mayores retos que genera tener múltiples procesadores es la comunicación entre ellos. Los diseñadores de los computadores actuales han buscado mecanismos para optimizar la capacidad para compartir tareas y recursos entre los diferentes procesadores. La memoria se comparte con los demás procesadores y corresponde a uno de los recursos más importantes, puesto que se compone de los datos necesarios para ejecutar las instrucciones. Las interfaces de memoria compartida representan un desafío porque múltiples procesadores pueden solicitar un mismo dato en un instante de tiempo. Por lo tanto, el problema de incoherencia de caché todavía se investiga en el área de arquitectura de computadores.

Para este proyecto se deberán aplicar los conceptos de arquitectura de computadores, vista como una combinación de elementos de software y hardware. Se diseñará el modelo de software (plataforma de simulación) de un sistema multiprocesador con **memoria compartida**. Se hará a través de memoria caché local L1 para cada procesador, así como el protocolo de coherencia basado en monitoreo.

En el proyecto se desarrollará un acercamiento práctico al diseño de interfaces de memoria compartida y sincronización. Se abarcará el diseño, integración y programación de sistemas computacionales en general.

## 4. Especificación

Para este proyecto se deberá diseñar una aplicación de software con interfaz gráfica que modele un sistema multiprocesador con las siguientes características:

- 1. Tendrá cuatro procesadores.
- 2. Estos procesadores se encuentran conectados a una memoria compartida de 16 bloques por medio de un bus.
- 3. Cada procesador tiene una caché L1 como se muestra en la Figura 1.
- 4. Ambas memorias caché son mapeadas de forma asociativa two-way.
- 5. Cada procesador deberá generar solicitudes de procesamiento o acceso a memoria (lectura o escritura) a diferentes regiones de memoria de forma aleatoria.

A continuación se describe a mayor detalle la especificación del proyecto.





Figura 1: Arquitectura general del sistema.

#### 4.1. Modelo del sistema multiprocesador

Para el modelo del sistema multiprocesador se hará lo siguiente:

- 1. Deberá crearse una instancia del procesador de manera independiente para operar de forma paralela <sup>1</sup>.
- 2. Cada procesador deberá generar individualmente y de manera simultánea junto con los demás procesadores:
  - a) Instrucciones de procesamiento (no requiere memoria). Estas instrucciones se llaman calc.
  - b) Escritura o lectura a uno de los 16 bloques totales de la memoria compartida. Estas instrucciones se llaman read o write.
- 3. Cada una de las instrucciones debe generarse utilizando una distribución de probabilidad formal (binaria, de Poisson, hipergeométrica, etc).
- 4. Una instrucción generada debe tener los siguientes componentes:
  - Número de procesador.

<sup>&</sup>lt;sup>1</sup>Puede ser mediante hilos





- Operación: read, write y calc.
- En el caso de *write* se debe indicar la dirección de memoria (binario) y el dato a escribir (hexadecimal), respectivamente.
- 5. Una vez obtenida la instrucción, la dirección del bloque de memoria también será asignada de manera aleatoria con una distribución previamente documentada y justificada.

Una instrucción tiene el siguiente formato de ejemplo:

P0: READ 0100

P1: CALC

P3: WRITE 1010;4A3B

P4: CALC

El modelo del sistema deberá proveer una base de temporización para la generación de los eventos de procesamiento, lecturas y escrituras a definir por cada estudiante. Dicha base debe permitir la correcta visualización de todas las acciones generadas por el sistemas multiprocesador y sistema de coherencia de caché.

En todo momento deberá mostrarse la acción de cada núcleo, así como el bloque de memoria que está utilizando. Cada procesador será identificado por su número único.

### 4.2. Modelo de memoria principal

La memoria principal será unificada y compartida, comunicándose con los procesadores a través de un único bus. La funciones del modelo memoria principal serán:

- 1. Actualizar el contenido compartido de los bloques en escrituras (según política de escritura establecida).
- 2. Permitir la visualización de los 16 bloques en todo momento.

El sistema deberá simular las condiciones propias de pared de memoria. Tendrá un retardo propio de lectura o escritura a memoria, cuando corresponda. El tiempo debe ser proporcional a la frecuencia elegida anteriormente, de manera que exista el problema de que el procesador es más rápido que la memoria.

Al iniciar la aplicación, el contenido de los bloques de memoria deben ser 0. Cada bloque es de 16 bits y debe ser representado en hexadecimal.



#### 4.3. Modelo de memoria caché y sistema de coherencia

Cada procesador tiene su caché L1, se pueden almacenar 4 bloques en cada una y posee correspondencia asociativa two-way. Debe implementar monitoreo (snooping) con el fin de controlar la coherencia entre las memorias caché de los procesadores y memoria principal.

Se asumirá que si el dato es referenciado por primera vez, este no se encuentra en caché. La caché deberá generar alertas de *misses* tanto por escritura como por lectura. Además deberá permitir la visualización del contenido de los 4 bloques, por cada procesador, en todo momento.

Adicional al modelo de la caché, deberá diseñarse un modelo del sistema de coherencia, dentro del controlador, que deberá asegurar la coherencia entre todas las cachés. El modelo deberá incorporar una política de invalidación/actualización para las cachés de los demás procesadores. Ante una actualización en alguna caché, o un *miss* por invalidación, el sistema de coherencia deberá controlar la lectura del bloque correspondiente desde memoria principal, y la escritura hacia las demás cachés.

Al iniciar la aplicación la caché estará fría, es decir, el contenido de los bloques de caché debe ser 0. Deberá realizar estos desaciertos obligatorios.

La información que la caché L1 debe contener es:

- Número de bloque.
- Estado de coherencia: M (modificado), S (shared) y I (inválido), O (dueño), E (exclusivo).
- Dirección de memoria.
- Dato de 16 bits en hexa.

#### 4.3.1. Interfaz gráfica

El sistema debe visualizarse por medio de una interfaz gráfica con el fin de observar el comportamiento de cada uno de los procesadores al generar las instrucciones. La temporización elegida debe permitir la correcta visualización de todas las acciones generadas por el sistema multiprocesador y sistema de coherencia de caché.

Los elementos que deben visualizarse son:

- Identificador de cada procesador.
- Información de la caché L1 detallada en la sección anterior para cada procesador.



- Última instrucción generada, así como la instrucción generada para cada procesador.
- Contenido de la memoria.

El sistema a nivel temporal tendrá tres modos:

- 1. Número de ciclos a ejecutar continuamente.
- 2. Paso a paso (solo ejecuta el siguiente ciclo).
- 3. Ejecución continua (no se detiene hasta que el usuario lo detenga con pausa).

Se usan pausas para poder distinguir de mejor manera la transición de los estados de los diferentes bloques de caché. Además, el usuario puede agregar una instrucción a ejecutarse en el siguiente ciclo. Para ello, cuando el sistema esté en pausa, se podrá elegir un procesador e indicar el tipo de instrucción, así como la lectura o escritura con sus respectivas direcciones y dato en caso de que aplique. Sólo se podrá agregar una instrucción en modo pausa y se verá reflejada luego de ejecutar la instrucción actual.

#### 4.4. Notas adicionales

- El desarrollo de este proyecto es individual.
- El lenguaje de programación o herramientas de desarrollo podrá ser elegido abiertamente por cada estudiante.
- Todo diseño deberá tener al menos 2 propuestas detalladas adecuadamente y comparadas según criterios.

# 5. Entregables

Como entregables en este proyecto se evaluará lo siguiente:

- Presentación funcional completa de **30 minutos** (65 %): Cada estudiante deberá demostrar en una sesión (previa cita con el profesor) las diferentes pruebas sobre el sistema. El profesor evaluará las pruebas según rúbrica correspondiente, se realizarán preguntar orales de lo implementado. En la sesión se harán preguntas relacionadas sobre cualquier etapa del sistema. El día de la presentación, el estudiante descargará la versión entregada en el TecDigital.
- Artículo tipo paper (10%): El paper a realizar deberá tener una extensión no mayor a 4 páginas, deberá ser realizado con LATEX, siguiendo el formato IEEE Transactions. En general el paper deberá contar con las siguientes secciones:



- 1. Abstract (en inglés): Un buen abstract tiene las siguientes características:
  - a) Un abstract permite a los lectores obtener la esencia o esencia de su artículo o artículo rápidamente, para decidir si leer el artículo completo.
  - b) Un abstract prepara a los lectores para seguir la información detallada, los análisis y los argumentos en su artículo completo.
  - c) Un abstract ayuda a los lectores a recordar puntos clave de su pap.
  - d) Un abstract es de entre 150 y 250 palabras.
- 2. Introducción: Una buena introducción muestra el contexto del problema o lo que se va a solucionar, introduce el tema al lector. Al final de la introducción se indica la organización del documento (primero se muestra la investigación, luego....).
- 3. Marco teórico.
- 4. Sistema desarrollado.
- 5. Resultados y análisis.
- 6. Conclusiones escritas en prosa.
- 7. Bibliografía, en formato IEEE y referenciadas en el texto (usar cite). Referencia bien para evitar problemas de plagio.
- Presentación del paper y resultados (5 %): Cada persona deberá grabar y entregar un video de no más de 5 minutos, presentando la idea de su solución (puede utilizar diapositivas o algún otro medio de referencia). Debe considerar que el público meta de su presentación no tiene necesariamente el background técnico, por lo que deberá exponer de forma clara lo que se ha realizado, así como los resultados más importantes de su diseño. Puede utilizar el canal de Youtube "Two Minute Papers", como referencia. Por motivos de acreditación del programa, se recomienda vehemente que el enlace proporcionado esté disponible por cualquier persona que tenga acceso a él, hasta un año después de entregada esta evaluación.
- Documentación de diseño (20 %): La documentación del diseño deberá contener las siguientes secciones:
  - Listado de requerimientos del sistema: Cada estudiante deberá determinar los requerimientos de ingeniería del problema planteado, considerando partes involucradas, estado del arte, estándares, normas, entre otros.
  - Elaboración de opciones de solución al problema: Para el problema planteado deberán documentarse al menos dos opciones de solución. Cada solución deberá ser acompañada de algún tipo de diagrama.
  - Comparación de opciones de solución: Se deberán comparar explícitamente las opciones de solución, de acuerdo con los requerimientos y otros aspectos aplicables de salud, seguridad, ambientales, económicos, culturales, sociales y de estándares.





- Selección de la propuesta final: Se deberá seleccionar una propuesta final de las opciones de solución, de acuerdo con los criterios de comparación.
- Implementación del diseño: Se deberá documentar completamente el diseño final seleccionado. Para el caso de este proyecto esto incluye: descripción del protocolo diseñado, diagrama de bloques del modelo sistema multiprocesador, diagrama de bloques del computador (procesadores + memoria y aplicación), diagramas propios de diseño de sofware aplicables (de flujo, clases, composición, UML, patrones de diseño, etc.) y descripción de algoritmo propuesto y distribuciones de probabilidad implementadas.

Si tienen dudas puede escribir al profesor al correo electrónico. Los documentos serán sometidos a control de plagios para eliminar cualquier intento de plagio con trabajos de semestres anteriores, actual o copias textuales, tendrán nota de cero los casos detectados. La entrega se debe realizar por medio del TEC-Digital en la pestaña de evaluación. No se aceptan entregas extemporáneas después de la fecha de entrega a las 11:59 pm como máximo. Los documentos serán sometidos a control de plagios. Se prohíbe el uso de referencias hacia sitios no confiables.