**Cortex-M**

1. Describa brevemente las diferencias entre las familias de procesadores Cortex M0, M3 y M4.

La familia de procesadores Cortex-M se presenta como una alternativa a otras familias Cortex como Cortex-A y Cortex-R. Su característica distintiva es la de presentar circuitos integrados de bajo costo y consumo. Esto explica su popularidad en distintos ámbitos como la electrónica de consumo masivo o su uso en la industria.

Los Cortex-M0

2. ¿Por qué se dice que el set de instrucciones Thumb permite mayor densidad de código? Explique.

Mayor densidad de código implica que se puede realizar la misma tarea con un programa más pequeño. Estos es algo deseable ya que se puede fabricar un microcontrolador más sencillo, reduciéndose así los costos y el consumo energético.

El set de instrucciones *Thumb* está basado en la tecnología *Thumb-2*. Soporta el uso de instrucciones de 16 y 32 bits.

En la familia de procesadores *ARM7* y *ARM9*, se debe cambiar de estado si se desea ejecutar cálculos complejos o un gran número de operaciones condicionales. Los procesadores *Cortex-M*, en cambio, pueden mezclar operaciones de 16 y 32 bits sin cambiar de estado. Esto permite mayor densidad de código y performance sin complejidad extra.

Disponer de instrucciones de 16 y 32 *bits* permite realizar optimizaciones y buscar un balance entre tamaño del código y performance. Por ejemplo, se podría utilizar operaciones de 32 *bits* en el código del manejador de una interrupción importante donde necesitamos mejor performance. En otras áreas donde priorizamos que el código sea más pequeño, podríamos utilizar instrucciones de 16 *bits*.

3. ¿Qué entiende por arquitectura load-store? ¿Qué tipo de instrucciones no posee este tipo de arquitectura?

La arquitectura *Load-Store* implica que, para realizar una operación, se debe leer los datos de la memoria y escribirlos en registros del procesador. Una vez que los datos se encuentran en registros, allí se los puede procesar y de ser necesario volcar el resultado nuevamente a la memoria. Cada uno de los pasos descriptos se realizará utilizando una operación independiente.

Una representación de alto nivel puede observarse en el siguiente diagrama:

<<crear diagrama Load-Store>>

*Load-Store*, se diferencia de la arquitectura *Register-Memory* en que esta última puede combinar en una operación datos almacenados en memoria y registros. Este tipo de instrucciones no existen en *Load-Store*.

4. ¿Cómo es el mapa de memoria de la familia?

Los procesadores Cortex-M utilizan direccionamiento de memoria de 32 *bits*. Esto resulta en un espacio de memoria de 4 *GB*. Los datos e instrucciones comparten el mismo espacio de direcciones.

Los 4 *GB* de espacio de memoria se subdivide en las siguientes regiones:

Code: 512 MB para el código del programa. Incluye la tabla de vectores.

SRAM: Normalmente utilizada para conectar SRAM (usualmente *on-chip*)

Peripherals: Normalmente utilizada para conectar periféricos *on-chip*

RAM: Puede almacenar código y datos de programa.

Devices: Contiene dos slots de 512 *MB* (1 *GB* total). Se utiliza para conectar periféricos *off-chip*.

System: Contiene varias partes

* Internal Private Peripheral Bus (PPB): Se utiliza para acceder a componentes del sistema tales como NVIC, Systick y a componentes de *debug*. En la mayoría de los casos esta memoria solo puede ser accedida por código que se ejecute en modo privilegiado.
* External Private Peripheral Bus: Se incluye para que el proveedor pueda agregar componentes de propios. Este espacio de memoria solo puede ser accedido por código ejecutándose en modo privilegiado.
* Vendor-Specific Area
* Resto de la memoria: Se utiliza para componentes específicos del proveedor. Muchas veces no se utiliza.

5. ¿Qué ventajas presenta el uso de los “shadowed pointers” del PSP y el MSP?

El concepto de “*shadowed pointers*” es relevante por ejemplo en sistemas embebidos que utilizan un sistema operativo o un sistema operativo de tiempo real. En este caso, parte del *kernel* y los manejadores de excepciones utilizan el MSP (*Main Stack Pointer*) mientras que las tareas de aplicación el PSP (*Program Stack Pointer*).

Cada tarea de aplicación dispone de su espacio de *stack.* El sistema operativo actualiza el PSP durante los cambios de contexto.

La ventaja de los *shadowed pointers* se resume en:

* Si una tarea de aplicación tiene un problema que culmina en la corrupción del *stack*, el *stack* utilizado por el sistema operativo muy probablemente se encuentre intacto. Esto ayuda a hacer al sistema más robusto.
* El espacio de *stack* para cada tarea solo debe cubrir el máximo requerido más un nivel de *stack frame*. El espacio requerido para el ISR y el *nested interupt handling* es almacenado solo en el *stack* principal.
* Hace más eficientes a los sistemas operativos creados para ARM Cortex-M.
* Se puede utilizar MPU para definir la región del *stack* que una aplicación puede utilizar. Si una tarea de aplicación provoca un *stack overflow*, el MPU puede generar una excepción de tipo *MemManage* y prevenir que escriba en direcciones por fuera del *stack space*.

6. Describa los diferentes modos de privilegio y operación del Cortex-M, sus relaciones y cómo se conmuta de uno al otro. Describa un ejemplo en el que se pasa del modo privilegiado a no privilegiado y nuevamente a privilegiado.

Los procesadores Cortex-M poseen dos modos de operación y dos niveles de privilegio.

Los modos de operación son *Thread Mode* y *Handler Mode;* los de privilegio, *Privileged* y *Non-privileged*.

El modo *handler* se utiliza para ejecutar excepciones e interrupciones, siempre utiliza un nivel de acceso de tipo *privileged*.

El modo *Thread* es a menudo llamado *User mode* dado que es donde se ejecuta el código de la aplicación. Por defecto, el modo *Thread* se inicia en *Privileged mode*.

Desde el modo *Thread* se puede pasar a modo *non-privileged* de forma directa, pero solo se puede retornan a modo *privileged* a través del llamado a una interrupción. Esta interrupción, será ejecutada en modo handler.

7. ¿Qué se entiende por modelo de registros ortogonal? Dé un ejemplo.

La palabra ortogonal implica la independencia de factores entre sí. En el caso del modelo de registros se dice que es ortogonal debido a que cualquier registro puede ser utilizado para cualquier operación.

8. ¿Qué ventajas presenta el uso de instrucciones de ejecución condicional (IT)? Dé un ejemplo.

Se puede utilizar la ejecución condicional para reducir el número de *branches* en el código. Esto mejora la densidad del código.

Los *branches* en el código son muy costosos ya que producen que el *pipeline* deba ser descartado. En un procesador ARM sin predicción de *branches*, típicamente tomara tres ciclos volver a llenarlo.

Por ejemplo, una secuencia sencilla IF-THEN-ELSE normalmente necesitaría un salto condicional y un *branch* incondicional. Esto puede ser reemplazado por una sola instrucción IT.

<< Agregar ejemplo>>

9. Describa brevemente las excepciones más prioritarias (reset, NMI, Hardfault).

La excepción *reset*, es invocada cuando se enciende el dispositivo (*power up)* o durante un *reset*. Al producirse una excepción de tipo *reset* la actividad del procesador se detiene en cualquier punto de cualquier instrucción. Tras el *reset*, la ejecución se inicia en la dirección provista por la entrada *reset*  en la *vector table*. La ejecución se restablece de forma privilegiada dentro del *thread mode*. *Reset* es la excepción de mayor prioridad.

NMI es un acrónimo para *Non Maskable Interrupt;* Interrupción no enmascarable. Puede ser generada por *software* o un periférico. Esta permanentemente habilitada y tiene una prioridad fija de 2. Esto la convierte en la interrupción con la segunda mayor prioridad.

NMI no puede ser enmascarada por otra excepción. La única excepción que puede adelantársele es la de *reset*.

*HardFault* sucede cuando existe un error en el procesamiento de una excepción, o porque una excepción no puede ser manejada por ningún mecanismo. Tiene una prioridad de -1. Esto la convierte en la excepción de “prioridad configurable” con mayor prioridad.

10. Describa las funciones principales de la pila. ¿Cómo resuelve la arquitectura el llamado a funciones y su retorno?

El *stack* (pila) es un mecanismo de uso de memoria que permite utilizar una porción como un *buffer* de almacenamiento de datos de tipo FIFO.

Se puede utilizar para:

* Almacenamiento temporal de los datos originales cuando una función en ejecución necesita utilizar los registros para el procesamiento de datos. Los valores iniciales pueden ser restaurados al finalizar la función de modo que el programa que la invoco no pierda los datos.
* Pasar información a funciones y subrutinas.
* Almacenamiento de variables locales.
* Almacenar el estado del procesador y los valores de los registros en caso de que se produzca una excepción (por ejemplo, una interrupción).

ARM utiliza un modelo de *stack* llamado *Full-Descending Stack*. Cuando el procesador se inicia, el Stack Pointer apunta al final de la memoria reservada para el mismo. Cada operación de PUSH decrementa el Stack Pointer y almacena el dato en la dirección apuntada. Las operaciones de POP se lee el valor de la memoria y luego se incrementa el stack pointer.

Llamado a funciones y retorno

El primer desafío al momento de llamar a una función es que podría necesitar hacer uso de registros que están siendo utilizados por el programa principal. Estos valores deben ser preservados.

Para ello se realiza el *Stacking*, esto es, tomar el valor de los registros que se desea preservar y hacer un PUSH al *stack*.

Cuando la función termine su ejecución tenemos el problema opuesto, es decir necesitamos recuperar los datos originales para que el programa pueda continuar su ejecución. Esto lo hacemos ejecutando una operación POP por cada uno de los registros salvaguardados.

El retorno de valores desde la función se hace de forma similar, dentro de ella se hace un *push* del valor a retornar al *stack*. Desde el programa principal, este valor puede ser recuperado mediante un POP.

11. Describa la secuencia de reset del microprocesador.

La secuencia de *reset* del microprocesador puede resumirse en los siguientes pasos:

1. Después del reset el contador de programa (PC) se actualiza con la dirección 0x00000000.
2. El procesador lee el valor de la dirección 0x00000000 y lo carga en el MSP (Main Stack Pointer).
3. El procesador lee la dirección del reset handler de la dirección 0x00000004.
4. El procesador “salta” a la dirección de memoria del reset handler y comienza a ejecutar las instrucciones.
5. Se invoca a la función main del programa con el código del usuario.

El *Reset handler*, es una función normal escrita en C o *Assembly* que se encarga de inicializar el procesador y los periféricos. Por ejemplo, configura el reloj, inicializa el stack space, etc.

<< Agregar diagrama >>

12. ¿Qué entiende por “core peripherals”? ¿Qué diferencia existe entre estos y el resto de los periféricos?

Los periféricos core son aquellos que se encuentran comprendidos dentro de la arquitectura de ARM. El resto de los periféricos son agregados por los fabricantes de los microcontroladores al efecto de orientar su producto a un determinado uso.

13. ¿Cómo se implementan las prioridades de las interrupciones? Dé un ejemplo

14. ¿Qué es el CMSIS? ¿Qué función cumple? ¿Quién lo provee? ¿Qué ventajas aporta?

CMSIS es una iniciativa de ARM para proveer librerías y una API standard para la programación de los procesadores de la familia Cortex-M. Esto permite reutilizar código e incrementar su portabilidad.

15. Cuando ocurre una interrupción, asumiendo que está habilitada ¿Cómo opera el microprocesador para atender a la subrutina correspondiente? Explique con un ejemplo.

16. ¿Cómo cambia la operación de stacking al utilizar la unidad de punto flotante?

17. Explique las características avanzadas de atención a interrupciones: tail chaining y late arrival.

Tail chaining: Se utiliza cuando se presenta una excepción al mismo tiempo que el procesador está ejecutando otra de igual o mayor prioridad. En este caso, cuando el procesador termine de atender la primera interrupción procederá a atender la siguiente. La técnica de *Tail chaining* permite optimizar esta situación evitando recuperar los registros desde el *stack* (*unstacking*) para luego cargarlos nuevamente al *stack* (*stacking*). El procesador omite esta secuencia y directamente ejecuta el *exception handler*.

De esta forma se reduce el tiempo de espera para la atención de la segunda interrupción.

Esta técnica mejora la eficiencia energética del sistema ya que el tráfico de memoria requerido para los accesos al *stack* consume energía.

Late arrival: Si el procesador se encuentra realizando el *stacking* de una interrupción y durante el mismo se recibe una interrupción de mayor prioridad, esta última será atendida primero tan pronto como se termine el proceso de *stacking* pendiente.

18. ¿Qué es el systick? ¿Por qué puede afirmarse que su implementación favorece la portabilidad de los sistemas operativos embebidos?

Los procesadores Cortex-M poseen un *timer* integrado llamado *SysTick* (*System Tick)* que genera una excepción en intervalos regulares de tiempo.

En el contexto de un sistema operativo, se utiliza al *Systick Timer* para el manejo de tareas y cambio de contexto. Fuera de los sistemas operativos, se utiliza a este componente para implementar interrupciones, generar *delays* o medir tiempos.

El temporizador *SysTick* favorece la portabilidad de los sistemas operativos ya que es una característica que todos los procesadores Cortex-M poseen. Esto hace que esa porción del código del sistema operativo pueda funcionar en todos los procesadores de la arquitectura sin modificaciones.

19. ¿Qué funciones cumple la unidad de protección de memoria (MPU)?

El MPU es un dispositivo programable que se utiliza para definir permisos de acceso a memoria y atributos de memoria para las distintas regiones de memoria.

Los procesadores Cortex-M3 y Cortex-M4 soportan hasta 8 regiones de memoria. Cada una de ellas tiene su dirección inicial, tamaño y configuraciones.

La MPU se utiliza para hacer a los sistemas embebidos más robustos y seguros:

* Previene que las tareas de aplicación corrompan la memoria de stack o de datos utilizada por otras tareas y por el kernel del sistema operativo.
* Previene que tareas no privilegiadas accedan a ciertos periféricos que son críticos para la solidez o la seguridad del sistema.
* Se puede definir el espacio SRAM o RAM como no ejecutable para prevenir ataques de inyección de código.
* Se puede definir atributos de memoria como el *cacheability*.

Si un acceso a memoria viola los permisos definidos por la MPU, el acceso es bloqueado y se genera una excepción.

20. ¿Cuántas regiones pueden configurarse como máximo? ¿Qué ocurre en caso de haber solapamientos de las regiones? ¿Qué ocurre con las zonas de memoria no cubiertas por las regiones definidas?

Los procesadores Cortex-M3 y Cortex-M4 soportan hasta 8 regiones de memoria. Cada una de ellas tiene su dirección inicial, tamaño y configuraciones.

En caso de haber solapamiento los atributos de acceso y privilegios estarán basados en los definidos para la región de mayor numeración.

Si se intenta utilizar una zona de memoria que no está cubierta por las regiones definidas, esto bloqueara la ejecución y se lanzara una excepción.

21. ¿Para qué se suele utilizar la excepción PendSV? ¿Cómo se relaciona su uso con el resto de las excepciones? Dé un ejemplo

PendSV se utiliza fundamentalmente para realizar cambios de contexto entre tareas de un sistema operativo.

Durante un proceso de *context* *switching* entre dos tareas A y B, puede suceder que ocurra una interrupción con mayor prioridad (por ejemplo, un systick). En este contexto el sistema operativo no debería realizar el *context switch* ya que el *handler* de la interrupción quedaría bloqueado. Incluso podría producirse una excepción si el sistema operativo intenta pasar a *thread mode* durante la ejecución de una interrupción.

PendSV demora la ejecución del context-switch hasta que todos los IRQ *handlers* hayan terminado su procesamiento. Para ello PendSV es la excepción de menor prioridad.

<<Agregar ejemplo>>

22. ¿Para qué se suele utilizar la excepción SVC? Explíquelo dentro del marco de un sistema operativo embebido.

La excepción SVC es muy relevante en el campo de los sistemas operativos embebidos ya que permite, en conjunto con la instrucción SVC, implementar una *API* que permita a las aplicaciones acceder a recursos del sistema.

En lugar de proveer acceso privilegiado al *hardware*, las tareas de aplicación pueden ejecutarse en modo no privilegiado y acceder a servicios que requieran permisos elevados a través de servicios del sistema operativo.

Esto es una ventaja también para el desarrollo de tareas de aplicación ya que no se requiere manejar ciertos aspectos del hardware sino conocer la llamada al servicio del sistema operativo.

ISA

1. ¿Qué son los sufijos y para qué se los utiliza? Dé un ejemplo.

2. ¿Para qué se utiliza el sufijo ‘s’? Dé un ejemplo.

3. ¿Qué utilidad tiene la implementación de instrucciones de aritmética saturada? Dé un ejemplo con operaciones con datos de 8 bits.

4. Describa brevemente la interfaz entre assembler y C ¿Cómo se reciben los argumentos de las funciones? ¿Cómo se devuelve el resultado? ¿Qué registros deben guardarse en la pila antes de ser modificados?

5. ¿Qué es una instrucción SIMD? ¿En qué se aplican y que ventajas reporta su uso? Dé un ejemplo.

La idea fundamental detrás de la instrucción SIMD es que con una instrucción se puede realizar al mismo tiempo el trabajo que normalmente ser realizaría con múltiples.

SIMD es un acrónimo para Single Instruction Multiple Data. Tal como lo indica su nombre, ejecuta la misma instrucción con múltiples datos al mismo tiempo. Esta capacidad hace a SIMD muy popular en el campo de procesamiento multimedia ya que provee mejoras significativas en la performance.

Un ejemplo de aplicación de instrucciones SIMD es el procesamiento de imágenes, ya que los componentes RGB de cada *pixel* pueden ser representados con estructuras de 8 *bits* y procesados en paralelo.