# FELIPE GIUNTE YOSHIDA MARIANA RAMOS FRANCO VINICIUS TOSTA RIBEIRO

# MICROKERNEL PARA A PLACA ARM EVALUATOR-7T

# FELIPE GIUNTE YOSHIDA MARIANA RAMOS FRANCO VINICIUS TOSTA RIBEIRO

# MICROKERNEL PARA A PLACA ARM EVALUATOR-7T

Monografia apresentada à Escola Politécnica da Universidade de São Paulo para a Conclusão do Curso de Engenharia da Computação.

# FELIPE GIUNTE YOSHIDA MARIANA RAMOS FRANCO VINICIUS TOSTA RIBEIRO

# MICROKERNEL PARA A PLACA ARM EVALUATOR-7T

Monografia apresentada à Escola Politécnica da Universidade de São Paulo para a Conclusão do Curso de Engenharia da Computação.

Orientador:

Prof. Dr. Jorge Kinoshita

## FICHA CATALOGRÁFICA

Yoshida, Felipe Giunte

Microkernel para a placa ARM Evaluator-7T / F.G. Yoshida, M.R. Franco, V.T. Ribeiro. – São Paulo, 2009. 115 p.

Trabalho de Formatura — Escola Politécnica da Universidade de São Paulo. Departamento de Engenharia de Computação e Sistemas Digitais.

1. Sistemas operacionais (Desenvolvimento). 2. Microprocessadores. I. Franco, Mariana Ramos II. Ribeiro, Vinicius Tosta III. Universidade de São Paulo. Escola Politécnica. Departamento de Engenharia de Computação e Sistemas Digitais. IV. t.

# **DEDICATÓRIA**

Aos meus pais, Noboru e Sonia, que me apoiaram e possibilitaram que chegasse até aqui.

Aos meus avós, por todo o suporte e carinho, essenciais para percorrer esta longa jornada.

E aos meus mestres, que me guiaram ao longo do caminho.

-Felipe Giunte Yoshida

Aos meus pais, Edson e Waldinéia, por sempre me apoiarem e me guiarem nas decisões importantes que me levaram até aqui.

E aos meus irmãos, Vinicius e Fernando, pelo carinho e amizade que nos une.

-Mariana Ramos Franco

À toda minha família, por todo seu amor e apoio incondicionais durante toda a minha vida.

E a todos os meus amigos politécnicos, que colaboraram para que toda essa jornada valesse a pena.

-Vinicius Tosta Ribeiro

# **AGRADECIMENTOS**

Ao Professor Jorge Kinoshita, pelo incentivo, orientação e disposição em todos os momentos durante o projeto.

A Escola Politécnica da Universidade de São Paulo, que nos deu a oportunidade de aprendizagem e crescimento.

Ao Departamento de Engenharia de Computação e Sistemas Digitais (PCS), pelo Curso Cooperativo de Engenharia da Computação.

### **RESUMO**

O uso de dispositivos móveis como celulares, *smartphones*, tocadores de MP3 e *video-games* portáteis é cada vez mais comum. A atual líder no segmento de processadores de baixa potência, essencial nestes tipos de aparelhos, é a empresa inglesa ARM. À fim de se modernizar o equipamento usado em aulas, ela disponibilizou à Escola Politécnica algumas placas ARM Evaluator 7-T, cujo processador, o ARM7TDMI, é usado em eletrônicos muito populares atualmente, como o Apple iPod e o Nintendo DS.

Assim, utilizando-se desse hardware mais moderno e pensando em aproximar o ensino das disciplinas de Sistemas Operacionais e do Laboratório de Microprocessadores, este projeto visa o desenvolvimento de um *microkernel* para a placa ARM Evaluator-7T, tema que engloba conhecimento de ambas as disciplinas.

O microkernel desenvolvido, chamado de KinOS, é provido de algumas funções básicas, e é apenas o primeiro passo para um projeto muito maior, de desenvolvimento de um sistema operacional totalmente feito por alunos da Escola Politécnica.

Dentre as funções básicas deste *microkernel*, podemos citar o chaveamento de *threads*, algumas chamadas de sistema (fork, exec e exit), funções para manipulação de periféricos e comunicação através de um terminal.

## **ABSTRACT**

Mobile devices such as smartphones, MP3 players and portable video-games are becoming ubiquitous. Low power processors are essential in this market, where the English company ARM is the leader. In order to upgrade the equipment being used in the classes, ARM provided a set of ARM Evaluator 7-T boards to the Escola Politécnica. It has the ARM7TDMI processor, which is used in popular devices such as the Apple iPod and the Nintendo DS.

Using this updated hardware and willing to unite the Operating Systems and Microprocessors Laboratory courses, this project aims the development of a microkernel for the ARM Evaluator 7-T board, which would encompass both courses.

The microkernel, named KinOS, has some basic functions. It is the first step towards a bigger project, the development of a operating system totally created by the Escola Politécnica students.

The functions encompassed by this microkernel include the thread switching, some system calls (fork, exec and exit), functions for peripheral manipulation, and shell communication.

# LISTA DE FIGURAS

| 2.1 | Pipeline de 3 estágios (ARM LIMITED, 2001b)                          | 22 |
|-----|----------------------------------------------------------------------|----|
| 2.2 | Pipeline do ARM7TDMI (RYZHYK, 2006)                                  | 23 |
| 2.3 | Organização dos registradores no modo ARM (ARM LIMITED, 2001b)       | 26 |
| 2.4 | Formato dos registradores de estado CPSR e SPSR (ARM LIMITED, 2001b) | 28 |
| 2.5 | Esquema de uma interrupção no ARM7TDMI (ZAITSEFF, 2003)              | 32 |
| 2.6 | Passagem de argumentos (SLOSS; SYMES; WRIGHT, 2004)                  | 36 |
| 2.7 | Arquitetura da placa Evaluator-7T. (ARM LIMITED, 2000)               | 37 |
| 2.8 | Editor de linha de comando do BSL via HyperTerminal                  | 39 |
| 3.1 | Estrutura de arquivos.                                               | 45 |
| 3.2 | Estrutura de dados do PCB. Fonte: (SLOSS, 2001)                      | 47 |
| 3.3 | Vetor de threads.                                                    | 48 |
| 3.4 | Estrutura da memória. Fonte: (SLOSS, 2001)                           | 49 |
| 3.5 | Fluxograma de inicialização.                                         | 51 |
| 3.6 | Encadeamento de interrupções. Fonte: (SLOSS, 2001)                   | 55 |
| 3.7 | Chaveamento de threads                                               | 56 |
| 3.8 | Fluxo de funcionamento do fork.                                      | 63 |
| 3.9 | Comunicação da Evaluator-7T em cada porta serial                     | 67 |

# LISTA DE TABELAS

| 2.1 | Modos de operação (ARM LIMITED, 2005)                                  | 25 |
|-----|------------------------------------------------------------------------|----|
| 2.2 | Valores para o bit de modo (ARM LIMITED, 2005)                         | 30 |
| 2.3 | Vetor de interrupção (ARM LIMITED, 2005)                               | 31 |
| 2.4 | Ordem de prioridade das interrupções (ARM LIMITED, 2001b)              | 31 |
| 2.5 | Mapa da memória flash                                                  | 38 |
| 3.1 | Registradores mapeados em memória da UARTO (SAMSUNG ELECTRONICS, 2007) | 68 |
| 3.2 | Registradores mapeados em memória da UARTO (SAMSUNG ELECTRONICS, 2007) | 68 |

# LISTA DE ABREVIATURAS

**ADS** ARM Developer Suite

ALU Arithmetic Logic Unit

**ARM** Advanced RISC Machine

**CISC** Complex Instruction Set Computer

CPSR Current Program Status Register

**FIQ** Fast Interrupt

**IDE** Integrated Development Environment

IRQ Interrupt Request

LR Link Register

**PC** Program Counter

PSR Program Status Register

**RISC** Reduced Instruction Set Computer

**SP** Stack Pointer

SPRS Saved Program Register

**SWI** Software Interruption

**USP** Universidade de São Paulo

# LISTA DE SÍMBOLOS

RX - registrador número  $\mathsf{X}$ 

 $RX\_Y$  - registrador número X do modo de operação Y

# SUMÁRIO

| 1 | Intr | odução   |                                 | 17 |
|---|------|----------|---------------------------------|----|
|   | 1.1  | Objeti   | vo                              | 17 |
|   | 1.2  | Motiva   | ação                            | 17 |
|   | 1.3  | Justific | cativa                          | 18 |
|   | 1.4  | Metod    | ologia de Trabalho              | 18 |
|   | 1.5  | Organ    | ização do Documento             | 19 |
| 2 | Con  | ceitos   | e Tecnologias Envolvidas        | 21 |
|   | 2.1  | O Pro    | cessador ARM7TDMI               | 21 |
|   |      | 2.1.1    | Arquitetura RISC                | 21 |
|   |      | 2.1.2    | Pipeline                        | 22 |
|   |      | 2.1.3    | Estados de Operação             | 24 |
|   |      | 2.1.4    | Modos de Operação               | 24 |
|   |      | 2.1.5    | Registradores                   | 25 |
|   |      | 2.1.6    | Registradores de Estado         | 27 |
|   |      | 2.1.7    | Interrupções                    | 30 |
|   |      | 2.1.8    | Programando em C pra o ARM7TDMI | 35 |
|   | 2.2  | A Plac   | a Experimental Evaluator-7T     | 36 |
|   |      | 2.2.1    | Bootstrap Loader                | 38 |
|   |      | 2.2.2    | Angel Debug Monitor             | 41 |
|   | 2.3  | O amb    | piente de desenvolvimento       | 42 |
|   |      | 2.3.1    | CodeWarrior                     | 42 |

|   |     | 2.3.2    | AXD Debugger                                      | 43 |
|---|-----|----------|---------------------------------------------------|----|
| 3 | 0 S | istema   | Operacional KinOS                                 | 44 |
|   | 3.1 | Organ    | ização do código                                  | 44 |
|   |     | 3.1.1    | Raiz                                              | 44 |
|   |     | 3.1.2    | Pasta "apps"                                      | 45 |
|   |     | 3.1.3    | Pasta "interrupt"                                 | 46 |
|   |     | 3.1.4    | Pasta "peripherals"                               | 46 |
|   |     | 3.1.5    | Pasta "syscalls"                                  | 46 |
|   |     | 3.1.6    | Pasta "mutex"                                     | 46 |
|   | 3.2 | Estrut   | uras de dados                                     | 46 |
|   |     | 3.2.1    | Process Control Block                             | 47 |
|   |     | 3.2.2    | Vetor de threads                                  | 48 |
|   | 3.3 | Config   | uração de <i>hardware</i> e <i>software</i>       | 48 |
|   |     | 3.3.1    | Memória                                           | 48 |
|   |     | 3.3.2    | Modos do processador                              | 49 |
|   |     | 3.3.3    | Modos de teste                                    | 50 |
|   |     | 3.3.4    | Angel                                             | 50 |
|   | 3.4 | Iniciali | zação                                             | 50 |
|   |     | 3.4.1    | Ponto de entrada e tipo de código                 | 51 |
|   |     | 3.4.2    | Pilhas                                            | 51 |
|   |     | 3.4.3    | Vetor de <i>threads</i> e número da <i>thread</i> | 52 |
|   |     | 3.4.4    | Periféricos                                       | 53 |
|   |     | 3.4.5    | Instalação do tratamento de interrupção           | 53 |
|   |     | 3.4.6    | Interrupção de <i>timer</i>                       | 55 |
|   |     | 3.4.7    | Habilitando interrupções                          | 55 |
|   | 35  | Chave    | amento de <i>threads</i>                          | 55 |

|    |        | 3.5.1    | Identificação da Interrupção           | 50 |
|----|--------|----------|----------------------------------------|----|
|    |        | 3.5.2    | Limpeza da interrupção de <i>timer</i> | 57 |
|    |        | 3.5.3    | Identificação da próxima thread        | 57 |
|    |        | 3.5.4    | Localização dos PCBs                   | 58 |
|    |        | 3.5.5    | A troca de threads                     | 59 |
|    |        | 3.5.6    | Retorno à execução da nova rotina      | 60 |
|    | 3.6    | Chama    | adas de sistema                        | 61 |
|    |        | 3.6.1    | Propriedades gerais                    | 61 |
|    |        | 3.6.2    | fork                                   | 62 |
|    |        | 3.6.3    | exec                                   | 65 |
|    |        | 3.6.4    | exit                                   | 66 |
|    | 3.7    | Shell    |                                        | 67 |
|    |        | 3.7.1    | Comunicação via terminal               | 67 |
|    |        | 3.7.2    | Configuração e uso da COMO             | 67 |
|    |        | 3.7.3    | Funcionalidades do Shell               | 69 |
|    | 3.8    | Mutex    |                                        | 69 |
|    | 3.9    | Proces   | sos                                    | 70 |
|    | 3.10   | Inspira  | ção                                    | 71 |
| 4  | C      | -: -I    | ~ Finale                               | 72 |
| 4  | Con    | siueraç  | ões Finais                             | 12 |
|    | 4.1    | Conclu   | ısão                                   | 72 |
|    | 4.2    | Contri   | buições                                | 72 |
|    | 4.3    | Trabal   | hos Futuros                            | 72 |
| Re | eferêr | icias B  | ibliográficas                          | 73 |
| Α  | Arc    | juivos l | Fonte                                  | 75 |
|    | A.1    | cinit.h  |                                        | 75 |
|    |        |          |                                        |    |

| A.2  | cinit.c                 |     | 75  |
|------|-------------------------|-----|-----|
| A.3  | constants.h             |     | 77  |
| A.4  | startup.s               |     | 78  |
| A.5  | apps/tasks.h            |     | 80  |
| A.6  | apps/tasks.c            |     | 80  |
| A.7  | apps/terminal.h         | -   | 82  |
| A.8  | apps/terminal.c         |     | 82  |
| A.9  | interrupt/handler_irq.s | -   | 87  |
| A.10 | interrupt/handler_swi.s | -   | 92  |
| A.11 | interrupt/irq.h         | -   | 94  |
| A.12 | interrupt/irq.c         | -   | 94  |
| A.13 | interrupt/swi.h         | -   | 95  |
| A.14 | interrupt/swi.c         |     | 96  |
| A.15 | mutex/mutex.h           |     | 96  |
| A.16 | mutex/mutex.c           |     | 97  |
| A.17 | peripherals/button.h    | •   | 97  |
| A.18 | peripherals/button.c    | •   | 97  |
| A.19 | peripherals/dips.h      | •   | 98  |
| A.20 | peripherals/dips.c      | •   | 98  |
| A.21 | peripherals/led.h       | -   | 99  |
| A.22 | peripherals/segment.h   | -   | 99  |
| A.23 | peripherals/segment.c   | -   | 99  |
| A.24 | peripherals/serial.h    | . 1 | 00  |
| A.25 | peripherals/serial.c    | . 1 | .03 |
| A.26 | peripherals/timer.h     | . 1 | .08 |
| A.27 | peripherals/timer.c     | . 1 | .09 |

| A.28 syscalls/exec.s |  |
|----------------------|--|
| A.29 syscalls/exit.s |  |
| A.30 syscalls/fork.s |  |

# 1 INTRODUÇÃO

# 1.1 Objetivo

O objetivo deste projeto de formatura é desenvolver um *microkernel* para a placa experimental ARM Evalutator-7T, constituída de um processador ARM7TDMI e de alguns periféricos simples.

O *microkernel* implementa os mecanismos básicos de um sistema operacional, como o chaveamento de *threads*, as chamadas de sistema e utiliza algumas rotinas para a comunicação com os periféricos da placa.

Além disso, foram criados alguns programas para testar e exemplificar o funcionamento do *microkernel*. Entre esses programas, um simples terminal foi desenvolvido para a interação dos usuários com o sistema.

# 1.2 Motivação

As disciplinas de Laboratório de Microprocessadores e de Sistemas Operacionais do curso de Engenharia da Computação na Escola Politécnica da USP, atualmente, estão muito distantes entre si, no entanto o conteúdo das mesmas é muito próximo.

Pensando em como aproximar essas duas disciplinas, surgiu a idéia de desenvolver uma ferramenta didática que unisse um *hardware* e sistema operacional de estudo simples, e que pudesse ser utilizada nas experiências do Laboratório de Microprocessadores.

Para criação desta ferramenta, foi escolhida a placa experimental ARM Evaluator-7T, que possui uma arquitetura ARM e um poder de processamento bastante superior aos sistemas didáticos utilizados atualmente (baseados nos processadores Intel 8051 e no Motorola 68000). Assim sendo, pretende-se atualizar o material didático da disciplina de microprocessadores, trazendo um sistema mais moderno e mais próximo da realidade atual, além de poder se relacionar com o conteúdo da disciplina de Sistemas Operacionais.

Outra motivação do projeto foi aprofundar nossos conhecimentos sobre sistemas operacionais e sobre a arquitetura dos processadores ARM, visto que este processador é, hoje em dia, largamente utilizado em sistemas embarcados e aparelhos celulares.

# 1.3 Justificativa

O objetivo inicial do projeto era portar um sistema operacional Unix já existente para a placa didática Evaluator-7T.

Inicialmente pensamos em utilizar os sistemas Android e Minix 3, mas ao estudar o *kernel* dos dois sistemas, vimos que os recursos de memória necessários para executá-los era muito maior que os 512kB disponíveis na placa. Além disso, no caso do Minix 3, teríamos que reescrever o *assembly* do *kernel* que atualmente só tem versão para i386, para *assembly* ARM, o que seria impossível com o tempo disponível para o projeto.

Assim surgiu a idéia de desenvolver um *microkernel* próprio, com as funcionalidades básicas de um sistema operacional, e que fosse de fácil entendimento; pois como mencionado anteriormente, espera-se que o material desenvolvido seja destinado a melhorar e aproximar o ensino de Sistemas Operacionais com as experiências do Laboratório de Microprocessadores.

# 1.4 Metodologia de Trabalho

Para a realização desse projeto de formatura procurou-se seguir uma metodologia de trabalho cujas etapas são descritas a seguir:

• Estudo da Arquitetura ARM e da Placa Didática Evaluator-7T:

Antes de especificar as funcionalidades que seriam desenvolvidas, um estudo aprofundado da arquitetura ARM foi realizado para compreender o funcionamento do processador para o qual o *microkernel* foi desenvolvido, o ARM7TDMI.

Além disso, foram executados alguns programas exemplo na placa didática Evaluator-7T para adquirir conhecimentos sobre o seu funcionamento e limitações.

• Montagem do Ambiente de Trabalho:

Paralelamente ao estudo descrito no item anterior, foi montado um ambiente de trabalho utilizando a IDE CodeWarrior para o desenvolvimento do código-fonte e o AXD Debugger para depurar o funcionamento do *microkernel* com ou sem a utilização da placa didática.

Um repositório de controle de versão também foi montado para estocar o material produzido durante do projeto (documentação e código-fonte) e para sincronizar o trabalho dos integrantes do grupo. Seu endereço é http://code.google.com/p/arm7linux/

#### • Especificação Funcional do Microkernel:

O *microkernel* desenvolvido foi especificado nessa etapa, onde foram levantadas as funcionalidades básicas de um sistema operacional que deveriam ser implementadas, como o chaveamento de *threads* e as chamadas de sistema.

#### • Desenvolvimento do Microkernel:

Nessa fase, foi desenvolvido o *microkernel* utilizando como base a especificação definida no item anterior.

### • Análise do Microkernel e Conclusões:

Ao final do desenvolvimento, com base nas dificuldades e soluções encontradas, foi feita uma análise e conclusão sobre o *microkernel* desenvolvido e sua possível utilização no Laboratório de Microprocessadores para exemplificar os conceitos vistos na disciplina de Sistemas Operacionais.

# 1.5 Organização do Documento

Este documento foi estruturado da seguinte maneira:

### • Capítulo 1 (Introdução):

Apresenta objetivo, motivações, justificativas e a metodologia do trabalho.

# • Capítulo 2 (Conceitos e Tecnologias Envolvidas):

Contextualiza o leitor em aspectos técnicos específicos utilizados no desenvolvimento do trabalho.

#### • Capítulo 3 (O Sistema Operacional KinOS):

Descreve como o *microkernel* foi desenvolvido, quais as suas funcionalidades e como funciona a sua integração com os periféricos da placa didática, com o terminal e com os outros programas implementados.

#### • Capítulo 4 (Considerações Finais):

Analisa os resultados obtidos em relação ao objetivo do projeto, as conclusões, as contribuições deste trabalho e indica possíveis trabalhos futuros com base neste.

# 2 CONCEITOS E TECNOLOGIAS ENVOLVIDAS

# 2.1 O Processador ARM7TDMI

O ARM7TDMI faz parte da família de processadores ARM7 32 bits conhecida por oferecer bom desempenho aliado a um baixo consumo de energia. Essas características fazem com que o ARM7TDMI seja bastante utilizado em media players, videogames e, principalmente, em sistemas embarcados e num grande número de aparelhos celulares (SLOSS; SYMES; WRIGHT, 2004).

# 2.1.1 Arquitetura RISC

Os processadores ARM, incluindo o ARM7TDMI, foram projetados com a arquitetura RISC.

RISC (Reduced Instruction Set Computer) é uma arquitetura de computadores baseada em um conjunto simples e pequeno de instruções capazes de serem executadas em um único ou poucos ciclos de relógio.

A idéia por trás da arquitetura RISC é de reduzir a complexidade das instruções executadas pelo *hardware* e deixar as tarefas mais complexas para o *software*. Como resultado, o RISC demanda mais do compilador do que os tradicionais computadores CISC (*Complex Instruction Set Computer*) que, por sua vez, dependem mais do processador já que suas instruções são mais complicadas (SLOSS; SYMES; WRIGHT, 2004).

As principais características da arquitetura RISC são:

- 1. Conjunto reduzido e simples de instruções capazes de serem executadas em único ciclo de máquina.
- 2. Uso de *pipeline*, ou seja, o processamento das instruções é quebrado em pequenas unidades que podem ser executadas em paralelo.

- 3. Presença de um conjunto de registradores.
- 4. Arquitetura *Load-Store*: o processador opera somente sobre os dados contidos nos registradores e instruções de *load/store* transferem dados entre a memória e os registradores.
- 5. Modos simples de endereçamento de memória.

# 2.1.2 Pipeline

A arquitetura de *pipeline* aumenta a velocidade do fluxo de instruções para o processador, pois permite que várias operações ocorram simultaneamente, fazendo o processador e a memória operarem continuamente (ARM LIMITED, 2001b).

O ARM7 possui uma arquitetura de *pipeline* de três estágios. Durante operação normal, o processador estará sempre ocupado em executar três instruções em diferentes estágios. Enquanto executa a primeira, decodifica a segunda e busca a terceira.



Figura 2.1: Pipeline de 3 estágios (ARM LIMITED, 2001b)

O primeiro estágio de *pipeline* lê a instrução da memória e incrementa o valor do registrador de endereços, que guarda o valor da próxima instrução a ser buscada. O próximo estágio decodifica a instrução e prepara os sinais de controle necessários para executá-la. O terceiro lê os operandos do banco de registradores, executa as operações através da ALU (*Arithmetic* 

Logic Unit), lê ou escreve na memória, se necessário, e guarda o resultado das instruções no banco de registradores.



Figura 2.2: Pipeline do ARM7TDMI (RYZHYK, 2006)

Algumas características importantes do pipeline do ARM7TDMI:

- O *Program Counter* (PC) ao invés de apontar para a instrução que esta sendo executada, aponta para a instrução que esta sendo buscada na memória.
- O processador só processa a instrução quando essa passa completamente pelo estágio de execução (execute). Ou seja, somente quando a quarta instrução é buscada (fetched).

- A execução de uma instrução de branch através da modificação do PC provoca a descarga, eliminação, de todas as outras instruções do pipeline.
- Uma instrução no estágio execute será completada mesmo se acontecer uma interrupção.
   As outras instruções no pipeline serão abandonadas e o processador começará a preencher o pipeline a partir da entrada apropriada no vetor de interrupção.

## 2.1.3 Estados de Operação

O processador ARM7TDMI possui dois estados de operação (ARM LIMITED, 2001b):

- ARM: modo normal, onde o processador executa instruções de 32 bits (cada instrução corresponde a uma palavra);
- Thumb: modo especial, onde o processador executa instruções de 16 bits que correspondem à meia palavra.

Instruções Thumbs são um conjunto de instruções de 16 bits equivalentes as instruções 32 bits ARM. A vantagem em tal esquema, é que a densidade de código aumenta, já que o espaço necessário para um mesmo número de instruções é menor. Em compensação, nem todas as instruções ARM tem um equivalente Thumb.

Neste projeto, o processador é usado no modo ARM que facilita o desenvolvimento por possuir um número maior de instruções.

# 2.1.4 Modos de Operação

Os processadores ARM possuem 7 modos de operação, como apresentado na tabela 2.1.

Mudanças no modo de operação podem ser realizadas através de programas, ou podem ser causadas por interrupções externas ou exceções (interrupções de software).

A maioria dos programas roda no modo Usuário. Quando o processador esta no modo Usuário, o programa que esta sendo executado não pode acessar alguns recursos protegidos do sistema ou mudar de modo sem ser através de uma interrupção (ARM LIMITED, 2005).

Os outros modos são conhecidos como modos privilegiados. Eles têm total acesso aos recursos do sistema e podem mudar livremente de modo de operação. Cinco desses modos são conhecidos como modos de interrupção: FIQ, IRQ, Supervisor, *Abort* e Indefinido.

| Modo                | Identificador | Descrição                                     |  |
|---------------------|---------------|-----------------------------------------------|--|
| Usuário             | usr           | Execução normal de programas.                 |  |
| FIQ(Fast Interrupt) | fiq           | Tratamento de interrupções rápidas.           |  |
| IRQ (Interrupt)     | irq           | Tratamento de interrupções comuns.            |  |
| Supervisor          | svc           | Modo protegido para o sistema operacional.    |  |
| Abort abt           |               | Usado para implementar memória virtual ou     |  |
|                     |               | manipular violações na memória.               |  |
| Sistema             | sys           | Executa rotinas privilegiadas do sistema ope- |  |
|                     |               | racional.                                     |  |
| Indefinido          | und           | Modo usado quando uma instrução desco-        |  |
|                     |               | nhecida é executada.                          |  |

**Tabela 2.1:** Modos de operação (ARM LIMITED, 2005)

Entra-se nesses modos quando uma interrupção ocorre. Cada um deles possui registradores adicionais que permitem salvar o modo Usuário quando uma interrupção ocorre.

O modo remanescente é o modo Sistema, que não é acessível por interrupção e usa os mesmos registradores disponíveis para o modo Usuário. No entanto, este é um modo privilegiado e, assim, não possui as restrições do modo Usuário. Este modo destina-se as operações que necessitam de acesso aos recursos do sistema, mas querem evitar o uso adicional dos registradores associados aos modos de interrupção.

# 2.1.5 Registradores

O processador ARM7TDMI tem um total de 37 registradores:

- 31 registradores de 32 bits de uso geral
- 6 registradores de estado

Esses registradores não são todos acessíveis ao mesmo tempo. O modo de operação do processador determina quais registradores são disponíveis ao programador (ARM LIMITED, 2001b).

### 2.1.5.1 Modo Usuário e Sistema

O conjunto de registradores para o modo Usuário (o mesmo usado no modo Sistema) contém 16 registradores diretamente acessíveis, R0 à R15. Um registrador adicional, o CPSR (*Current Program Status Register*), contém os bits de *flag* e de modo.

Os registradores R13 à R15 possuem as seguintes funções especiais (SLOSS; SYMES; WRIGHT, 2004):

- R13: usado como ponteiro de pilha, Stack Pointer (SP)
- R14: é chamado de *Link Register* (LR) e é onde se coloca o endereço de retorno sempre que uma sub-rotina é chamada.
- R15: corresponde ao *Program Counter* (PC) e contém o endereço da próxima instrução à ser executada pelo processador.

#### 2.1.5.2 Modos privilegiados

Além dos registradores acessíveis ao programador, o ARM coloca à disposição mais alguns registradores nos modos privilegiados. Esses registradores são mapeados aos registradores acessíveis ao programador no modo Usuário e permitem que estes sejam salvos a cada interrupção.



Figura 2.3: Organização dos registradores no modo ARM (ARM LIMITED, 2001b)

Como se pode verificar na figura 2.3, cada modo tem o seu próprio R13 e R14. Isso permite que cada modo mantenha seu próprio ponteiro de pilha (SP) e endereço de retorno (LR) (ZAITSEFF, 2003).

Além desses dois registradores, o modo FIQ possui mais cinco registradores especiais: R8\_fiq-R12\_fiq. Isso significa que quando o processador muda para o modo FIQ, o programa não precisa salvar os registradores de R8 à R12.

Esses registradores especiais mapeiam de um pra um os registradores do modo Usuário. Se ocorrer uma mudança de modo do processador, um registrador particular do novo modo irá substituir o registrador existente.

Por exemplo, quando o processador esta no modo IRQ, as instruções executadas continuarão a acessar os registradores R13 e R14. No entanto, esses serão os registradores especiais R13\_irq e R14\_irq. Os registradores do modo usuário (R13\_usr e R14\_usr) não serão afetados pelas instruções referenciando esses registradores. O programa continua tendo acesso normal aos outros registradores de R0 à R12 (SLOSS; SYMES; WRIGHT, 2004).

# 2.1.6 Registradores de Estado

O Current Program Status Register (CPRS) é acessível em todos os modos do processador. Ele contém as flags de condição, os bits para desabilitar as interrupções, o modo atual do processador, e outras informações de estado e controle. Cada modo de interrupção possui também um Saved Program Register (SPRS), que é usado para preservar o valor do CPSR quando a interrupção associada acontece (ARM LIMITED, 2005).

Assim, os registradores de estado (ARM LIMITED, 2001b):

- Guardam informação sobre a operação mais recente executada pela ALU.
- Controlam o ativar e desativar de interrupções.
- Determinam o modo de operação do processador.

Como mostrado na figura 2.4 o CPSR é dividido em 3 campos: *flag*, reservado (não utilizado) e controle.

O campo de controle guarda os bits de modo, estado e de interrupção, enquanto o campo flag armazena os bits de condição.



Figura 2.4: Formato dos registradores de estado CPSR e SPSR (ARM LIMITED, 2001b)

#### 2.1.6.1 Flags de Condição

Os bits N, Z, C e V são *flags* de condição, e é possível alterá-los através do resultado de operações lógicas ou aritméticas (ARM LIMITED, 2005).

Os flags de condição são normalmente modificados por:

- Uma instrução de comparação (CMN, CMP, TEQ, TST).
- Alguma outra instrução aritmética, lógica ou move, onde o registrador de destino não é
  o R15 (PC).

Nesses dois casos, as novas *flags* de condição (depois de a instrução ter sido executada) normalmente significam:

- N: Indica se o resultado da instrução é um número positivo (N=0) ou negativo (N=1).
- Z: Contém 1 se o resultado da instrução é zero (isso normalmente indica um resultado de igualdade para uma comparação), e 0 se o contrário.
- C: Pode possuir significados diferentes:
  - Para uma adição, C contém 1 se a adição produz "vai-um" (carry), e 0 caso contrário.
  - Para uma subtração, C contém 0 se a subtração produz "vem-um" (borrow), e 1 caso contrário.

- Para as instruções que incorporam deslocamento, C contém o último bit deslocado para fora pelo deslocador.
- Para outras instruções, C normalmente não é usado.
- V: Possui dois significados:
  - Para adição ou subtração, V contém 1 caso tenha ocorrido um overflow considerando os operandos e o resultado em complemento de dois.
  - Para outras instruções, V normalmente não é usado.

#### 2.1.6.2 Bits de Controle

Os oito primeiros bits de um PSR (*Program Status Register*) são conhecidos como bits de controle (ARM LIMITED, 2005). Eles são:

- Bits de desativação de interrupção
- Bit T
- Bits de modo

Os bits de controle mudam quando uma interrupção acontece. Quando o processador esta operando em um modo privilegiado, programas podem manipular esses bits.

#### Bits de desativação de interrupção

Os bits I e F são bits de desativação de interrupção:

- Quando o bit I é ativado, as interrupções IRQ são desativadas.
- Quando o bit F é ativado, as interrupções FIQ são desativadas.

#### Bit T

O bit T reflete o modo de operação:

- Quando o bit T é ativado, o processador é executado em estado Thumb.
- Quando o bit T é desativado, o processador é executado em estado ARM.

#### Bits de modo

Os bits M[4:0] determinam o modo de operação. Nem todas as combinações dos bits de modo definem um modo válido, portando deve-se tomar cuidado para usar somente as combinações mostradas na tabela 2.2.

| Bit de modo | Modo de operação | Registradores acessíveis                 |
|-------------|------------------|------------------------------------------|
| 10000       | Usuário(usr)     | PC,R14-R0,CPSR                           |
| 10001       | FIQ(fiq)         | PC,R14_fiq-R8_fiq,R7-R0,CPSR,SPSR_fiq    |
| 10010       | IRQ(irq)         | PC,R14_irq, R13_irq,R12-R0,CPSR,SPSR_irq |
| 10011       | Supervisor(svc)  | PC,R14_svc, R13_irq,R12-R0,CPSR,SPSR_svc |
| 10111       | Abort(abt)       | PC,R14_abt, R13_irq,R12-R0,CPSR,SPSR_abt |
| 11011       | Indefinido(und)  | PC,R14_und, R13_irq,R12-R0,CPSR,SPSR_und |
| 11111       | Sistema(sys)     | PC,R14-R0,CPRS                           |

Tabela 2.2: Valores para o bit de modo (ARM LIMITED, 2005)

# 2.1.7 Interrupções

Interrupções surgem sempre que o fluxo normal de um programa deve ser interrompido temporariamente, por exemplo, para servir uma interrupção vinda de um periférico ou a tentativa de executar uma instrução desconhecida. Antes de tentar lidar com uma interrupção, o ARM7TDMI preserva o estado atual de forma que o programa original possa ser retomado quando a rotina de interrupção tiver acabado (ARM LIMITED, 2001b).

A arquitetura ARM suporta 7 tipos de interrupções. A tabela 2.3 lista os tipos de interrupção e o modo do processador usado para lidar com cada tipo. Quando uma interrupção acontece, a execução é forçada para um endereço fixo de memória correspondente ao tipo de interrupção. Esses endereços fixos são chamados de vetores de interrupção (ARM LIMITED, 2005).

Deve-se notar olhando para a tabela 2.3, que existe espaço suficiente para apenas uma instrução entre cada vetor de interrupção (4 bytes). Estes são inicializados com instruções de desvio (*branch*).

#### 2.1.7.1 Prioridade das Interrupções

Quando várias interrupções acontecem ao mesmo tempo, uma prioridade fixa do sistema determina a ordem na qual elas serão manipuladas. Essa prioridade é listada na tabela 2.4:

| Tipo de interrupção           | Modo de operação | Endereço   |
|-------------------------------|------------------|------------|
| Reset                         | Supervisor       | 0x00000000 |
| Instrução indefinida          | Indefinido       | 0×00000004 |
| Interrupção de Software (swi) | Supervisor       | 0x00000008 |
| Prefetch abort                | Abort            | 0x000000C  |
| Data abort                    | Abort            | 0×0000010  |
| Interrupção normal(IRQ)       | IRQ              | 0×0000018  |
| Interrupção rápida(FIQ)       | FIQ              | 0×000001C  |

Tabela 2.3: Vetor de interrupção (ARM LIMITED, 2005)

| Prioridade | Interrupção                                          |
|------------|------------------------------------------------------|
| alta       | Reset                                                |
|            | Data abort                                           |
|            | FIQ                                                  |
|            | IRQ                                                  |
|            | Prefetch abort                                       |
| baixa      | Instrução indefinida e interrupção de software (SWI) |

Tabela 2.4: Ordem de prioridade das interrupções (ARM LIMITED, 2001b)

### 2.1.7.2 Entrada de interrupção

Executar uma interrupção necessita que o processador preserve o estado atual. Em geral, o conteúdo de todos os registradores (especialmente PC e CPSR) devem ser o mesmo depois de uma interrupção.

O processador ARM usa os registradores adicionais de cada modo para ajudar a salvar o estado do processador. Quando uma interrupção acontece, o R14 e o SPSR são usados para guardar o estado atual da seguinte maneira (ARM LIMITED, 2001b):

- Preserva o endereço da próxima instrução (PC+4 ou PC+8, depende da interrupção) no apropriado LR (R14). Isso permite ao programa continuar do lugar de onde parou no retorno da interrupção.
- 2. Copia o CPSR para o apropriado SPSR.
- 3. Força os bits de modo do CPSR para um valor que corresponde ao tipo de interrupção.
- 4. Força o PC buscar a próxima instrução no vetor de interrupção.

O processador ARM7TDMI também pode ativar a *flag* de interrupção para desabilitar próximas interrupções.



Figura 2.5: Esquema de uma interrupção no ARM7TDMI (ZAITSEFF, 2003)

#### 2.1.7.3 Saída de interrupção

Quando uma interrupção é completada deve-se (ARM LIMITED, 2001b):

- 1. Mover o LR (R14), menos um *offset*, para o PC. O offset varia de acordo com o tipo de interrupção mostrada na figura anterior.
- 2. Copiar o SPSR de volta para o CPSR.
- 3. Desativa as flags de interrupção que foram ativadas na entrada.

## 2.1.7.4 Interrupções de software

Uma interrupção de software é uma interrupção inicializada inteiramente por um programa para entrar no modo Supervisor e assim poder utilizar alguma rotina particular, como operações de entrada e saída do sistema (ZAITSEFF, 2003).

Quando uma interrupção de software é executada, as seguintes ações são realizadas (ARM LIMITED, 2005):

1. Copia o endereço da próxima instrução no registrador LR\_svc (R14\_svc).

```
R14_svc = endereço da próxima instrução
```

2. Copia o CPSR no SPSR\_svc.

```
SPSR\_svc = CPSR
```

3. Ativa os bits de modo do CPSR com o valor correspondente ao modo Supervisor.

```
CPSR[4:0] = 0b10011 /* modo Supervisor */
```

4. Reforça o estado ARM colocando o bit T do CPSR à zero.

```
CPSR[5] = 0 /* estado ARM */
```

5. Desabilita as interrupções normais ativando o bit I do CPSR. Interrupções FIQ não são desabilitadas e podem continuar ocorrendo.

```
\mathsf{CPSR}[7] = 1 \ / * \ \mathsf{desabilita} \ \mathsf{interrup}ções normais */
```

6. Carrega o endereço do vetor de interrupções, 0x00000008, no PC.

```
PC = 0 \times 00000008
```

Para retornar da operação de interrupção, é usada a seguinte instrução para restaurar o PC (a partir do R14\_svc) e o CPSR (a partir do SPSR\_svc):

```
MOVS PC, LR
```

## 2.1.7.5 Interrupções de hardware

Interrupções de hardware são mecanismos que permitem que um sinal externo (pedido de interrupção) interrompa a execução normal do programa corrente e desvie a execução para um bloco de código chamado de rotina de interrupção (KINOSHITA, 2007).

Interrupções são úteis, pois permitem que o processador manuseie periféricos de uma maneira mais eficiente. Sem elas, o processador teria que verificar periodicamente a entrada/saída de um dispositivo para ver se esse necessita de tratamento. Com elas, por outro lado, a entrada/saída do dispositivo pode indicar diretamente a ocorrência de um dado evento externo, que será tratado com maior facilidade e rapidez, de modo que o microprocessador não necessite consumir tempo de processamento para pesquisar a ocorrência de eventos externos.

O processador ARM fornece dois sinais que são usados pelos periféricos para pedir uma interrupção: o sinal de interrupção nIRQ e o sinal de interrupção rápida nFIQ. Ambos são ativados em nível baixo, ou seja, colocando o sinal em nível baixo gera-se a interrupção correspondente, se a interrupção não tiver sido desabilitada no CPSR (ZAITSEFF, 2003).

Quando uma interrupção de *hardware* IRQ (ou FIQ) é detectada, as seguintes ações são realizadas (ARM LIMITED, 2005):

 Copia o endereço da próxima instrução a ser executada + 4 no registrador LR\_irq (R14\_irq). Isso significa que o LR\_irq irá apontar para a segunda instrução a partir do ponto de pedido da interrupção.

```
R14_irq = endereço da próxima instrução + 4
```

2. Copia o CPSR no SPSR\_irq.

```
SPSR_irq = CPSR
```

3. Coloca os bits de modo do CPSR para o valor correspondente ao modo IRQ.

```
CPSR[4:0] = 0b10010 /* modo IRQ */
```

4. Reforça o estado ARM colocando o bit T do CPSR a zero.

```
CPSR[5] = 0 /* estado ARM */
```

 Desabilita as interrupções normais ativando o bit I do CPSR. Interrupções FIQ não são desabilitadas e podem continuar ocorrendo.

```
\mathsf{CPSR}	extstyle{[7]} = 1 \ / * \ \mathsf{desabilita} interrupções normais */
```

6. Carrega o endereço do vetor de interrupções, 0x00000008, no PC.

```
PC = 0 \times 00000018
```

Assim que a rotina de interrupção é terminada, o processador retorna ao que estava fazendo antes através das seguintes ações:

- 1. Move o conteúdo do registrador LR\_irq menos 4 para o PC.
- 2. Copia SPSR\_irq de volta para CPSR.

A seguinte instrução executa os passos mostrados acima:

SUBS PC, R14,#4

Note que a instrução é SUBS, e não SUB: a instrução SUBS copia automaticamente SPSR no CPSR, mas apenas quando o registrador de destino é o PC (R15) e a instrução é executada em um modo privilegiado.

O processamento das Fast Interrupt (FIQ) é praticamente igual ao de uma interrupção normal (IRQ). As diferenças são que um conjunto diferente de registradores é usado (i.e. R14\_fiq no lugar de R14\_irq), que tanto as interrupções IRQ quanto as FIQ são desativadas (ou seja, os bits I e F do CPSR são ativados), e que o endereço do vetor de interrupção é 0x000001C (ZAITSEFF, 2003).

# 2.1.8 Programando em C pra o ARM7TDMI

Neste item são apresentados alguns pontos importantes a serem considerados quando se esta programando em C para o processador ARM7.

#### 2.1.8.1 Alocação de Registradores

O compilador tenta alocar um registrador do processador para cada variável local que encontra em uma função C. Ele tenta usar o mesmo registrador para diferentes variáveis locais se a utilização das variáveis não se sobrepõem. Quando há mais variáveis locais que registradores disponíveis, o compilador armazena as variáveis em excesso na pilha do processador (SLOSS; SYMES; WRIGHT, 2004).

#### 2.1.8.2 Chamadas de Função

A ARM Procedure Call Standard (APCS) define como passar argumentos de função e obter valores de retorno.

Os primeiros quatro argumentos inteiros são passadas nos quatro primeiros registradores ARM: R0, R1, R2 e R3. Argumentos inteiros posteriores são colocados na pilha, como na figura 2.6. Se o valor de retorno for inteiro, este é obtido através do registrador R0 (SLOSS; SYMES; WRIGHT, 2004).

Esta descrição abrange apenas os argumentos de tipo inteiro ou ponteiro. Argumentos que ocupam o espaço de duas palavras, como *long long* e *double*, são passados em um par de

registradores consecutivos e retornam em R0, R1.

| •••     | •••        |
|---------|------------|
| sp + 16 | Argument 8 |
| sp + 12 | Argument 7 |
| sp + 8  | Argument 6 |
| sp + 4  | Argument 5 |
| sp      | Argument 4 |



Figura 2.6: Passagem de argumentos (SLOSS; SYMES; WRIGHT, 2004)

# 2.2 A Placa Experimental Evaluator-7T

O principal elemento de hardware deste projeto é a placa experimental ARM Evaluator-7T, baseada no processador ARM7TDMI, um processador RISC de 32 bits capaz de executar o conjunto de instruções denominado Thumb.

Os principais elementos presentes na arquitetura da placa Evaluator-7T são os seguintes:

- Microcontrolador Samsung KS32C50100
- 512kB EPROM flash
- 512kB RAM estática (SRAM)
- Dois conectores RS232 de 9 pinos tipo D
- Botões de reset e de interrupção

- Quatro LEDs programáveis pelo usuário e um display de 7 segmentos
- Entrada de usuário por um interruptor DIP com 4 elementos
- Conector Multi-ICE
- Clock de 10MHz (o processador usa-o para gerar um clock de 50MHz)
- Regulador de tensão de 3.3V

A figura 2.7 mostra a organização desses elementos na placa experimental.



Figura 2.7: Arquitetura da placa Evaluator-7T. (ARM LIMITED, 2000)

Com relação à memória flash da placa, ela vem de fábrica com o bootstrap loader da placa e programa monitor de debug. O restante dela pode ser usado para os programas de usuário. A tabela 2.5 mostra a faixa de endereços de cada região da memória.

Já em relação às duas portas seriais presentes na placa, cada uma tem usos específicos. A primeira, chamada DEBUG, é usada pelo monitor de debug ou pelo programa bootstrap presente na placa. Ela está conectada ao UART1 do microcontrolador. A segunda, chamada

Tabela 2.5: Mapa da memória flash

| Faixa de endereço       | Descrição                                |
|-------------------------|------------------------------------------|
| 0x01800000 a 0x01806FFF | Bootstrap loader                         |
| 0x01807000 a 0x01807FFF | Teste de produção                        |
| 0x01808000 a 0x0180FFFF | Reservado                                |
| 0x01810000 a 0x0181FFFF | Angel                                    |
| 0x01820000 a 0x0187FFFF | Disponível para outros programas e dados |

USER, é de uso genérico e está disponível para uso em programas. Ela está conectada ao UARTO do microcontrolador.

### 2.2.1 Bootstrap Loader

Como mencionado anteriormente, a memória flash da placa contém uma região reservada para os programas Bootstrap Loader (BSL) e o programa monitor de debug chamado Angel.

O BSL é o primeiro programa a ser executado pelo microcontrolador quando esta é ligada ou reiniciada. Suas principais funções são:

- Fazer a conexão com o computador através da porta serial e uma aplicação de terminal, como o HyperTerminal do Windows
- Prover a infraestrutura necessária à configuração da placa
- Prover ajuda ao usuário
- Gerenciar imagens de memória como um conjunto de módulos executáveis
- Carregar aplicações na SRAM e executá-las

#### 2.2.1.1 Comunicação com o PC

Neste projeto, foi usado um PC com o sistema operacional Windows XP para fazer a comunicação com o BSL da placa Evaluator-7T. Essa comunicação é feita através de um cabo serial conectado à porta COM1 (Debug) da placa. Estando a placa conectada à porta serial e energizada com uma fonte de alimentação própria, pode-se estabelecer a comunicação com o BSL por meio do programa HyperTerminal. As configurações de comunicação utilizadas foram:

• Velocidade de transferência de 9600 bauds

- 8 bits de dados
- Sem paridade
- 1 bit de parada
- Sem controle de fluxo

Após a configuração adequada da placa, é preciso reiniciá-la, pressionando o botão SW1 (SYS RESET). Então, a placa envia a seguinte mensagem ao terminal:

```
ARM Evaluator7T Boot Strap Loader Release 1.01
Press ENTER within 2 seconds to stop autoboot
```

Pressionando a tecla *Enter* em até dois segundos da exibição da mensagem acima, nenhum outro módulo da memória é executado, além do BSL. Desse momento em diante, o BSL exibe seu editor de linha de comando, a partir do qual é possível gerenciar, embarcar e executar programas na placa. A figura 2.8 mostra o HyperTerminal com o BSL carregado e aguardando um comando.



Figura 2.8: Editor de linha de comando do BSL via HyperTerminal

#### 2.2.1.2 Carregando e executando programas via BSL

Após a compilação de um projeto, o ambiente de desenvolvimento cria uma imagem de memória em formato binário (extensão .bin). Essa imagem, no entanto, não pode ser carregada

diretamente na placa através do BSL. Ela deve ser convertida para o formato UUE (Unix-to-Unix Encoding), o qual é uma representação em arquivo texto do arquivo binário original. Neste projeto, foi utilizado para essa conversão o programa *uuencode* fornecido no CD-ROM que acompanha a placa Evaluator-7T.

Uma vez convertido o arquivo para o formato adequado, ele está pronto para ser enviado à Evaluator-7T. Para isso, pode-se usar dois diferentes comandos do BSL: *Download* ou *FlashLoad*.

O comando *Download* carrega uma imagem na memória RAM da placa. A sintaxe desse comando é:

```
download [<endereço>]
```

O parâmetro < endereço>, que é um número em base hexadecimal, indica em qual endereço da RAM a imagem será carregada. Se esse endereço não for especificado, a imagem é carregada na posição 0x8000.

Assim que o comando é executado, o BSL espera a transferência de um arquivo texto com a imagem de memória desejada. No HyperTerminal, isso é feito pelo comando "Enviar arquivo texto" e apontando para o arquivo desejado, no formato UUE. Terminada a transferência, o BSL informa quantos bytes foram recebidos e a posição de memória a partir da qual eles foram gravados.

Já o comando *FlashLoad* carrega uma imagem na placa e a salva diretamente na memória flash da mesma. Sua sintaxe é a seguinte:

```
flashload <endereco>
```

Neste comando, o parâmetro < endereço > é obrigatório, também é um número em base hexadecimal e especifica o endereço da memória flash no qual a imagem será gravada. O envio do arquivo é feito da mesma maneira que o comando *Download*. Como não há restrições quanto ao valor que o usuário pode inserir nesse comando, cabe a ele mesmo tomar cuidado para não escrever dentro da faixa de endereços de 0x01800000 a 0x0180FFFF, uma vez que é nessa área da flash que estão os módulos BSL e de teste de produção.

O comando *FlashLoad* não é o único que manipula a memória flash da placa no BSL. Existem também os comandos *FlashWrite* e *FlashErase*. O primeiro escreve na memória flash uma determinada área da RAM, enquanto que o segundo sobrescreve uma uma faixa de endereços da flash com 0xFF. As sintaxes desses comandos são:

```
flashwrite <endereço > <fonte > <comprimento >
```

```
flasherase <endereço> <comprimento>
```

Mais uma vez, é preciso exercer cautela durante a utilização desses comandos para não comprometer a área de memória onde se encontram os módulos BSL e de teste de produção.

Carregada a imagem na memória RAM ou na memória flash, ela está pronta para execução. Para executá-la, deve-se, primeiramente, verificar se o Program Counter (PC) do BSL está apontando para a posição de memória onde foi gravada a imagem. Isso é feito através do comando *PC*, cuja sintaxe está abaixo.

```
pc [<endereço>]
```

Esse comando permite verificar a posição a partir da qual o BSL iniciará a execução, se o parâmetro <*endereço*> não for especificado. Quando esse comando é feito com um argumento, o valor do PC é alterado para o valor do argumento inserido. Por exemplo, *pc 10000* coloca o PC na posição de memória 0x10000. Quando os comandos *Download* e *FlashLoad* são executados, o PC é atualizado automaticamente para o valor inserido no parâmetro <*endereço*> desses comandos.

O próximo passo para a execução da imagem pode ser feito com dois comandos diferentes: Go ou GoS. Ambos iniciam a execução de um programa a partir da posição de memória definida no PC. Enquanto o primeiro executa o programa em Modo Usuário, o segundo o faz em Modo Supervisor (SVC). Opcionalmente, pode-se inserir argumentos de entrada do programa quando esses comandos são chamados. A sintaxe deles é:

```
go [<argumentos do programa>]
gos [<argumentos do programa>]
```

Assim, o programa começa a executar na placa. Caso seja necessário retornar ao BSL, deve-se reiniciar a placa, pressionando-se o botão SYS RESET. Qualquer imagem que tenha sido carregada apenas na RAM será perdida.

## 2.2.2 Angel Debug Monitor

O monitor de debug Angel é fornecido conjuntamente com diversas placas da ARM e suas parceiras. Suas principais funcionalidades são:

• Função de depuração de código, incluindo inspeção de memória, download e execução

de imagens de memória, uso de breakpoints e execução passo-a-passo

- Inicialização da CPU e da placa e tratamento básico de exceções
- Uma biblioteca ANSI C completa, com uso de semihosting para prover serviços do computador host que não estão disponíveis na placa

Há duas maneiras pelas quais o Angel se comunica com o ambiente de desenvolvimento de software.

A primeira é através da biblioteca de interfaces chamada "Remote\_A". Por ela, os depuradores se comunicam com um alvo do Angel quando fazem depuração ou execução de código.

A segunda é por meio de interrupções de software (SWI). O código do programa faz uma SWI para solicitar serviços dos Angel diretamente ou através da biblioteca C do toolkit.

## 2.3 O ambiente de desenvolvimento

O hardware descrito na seção 2.2 não pode realizar muitas tarefas se não houver o software adequado embarcado nele. Assim, o desenvolvimento de programas é parte fundamental do projeto. Para realizar tal tarefa, é necessária a existência de um ambiente de desenvolvimento que permita escrever, compilar, embarcar e depurar programas para a Evaluator-7T.

Neste projeto, foi utilizado o ambiente ARM Developer Suite (ADS) versão 1.2. Ele contém a IDE CodeWarrior e o debugger AXD. Ambos estão descritos em detalhes nas subseções abaixo.

#### 2.3.1 CodeWarrior

O CodeWarrior é um ambiente integrado de desenvolvimento, ou seja, é um software que provê diversas funcionalidades para facilitar o desenvolvimento de programas. Dentre as funcionalidades que ele fornece, pode-se citar:

- Editor de código-fonte em C/C++ e ARM Assembly
- Compilador C/C++ para Assembly ARM e Thumb
- Automatização da compilação e geração de imagens de memória

TODO...

# 2.3.2 AXD Debugger

Escrever sobre o debugger aqui.

## 3 O SISTEMA OPERACIONAL KINOS

O principal objetivo do projeto é auxiliar o ensino de sistemas operacionais e da arquitetura ARM nas disciplinas de Sistemas Operacionais e Laboratório de Microprocessadores. Para tal, foi desenvolvido um *microkernel*, apelidado de KinOS, cujas funções básicas são o chaveamento de *threads* através de interrupção de *timer*, as chamadas de sistema, as rotinas de manipulação de *hardware*, funções de *mutex* e um *shell*.

## 3.1 Organização do código

A estrutura de arquivos do projeto pode ser vista na figura 3.1. Pode-se dividi-lo em cinco partes:

- Raiz Arquivos de inicialização da placa
- Pasta "apps" Programas que serão executados pelo microkernel
- Pasta "interrupt" Rotinas de tratamento de interrupção
- Pasta "peripherals" Rotinas de manipulação de hardware
- Pasta "syscalls" Chamadas de sistema
- Pasta "mutex" Rotinas do mutex

A pasta KinOS\_Data não é considerada parte do projeto pois é utilizada pelo CodeWarrior para o armazenamento do código compilado.

#### 3.1.1 Raiz

Os arquivos encontrados na raiz do projeto são responsáveis pela inicialização da placa e pela declaração de constantes globais. O arquivo startup.s contém a chamada inicial do



Figura 3.1: Estrutura de arquivos.

microkernel, onde toda parte de inicialização em assembly é feita. Já o arquivo cinit.c também contém a parte de inicialização, porém, o código está escrito em C. Finalmente, o arquivo constants.h é responsável por armazenar as constantes que são utilizadas em todo o projeto.

## 3.1.2 Pasta "apps"

No arquivo tasks.c, várias funções são declaradas, onde cada declaração é considerada uma thread pelo microkernel. Mais à frente, na seção 3.9, os programas exemplo serão descritos

com mais detalhe. Já no arquivo terminal.c, há o shell do sistema.

### 3.1.3 Pasta "interrupt"

Todas as rotinas que tratam e instalam interrupções — tanto de *hardware* quanto de *software* — estão localizadas nesta pasta. O arquivo handler\_irq.s contém a rotina em *assembly* que trata das interrupções de *hardware*, as encaminha para a rotina específica de acordo com a sua fonte e faz o chaveamento de *threads*. O arquivo irq.c contém uma única rotina, que realiza a instalação da rotina de tratamento de interrupção tanto de *hardware* quanto de *software*. A rotina de tratamento de interrupção de *software* é feita no arquivo handler\_swi.s, que identifica o tipo de interrupção e encaminha para alguma das chamadas de sistema, encontradas em swi.c.

### 3.1.4 Pasta "peripherals"

As rotinas de inicialização e controle dos periféricos se encontram todas nesta pasta. As do botão estão no arquivo button, da chave DIP no arquivo dips, do display de sete segmentos em segment, dos LEDs em led e do *timer* em timer.

## 3.1.5 Pasta "syscalls"

As chamadas de sistema estão escritas em *assembly* e se encontram em três arquivos, uma para cada chamada. São elas as chamadas fork, exec e exit.

#### 3.1.6 Pasta "mutex"

No arquivo mutex há apenas as funções que permitem a exclusão mútua de código por espera ativa, feita através de um *mutex*.

### 3.2 Estruturas de dados

A fim de se facilitar a programação e o entendimento do projeto, foram criadas duas estruturas de dados que são acessadas em *assembly*. A primeira, o Process Control Block é responsável pelo armazenamento do estado de uma *thread*. Já a Lista de Threads realiza o controle de quais *threads* estão ativas.

#### 3.2.1 Process Control Block

O Process Control Block (ou simplesmente PCB) é um estrutura de dados que guarda todas as informações de uma thread que aguarda para ser executada enquanto outras estão ativas. Há um PCB para cada uma das nove threads e cada um ocupa 68 bytes. Ou seja, o espaço total ocupado pelos PCBs é de  $9 \cdot 68 = 612$  bytes. Estes 68 bytes estão estruturados como explicitado na figura 3.2. Cada posição da tabela ocupa uma palavra (4 bytes). A primeira posição é em (base do PCB - 4), a segunda em (base do PCB - 8) e assim por diante. Como pode-se observar pela figura, as posições 1 a 15 ((base do PCB - 4) a (base do PCB - 60)) armazenam o conteúdo dos registradores r0 a r14 do modo user em ordem inversa. A posição 16 (base do PCB - 64) armazena o link register do modo IRQ, ou seja, o endereço de retorno da interrupção. Finalmente, a posição 17 armazena o registrador de estado do modo user. Estes registradores armazenados permitem estabelecer um retrato preciso do estado da thread quando houve o chaveamento e permite também que este estado seja restabelecido quando for o turno desta thread voltar a ser executada. A estrutura tem seu espaço reservado no arquivo handler\_irq.s, e é nomeado com a variável process\_control\_block, que indica a base da estrutura. Cada um dos PCBs está logo a seguir do anterior. Por exemplo, a base do primeiro PCB está em (process\_control\_block - 68), do segundo em (process\_control\_block - $2 \cdot 68$ ) e assim por diante.

| Offset | Task Register |
|--------|---------------|
| -4     | r14_usr       |
| -8     | r13_usr       |
| -12    | r12_usr       |
| -16    | r11_usr       |
| -20    | r10_usr       |
| -24    | r9_usr        |
| -28    | r8_usr        |
| -32    | r7_usr        |
| -36    | r6_usr        |
| -40    | r5_usr        |
| -44    | r4_usr        |
| -48    | r3_usr        |
| -52    | r2_usr        |
| -56    | r1_usr        |
| -60    | r0_usr        |
| -64    | r14_irq       |
| -68    | SPSR          |

**Figura 3.2:** Estrutura de dados do PCB. Fonte: (SLOSS, 2001)

#### 3.2.2 Vetor de threads

O vetor de *threads* é uma lista que armazena quais das *threads* estão ativas e quais não estão, a fim de se identificar quais devem ser colocadas em execução. Cada identificador ocupa 4 bytes, e pode ter os valores 0 (inativo) ou 1 (ativo). Como há 9 *threads*, o tamanho deste vetor é de  $4 \cdot 9 = 36$  bytes. Seu espaço é reservado no arquivo handler\_irq.s, com o nome de thread\_array. No exemplo na figura 3.3 pode-se ver que as *threads* 1, 2 e 4 estão ativas, enquanto que as outras não estão.

| T1 | T2 | T3 | T4 | T5 | T6 | T7 | T8 | T9 |
|----|----|----|----|----|----|----|----|----|
| 1  | 1  | 0  | 1  | 0  | 0  | 0  | 0  | 0  |

Figura 3.3: Vetor de threads.

## 3.3 Configuração de hardware e software

Nesta seção são apresentados os modos como o *hardware* e o *software* descritos anteriormente são utilizados. Será indicado como foi feito o particionamento da memória, a utilização dos modos do processador e os modos de teste do código.

#### 3.3.1 Memória

A memória volátil da placa foi estruturada como indicado na figura 3.4. Para todo espaço das pilhas, programas, código, vetor de interrupções e área de dados, o espaço disponível é de 128KB (de 0x0 a 0x20000). Como pôde ser visto na seção 2.1.7, a memória entre 0x0 e 0x20 contém o vetor de interrupções e deve ser reservado. A pilha do modo SVC começa no endereço 0x7F80, cresce para baixo e não deve invadir a área reservada para o vetor de interrupção. Já a pilha do modo IRQ, começa no endereço 0x8000, também cresce para baixo e não deve invadir o espaço reservado para a pilha do modo SVC. O código do *kernel* e dos programas começa no endereço 0x8000, mas ao contrário da pilha do modo SVC, cresce para cima. Logo após o código, temos uma área reservada para os dados globais. Finalmente, as pilhas do modo *user* começam no endereço 0x20000 e crescem para baixo. Cada uma tem um offset relativo à anterior de 4048 bytes.



Figura 3.4: Estrutura da memória. Fonte: (SLOSS, 2001)

## 3.3.2 Modos do processador

Dentre os sete modos do processador, apenas quatro deles são utilizados: o modo de usuário (user), o modo de serviço (SVC), o modo de sistema (SYS) e o modo de interrupção (IRQ). O primeiro é o modo não privilegiado no qual as threads são executadas. O segundo, é o modo de inicialização do kernel e de execução das chamadas de sistema, que é privilegiado. Já o terceiro, é idêntico ao modo de usuário, mas com privilégios. Ele é utilizado na inicialização do sistema para definir a pilha do modo de usuário. Finalmente, o quarto é um modo que também é privilegiado, mas que é usado quando há interrupções de hardware e portanto, é usado quando há o chaveamento de threads (interrupção de timer) ou qualquer outra interrupção que não a de software. É importante ressaltar que os modos privilegiados quando chamados por interrupção desabilitam outras interrupções. Isso bloqueia interrupções aninhadas, essencial para o funcionamento do código.

#### 3.3.3 Modos de teste

Depurar o código com a placa não é possível em todas as situações. Quando o código que está sendo executado está dentro de uma região onde as interrupções estão desabilitadas, como no código de tratamento de interrupção, não se pode fazê-lo. Para contornar tal problema, foi utilizado o emulador disponível na IDE CodeWarrior, o ARMulator. Como ele foi desenvolvido para vários modelos de placa, utiliza endereços de periféricos diferentes da placa Evaluator 7-T e não têm o módulo Angel de *debug*. Para manter a compatibilidade entre o emulador e a placa nas partes onde o código se diferencia, como na inicialização do *timer*, foram colocados ambos códigos. A seleção de qual dos dois será executado depende de uma variável global emulator, que é declarada no arquivo constants.h. Caso seja 1, o código executado é o do emulador, caso seja 0, o código da placa com Angel e caso seja 2, o código para a placa sem o Angel. Uma outra vantagem do código no emulador é que ele permite com que ele possa ser testado sem a presença da placa.

### 3.3.4 Angel

O Angel é um programa contido na ROM da placa que realiza a comunicação entre a mesma e o computador que efetuou o upload do código. Além de permitir com que o código seja carregado na placa, o Angel realiza o processo de *debug* do código durante a execução. Para isso, deve haver uma comunicação constante entre a placa e o computador, que é feita através de interrupções. Uma vez que a placa é iniciada, o endereço do vetor de interrupções responsável pelas interrupções de *hardware* e se *software* apontam para um endereço préestabelecido do Angel.

Caso se queira adicionar alguma outra rotina de tratamento de interrupções, como é o caso deste projeto, deve-se encadear o Angel (como será descrito na seção 3.4.5) quando a rotina instalada não consegue tratar a interrupção. Isto é necessário para que a comunicação com a placa não seja perdida.

## 3.4 Inicialização

O início do programa se dá no arquivo statup.s. Nele, são feitas todas as operações que têm de ser em *assembly*, como a inicialização das pilhas ou a criação da tabela de *threads*. Após esta etapa, há a inicialização em C, feita no arquivo cinit.c, que inicializa periféricos, instala rotinas de tratamento e inicia a primeira *thread* em modo usuário. A rotina completa

de inicialização pode ser vista no esquema da figura 3.5.



Figura 3.5: Fluxograma de inicialização.

## 3.4.1 Ponto de entrada e tipo de código

O ponto de entrada do código é indicado pela instrução ENTRY. Por padrão, o compilador assume que o código de entrada é ARM. Como descrito no item 2.1.3, há dois tipos de assembly, o ARM e o THUMB, onde o ARM é favorecido pelo número de instruções e pela legibilidade. Neste caso, será utilizado apenas código ARM.

#### **3.4.2** Pilhas

Antes de poder utilizar as pilhas é preciso que elas sejam inicializadas em cada um dos modos que virão a ser utilizados. Neste *microkernel*, são utilizados os modos SVC, *user/system* e IRQ. O modo como isto é feito é descrito abaixo:

```
MOV r0, \#0xC0 \mid 0x12 ; r0 = 0xC0 or 0x12 (0xC0 = IRQ disabled, 0x12 = IRQ mode) 
MSR CPSR_c, r0 ; status_register = r0 
MOV sp, \#0x8000 ; stack pointer = 0x8000
```

A primeira instrução copia para r0 o que será substituído no registrador de estado. Neste exemplo, está se desabilitando as interrupções e mudando o modo do processador para o modo IRQ. Em seguida, os dados do registrador r0 são colocados no registrador de estado. Uma vez que o estado foi alterado, pode-se mudar o ponteiro de pilha, que neste caso aponta para o endereço 0x8000. Uma operação semelhante pode ser feita tanto no modo SVC quanto no modo *user*, usando os endereços de pilha indicados na figura 3.4. Porém, se o estado for alterado para o modo *user* fica impossível de se alterar o estado novamente. Para se resolver este problema, ao invés de se mudar para esse estado, muda-se para o estado de SYS. Este é o mesmo modo que o *user* (usa a mesma pilha e registradores), mas permite que o modo seja alterado novamente por ser privilegiado.

#### 3.4.3 Vetor de threads e número da thread

O outro ponto importante da inicialização do código em *assembly* é a criação do vetor de *threads*. Para tal, tem de se definir que todos as *threads* exceto a primeira são inicializadas desabilitadas. Isto é feito com o código apresentado a seguir:

```
; Initializes the thread array with zeros (0 = thread\ disabled,
  ; 1 = thread enabled)
                           ; r0 = thread_array start address
 LDR
       rO, =thread_array
 MOV
       r1, #1
                       ; r1 = 1
       r1 , [r0]
 STR
                      ; address(r0) = r1
 MOV
       r1, #0
                      ; r1 = 0 (disabled)
 MOV
       r2, #0
                       ; r2 = 0
init_thread_array_loop
 ADD
       r2, r2, #4
                       ; r2 = r2 + 4
 CMP
                      ; r2 = 36?
       r2, #36
 BEQ
       set_active_thread ; if yes, go to set_active_thread
       r3, r0, r2
                         ; r3 = r0 + r2
 ADD
 STR
        r1, [r3]
                       ; address(r3) = r1
      init_thread_array_loop; return to init_thread_array_2
```

Nele, r0 armazena a base do vetor, que coincide com o espaço relativo à primeira *thread*. r1 contém o dado que será colocado na posição de memória. Na posição 1 este valor é 1, e nos demais 0. r2 contém o offset que será somado à base para o cálculo do endereço absoluto, armazenado em r3. O algoritmo funciona inicialmente colocando 1 na base. Após isso, entra em um *loop* que aumenta o *offset* de 4 em 4 e coloca 0 em todos os outros espaços.

Ainda na inicialização em assembly, deve-se definir o número da thread que está sendo executada. Este dado é armazenado na variável current\_thread\_id. Pode-se ver abaixo como

é definido o id da primeira thread para 1:

```
LDR r0, =current_thread_id ; r0 = current thread id address MOV r1, \#1 ; r1 = 1 STR r1, [r0] ; current thread id = 1
```

Finalmente, a inicialização em C pode ser iniciada. A chamada é feita definindo como endereço de retorno a função C\_entry e colocando este mesmo endereço no *process counter*.

#### 3.4.4 Periféricos

Para alguns periférico da placa, como o display de sete segmentos, o *timer* e os botões, há uma rotina de inicialização que os habilita e define suas configurações. Suas chamadas são segment\_init(), timer\_init() e button\_init() respectivamente. Estas funções se encontram nos arquivos de cada um dos periféricos e são executadas logo no início da etapa C do processo de inicialização da placa.

## 3.4.5 Instalação do tratamento de interrupção

Como descrito anteriormente na seção 2.1.7, caso uma interrupção de *hardware* ocorra, a instrução no endereço 0x18 é executada e caso seja uma interrupção de *software*, a instrução no endereço 0x08. Toda vez que se reinicia a placa, são colocados nestes endereços uma instrução que realiza um desvio para a rotina Angel (vide seção 3.3.4).

Porém, se algum dos periféricos vai ser utilizado, a interrupção gerada por esse periférico não deve desviada para o Angel, e sim para uma rotina adequada que trate tal periférico. Para poder identificar qual a origem da interrupção e desviar para a rotina correta, deve-se instalar uma nova rotina no vetor de interrupções, substituindo o desvio para o Angel. A instalação da rotina dá-se através do desvio para a tal rotina. Todavia, não se pode apenas descartar o endereço do Angel, já que caso não se identifique a origem da interrupção, ainda deve-se desviar para ele. Este processo pode ser observado na figura 3.6. Nele, Handler2 é a rotina de tratamento de interrupções, e Handler1 é o Angel.

A instalação da rotina de tratamento de interrupção é a mesma para interrupções de hardware e de software se dá abaixo:

```
/st Angel branch instruction st/
```

```
unsigned Angel_branch_instruction;
/* Angel instruction */
unsigned *Angel_address;
/* Getting Angel branch instruction */
Angel_branch_instruction = *vector_address;
/* Separate the instruction from the address */
Angel_branch_instruction ^= 0xe59ff000;
/* Calculating absolute address */
Angel\_address = (unsigned *) ((unsigned) vector\_address +
   Angel_branch_instruction + 0x8);
/* Store address in the propoer position */
if ((unsigned)vector\_address == 0x18) {
  Angel_IRQ_Address = *Angel_address;
}
else {
  Angel_SWl_Address = *Angel_address;
/st Inserting handler instruction in the vector table st/
*Angel_address = handler_routine_address;
```

Os parâmetros de entrada desta função são handler\_routine\_address, o endereço da rotina de tratamento de interrupção e vector\_address, um ponteiro para a posição no vetor de interrupções onde será instalada a rotina. Sucintamente, o que esta rotina realiza é obter a instrução que está em vector\_address, aplica uma máscara à rotina para obter apenas o endereço e o salva em uma das variáveis: Angel\_IRQ\_Address caso se esteja instalando a rotina de interrupção de hardware ou Angel\_SWI\_Address caso seja a de software, além de colocar a nova instrução no vetor de interrupções.

Um fator importante que deve ser ressaltado a importância do Angel quando se está usando a placa. Como já descrito anteriormente, o Angel se utiliza das interrupções de *hardware* e *software* para se comunicar com a placa. Portanto, se o código for apenas modificado e a instrução que está contida no vetor de interrupção for substituída, essa comunicação não se realiza e tanto a placa quanto o programa de *debugger* travam. Para se solucionar este problema, deve-se passar para a rotina de tratamento de interrupção os endereços que estavam anteriormente no vetor de interrupção, para o caso da interrupção ser do Angel, a rotina correta ser executada. Já no caso em que o código é apenas simulado no emulador, não é preciso armazenar o endereço do Angel.



Figura 3.6: Encadeamento de interrupções. Fonte: (SLOSS, 2001)

### 3.4.6 Interrupção de timer

A interrupção de *timer* é utilizada neste projeto para realizar o chaveamento entre as *threads*. Uma vez que haja a interrupção, o estado da *thread* atual é salva e a próxima é colocada em processamento. Para utilizá-la, deve-se tanto habilitar quanto iniciar o *timer*. Essas tarefas são executadas com duas rotinas, sendo que a primeira já foi descrita no item 3.4.4. Já o início do *timer* é dado pela função timer\_start().

## 3.4.7 Habilitando interrupções

O último passo antes de se começar a executar o código do primeiro programa é habilitar simultaneamente o modo de usuário e as interrupções. Como isso só pode ser feito por código assembly, tem de se usar a instrução especial de C \_asm, conforme o exemplo abaixo

```
__asm {  MOV \quad r1 \;,\; \#0\times40 \;|\; 0\times10 \\ MSR \quad CPSR\_c \;,\; r1 \\ \}
```

O registrador r1 recebe 0x40, que indica a habilitação das interrupções e 0x10 que altera para o modo *user*. Logo em seguida, o conteúdo deste registrador é passado para o registrador de estado. Finalmente, o primeiro programa é chamado com a função shell().

## 3.5 Chaveamento de threads

O chaveamento de *threads* é realizado inteiramente com o *assembly* escrito no arquivo handler\_irq.s. Ele consiste em sete passos, indicados na figura 3.7.



Figura 3.7: Chaveamento de threads.

## 3.5.1 Identificação da interrupção

```
STMFD sp!, \{r0 - r3, lr\}
                               ; Stacking r0 to r3 and the link register
LDR
       rO, IRQStatus
                           ; r0 = irq type address
LDR
       r0, [r0]
                         ; r0 = irq type
TST
       r0, \#0 \times 0400
                           ; irq type == 0 \times 0400?
BNE
       handler_timer
                             ; If yes, go to handler_timer
TST
                           ; irq type = 0 \times 0001?
       r0, \#0 \times 0001
BNE
       handler_button
                             ; If yes, go to handler_button
LDMFD sp!, \{r0 - r3, lr\}
                              ; If it is not any of them, restore r0-r3 and
    ۱r
LDR
       pc, Angel_IRQ_Address; and branch to the Angel routine
```

Uma vez que há a interrupção de *timer*, a chamada de interrupção de *hardware* que se encontra no vetor de interrupção é executada. Durante a instalação da rotina de tratamento de interrupção de *hardware*, colocou-se nesta posição a rotina handler\_board\_angel caso se estivesse usando a placa com o Angel, a rotina handler\_board\_no\_angel caso se estivesse usando a placa sem o Angel ou a rotina handler\_emulator caso estivesse usando o emulador. A diferença é que enquanto a primeira e a segunda tentam identificar qual a fonte de interrupção, a terceira já assume que a fonte é o *timer*, já que não há outros periféricos no emulador. Devese armazenar toda informação contida nos registradores que são alterados durante o processo

de tratamento de interrupção. Para tal, empilha-se os valores dos registradores r0 a r3, usados durante a rotina de chaveamento, a fim de que nenhum dado se perca durante o processo.

No caso do uso da placa, a fonte da interrupção se encontra no endereço 0x03ff4004, identificado com a variável INTPND. Se o valor contido neste endereço é 0x0400, a fonte foi uma interrupção de *timer*, caso seja 0x0001, a fonte foi o botão da placa e caso contrário, a fonte foi o Angel. No primeiro caso, há um desvio para a rotina handler\_timer, no segundo para a rotina handler\_button e na terceira, para o endereço salvo durante a instalação de rotina de tratamento.

### 3.5.2 Limpeza da interrupção de timer

Quando é identificada a interrupção de *timer*, deve-se limpar a interrupção de *timer*, a fim de que ele possa interromper novamente no futuro. Para tal, executa-se a rotina timer\_irq, encontrada no arquivo timer.c. Como não se pode garantir que a rotina em C manterá intactos os registradores, há de se salvar todos e recuperá-los após a chamada. Abaixo pode-se observar o código que realiza o salvamento e a recuperação destes registradores.

```
STMFD sp!, \{r4-r12\} ; Stack the rest of the registers (r4-r12) BL timer_irq ; Clear timer interruption LDMFD sp!, \{r4-r12\} ; Load r4-12 registers again
```

Os registradores r0 a r3 não precisam ser salvos ou recuperados, pois no início da rotina de tratamento eles já foram empilhados para recuperação futura.

## 3.5.3 Identificação da próxima thread

O método de escolha da próxima *thread* que será posta em execução é escolhida pelo método *round-robin*, ou seja, a próxima *thread* é escolhida por ordem numérica. O código para tal tarefa é apresentado abaixo:

```
CMP
        r0, #9
                         ; r0 = 9? (it is the last thread?)
 BEQ
        last_thread
                           ; If yes, branch last_thread
        r1, r0, #1
                           ; If not, r1 = r0 + 1
 ADD
      next\_thread
                         ; and branch to next_thread
last_thread
 MOV
        r1 , \#1
                         ; r1 = 1
next_thread
 SUB
                           ; r2 = r1 - 1
        r2, r1, #1
 MOV
        r3, #4
                         : r3 = 4
```

```
MUL
      r2, r3, r2
                    ; r2 = r2 * r3
LDR
      r3, =thread_array; r3 = thread_array bottom address
ADD
      r2, r2, r3
                       ; r2 = r3 + r2
LDR
      r2 , [r2]
                     ; r2 = thread array content
CMP
      r2, #1
                     ; thread array content = 1?
BEQ
      set_addresses ; If yes, branch to set_addresses
                ; Send to the next step the next active
                ; thread in r1
MOV
      r0, r1
                      ; If not, r0 = r1
В
    get_next_taskid_loop ; and loop to get_next_taskid_loop
```

Nele, r0 inicia com o número da thread atual. Caso ele seja igual a 9, a última thread da lista, deve-se iniciar novamente a procura desde a thread 1. Caso contrário, inicia-se com o próximo número. O resultado é armazenado em r1, onde se encontra o número da próxima thread. O valor em r1 é incrementado sucessivamente até encontrar um ponto no vetor de threads que tenha o valor 0, indicando que a thread não está ativa. O cálculo da posição de memória é dado a partir da seguinte função:  $(r1-1)\cdot 4 + bottom = posição$  relativa à thread r1, onde bottom é o endereço do início do vetor e 4 é o tamanho de cada espaço dentro do vetor.

## 3.5.4 Localização dos PCBs

A rotina de troca de *threads* tem como entrada duas variáveis: o PCB da *thread* atual e o PCB do próxima *thread*. Para obter tais dados, é necessário o número de ambas. Como visto nos itens anteriores, estes dados já foram obtidos. Pode-se então aplicar o seguinte algoritmo:

```
LDR
        r2, =current_thread_id
                                  ; r2 = current thread id address
 LDR
        r2, [r2]
                          ; r2 = current thread id
        r2, r1
 CMP
                          ; Is r2 = current thread id =
                    ; next thread id
                             ; If yes, branch to no_thread_switch
 BEQ
        no\_thread\_switch
; Setting current_task_addr
                          ; Else start thread switch. r0 = 68
 MOV
        r0, #68
                            ; r0 = current thread id * 68
 MUL
        r0, r2, r0
 LDR
        r2, =process_control_block; r2 = PCB bottom
                            ; r0 = PCB bottom + id * 68
 ADD
        r0, r0, r2
                                 ; r2 = current task addr addr
 LDR
        r2, =current_task_addr
 STR
        r0, [r2]
                          ; current_task_addr = r0
; Setting next_task_addr
 MOV
        r0, #68
                         ; r0 = 68
 MUL
        r0 , r1 , r0
                           ; r0 = next thread id * 68
```

O primeiro ponto checado é se a thread atual é igual à thread que vai ser substituída. Caso isso se confirme, o chaveamento se encerra e nada ocorre. Caso contrário, o cálculo dos endereços dos PCBs é iniciado. A fórmula utilizada é:  $PCB_{id} = (id-1) \cdot 68 + base$ , onde id é o número da thread e base é o endereço do início dos PCBs. Ao fim do cálculo, estes dados são armazenados nas variáveis current\_task\_addr e next\_task\_addr, que serão utilizadas na próxima etapa do processo.

#### 3.5.5 A troca de threads

A troca de *threads* se dá em poucos passos usando-se instruções especiais que permitem que haja um grande número de dados empilhados/desempilhados com apenas uma instrução. Inicialmente zera-se a pilha do modo de interrupção e restabelece-se os registradores r0 a r3, que estavam empilhados desde o do início da rotina de tratamento. Nota-se que o ponteiro não é totalmente zerado, ele é colocado em uma posição 20 bytes acima do esperado. Isto se dá porque há empilhadas 5 palavras (r0 a r3 e o *link register*) que logo em seguida virão a ser desempilhadas.

Depois disso, muda-se o endereço do ponteiro de pilha para o PCB da *thread* atual. Um truque vem no próximo passo: empilha-se todos os registradores com o ponteiro de pilha apontando para a posição (base - 60) do PCB. Deste modo, em uma única instrução todos os registradores são colocados em suas respectivas posições. Como a estrutura do PCB foi feita tendo este processo em mente, a posição dos dados dos registradores cai exatamente como foi descrito na figura 3.2. Após o armazenamento do estado atual, muda-se novamente o endereço do ponteiro de pilha para o PCB da próxima instrução. Do mesmo modo que o armazenamento, desempilha-se os o valor dos registradores, que são exatamente como estava empilhado este processo quando foi armazenado.

```
LDMFD
                         sp!, \{r0-r3, Ir\}; Restore the remaining registers
; Load and position r13 to point into current PCB
                    r13, =current_task_addr ; r13 = current_task_PCB_bottom_address
             address
    LDR
                                                                    ; r13 = current task PCB bottom address
                   r13 , [r13]
    SUB
                    r13, r13,#60
                                                                     ; r13 = current task PCB bottom address - 60
                                                   ; to point to the right place for the stacking
                                                    ; (next step)
; Store the current user registers in current PCB
    STMIA
                         r13, \{r0-r14\}^{\hat{}}
                                                                                ; Stacks the r0-r14 registers in the PCB
    MRS
                    r0, SPSR
                                                                  ; r0 = status register
    STMDB r13, {r0,r14}
                                                                    ; Stacks r0 and r14
; Load and position r13 to point into next PCB
                    r13, =next_task_addr; r13 = next_task_addr ; r13 = next_task_addr
             address
                    r13 , [r13]
                                                                        ; r13 = next task PCB bottom address
    LDR
                    r13, r13,#60
                                                                     ; r13 = next task PCB bottom address - 60
    SUB
                                                   ; to point to the right place for the stacking
                                                   ; (next step)
; Load the next task and setup PSR
    LDMNEDB r13 , {r0 , r14}
                                                                         ; Restore r0 and r14 (IRQ mode)
                                                                          ; Restore status register
    MSRNE
                         spsr_cxsf , r0
    LDMNEIA r13, \{r0-r14\}^{\hat{}}
                                                                                  ; Restore r0-r14 for the user mode
    NOP
                                                         ; NOP! (required for the above instruction)
; Load the IRQ stack into r13_irq
                    r13, =irq_stack_pointer; r13 = stack_pointer_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_add
    LDR
    LDR
                    r13 , [ r13 ]
                                                          ; Restore previous stack pointer
    R
               return
                                                             ; Go to the end
```

## 3.5.6 Retorno à execução da nova rotina

Como os registradores, o ponteiro de pilha, o endereço de retorno e o registrador de estados já estão com os dados do próxima *thread*, deve-se apenas fazer com que o a instrução imediatamente posterior à aquela executada antes da interrupção seja executada. Porém, o pipeline do processador fez com que o endereço da instrução duas vezes à frente tivesse sido armazenado. Para compensar isso, deve-se subtrair o tamanho de uma instrução (4 bytes) do endereço que vai ser colocado no *process counter*. Todo este processo é feito com apenas uma instrução: SUBS pc, r14, #4, que simultaneamente decrementa do endereço de retorno 4 e coloca o resultado no *process counter*.

### 3.6 Chamadas de sistema

Uma chamada de sistema é uma interrupção de *software* causada pelo *kernel* para a execução de código que necessita de privilégios para ser executado. Como uma interrupção de *hardware*, uma vez que é causada, executa a instrução apontada no vetor de interrupções, instalada anteriormente na inicialização do sistema. A rotina de tratamento está localizada no arquivo handler\_swi.s e é executada em modo SVC. As únicas instruções que chamam tais chamadas de sistema são as rotinas fork, exec e exit.

### 3.6.1 Propriedades gerais

Uma vez que uma chamada de sistema é chamada, umas das funções encontradas em swi.c é invocada. O motivo para este passo intermediário é que todas as chamadas de sistema do *kernel* devem ter a mesma identificação junto à rotina de tratamento. Neste caso, todas são passadas com o primeiro parâmetro como 0. Além disso, todas devem passar o mesmo número de parâmetros, pois todas estão invocando a mesma função, chamada de syscall que também é realizado nesta etapa.

Uma vez que a chamada syscall é feita, ocorre uma interrupção de *software*. O procedimento que se passa neste caso é muito parecido com o de uma interrupção de *hardware*.

```
STMFD
                              ; Stack registers r0-12 and link register
        sp!, \{r0-r12, |r\}
                         ; Calculate address of SWI instruction (r0 = lr - 4)
LDR
      r0, [Ir, \#-4]
BIC
      r0, r0, #0xff000000
                           ; Mask off top 8 bits of instruction to give SWI
                 ; number
LDR
      r1, Angel_SWI_Number; r1 = Angel SWI Number
CMP
                       ; Compare SWI number to angel interrupt number
      r0, r1
                         ; If it is angel interrupt, branch to goto_angel
BEQ
      goto_angel
MOV
      r1, #0
                       ; r1 = 0
CMP
      r0, r1
                       ; Compare SWI number to r1
BEQ
      os_swi
                       ; If it is OS SWI, branch to os_swi
```

Novamente há uma rotina de identificação da fonte de interrupção, que pode vir a ser uma do sistema operacional, ou do Angel. O primeiro passo desta rotina é o empilhamento de todos os registradores, para poder futuramente restaurar o estado atual. Em seguida, ocorre a identificação em si, onde uma máscara de bits é aplicada para se obter o identificador da interrupção. Caso ela seja Angel\_SWI\_Number (0x0123456), o estado do processador é restaurado e há um desvio para a instrução previamente armazenada durante a instalação. Caso ela seja 0, o valor estabelecido para o sistema, há um desvio para outro código que

identifica quais das chamadas de sistema foi ativada.

Esta nova identificação pode ser observada abaixo. O primeiro passo é restaurar e armazenar novamente os valores dos registradores, já que na arquitetura ARM os valores passados pelos parâmetros de uma função são passados pelos primeiros registradores. Neste caso, r1 contém o tipo da chamada. Dependendo de qual for o valor, há desvios para pre\_routine\_fork, pre\_routine\_exec e pre\_routine\_exit

```
LDMFD sp!,\{r0-r12, lr\}; Restore r0-r12 registers and link registers
STMFD
        sp!, \{r0-r12, |r\}; and stores them again (in order to clean the
   registers)
      r1, #0
MOV
                     ; r1 = 0
CMP
      r0, r1
                     ; Compare the first parameter to 0
BEQ
      pre_routine_fork ; If it is equal, branch to the fork
MOV
      r1 , \#1
                     ; r1 = 1
CMP
      r0, r1
                     ; Compare the first parameter to 1
      pre_routine_exec ; If it is equal, branch to the exec
BEQ
MOV
      r1, #2
                     ; r1 = 2
CMP
      r0, r1
                     ; Compare the first parameter to 2
      pre_routine_exit ; If it is equal, branch to the exit
BEQ
LDMFD sp!, \{r0-r12, pc\}^{\circ}; If it is an unidentified syscall, go back to the
   program,
              ; restoring the registers and putting the return address in
              ; the process counter
```

#### 3.6.2 fork

Em um sistema operacional, a chamada de sistema fork é responsável pela criação de novos processos. Para tal, ela duplica o processo que a invocou, e retorna o identificador do processo. Este identificador é o único meio de se identificar qual o processo pai e qual é o filho. Caso o número de retorno seja 0, significa que este é o processo filho, e caso seja qualquer outro número, é o processo pai que retornou o identificador do processo filho.

O processo de duplicação de uma *thread* se inicia com o empilhamento dos registradores de dados (r0 a r12) e do endereço de retorno (*link register*) por duas vezes, como pode ser visto abaixo. O motivo é que o primeiro empilhamento serve para a restauração do estado ao fim do processo de duplicação e a segunda para a nova cópia da *thread*, como será visto mais à frente.



**Figura 3.8:** Fluxo de funcionamento do fork.

Em segundo lugar, procura-se o primeiro espaço disponível no vetor de *threads*, o que indica qual dos PCBs está livre. Na rotina apresentada abaixo, r0 contém o id da posição sendo procurada e r1 seu endereço. O loop é feito verificando de posição em posição, um ponto onde o valor seja 0. Caso se encontre, passa-se ao próximo passo, ao contrário, soma-se 1 ao número da *thread* e 4 no endereço do vetor.

```
LDR
        r1, =thread\_array; r1 = bottom of the thread array address
 MOV
        r0 , \#1
                      ; r0 = 1
routine_fork_loop
 LDR
        r2, [r1]
                      ; r2 = thread array position
        r2, #0
 CMP
                      r2 = 0?
 BEQ
                        ; If the position is availabe (r2 = 0), go to
        pcb_bottom
     pcb_bottom
                        ; r0 = r0 + 1 (next id)
 ADD
        r0, r0, #1
                      ; Is this the last thread slot being checked?
 CMP
        r0, #9
 BEQ
        fork_fail
                     ; if it is, there is no available slot, go to
     fork_fail
 ADD
                        ; r1 = r1 + 4 (next address)
 В
      routine_fork_loop; Check next slot (go to routine_fork_loop)
```

Calcula-se então o endereço do PCB da thread encontrada. A fórmula, já vista anterior-

```
mente, é PCB = id \cdot 68
```

Para se realizar a cópia da pilha de user, há de se obter três informações: a base e o ponteiro da pilha original e a base da nova pilha. O ponteiro é obtido apenas copiando-se o valor do ponteiro de pilha do modo user. As bases são calculadas a partir da equação 0x20000-(id-1)\*4048, onde 0x20000 é onde começa a área reservada às pilhas do modo user, id é o número da thread cuja base deseja-se obter e 4048 é o tamanho do espaço reservado para cada pilha.

Com os dados obtidos no passo anterior, pode-se usar a rotina a seguir para se duplicar a pilha:

```
LDR
                    ; r6 = original stack data
      r6, [r4]
STR
      r6, [r5]
                    ; Stores data in new stack (stack_top = r6)
                    ; Is this the top of the stack? (r4 = r3?)
CMP
      r4, r3
      build_new_pcb ; if it is, branch to build_new_pcb
BEQ
                      ; if not, go to next space in the new stack (r5 = r5
SUB
      r5, r5, #4
   - 4)
SUB
      r4 , r4 , #4
                      ; and next data in the original stack (r4 = r4 - 4)
                      ; restart sequence (go to loop_stack_copy)
    loop_stack_copy
```

O registrador r6 serve como memória intermediária para a cópia. r4 contém o endereço que está sendo copiado, e é incrementado de 4 em 4 até chegar ao seu topo, enquanto r5 guarda o endereço equivalente da nova pilha, que também é incrementado de 4 em 4.

Finalmente, se começa a construir o novo PCB. Na posição que guarda o registrador de estado, guarda-se o valor 0x10, que indica que a *thread* deve ser iniciada em modo *user*. O ponteiro de pilha foi obtido no passo anterior, vindo no registrador r5. Tanto o endereço de retorno do modo *user* quanto o do modo *IRQ* são o mesmo, e coloca-se o endereço inicial da rotina que se quer executar. A cópia dos valores dos registradores r0 a r12 se dá através de um loop, como pode-se observar abaixo.

```
; Copy registers
 MOV
       r3, #0
                 ; r3 = 0
 MOV
       r4, #12
                 ; r4 = 12
registers_loop
 ADD
                     ; r2 = r2 + 4 (Next PCB register space)
       r2, r2, #4
 LDMFD sp!, {r5}
                    ; Restore register from the stack to r5
 STR
       r5 , [r2]
                    ; Store register in the PCB
                    ; r12 was copied? (r3 = r4?)
 CMP
 BEQ
       enable_thread; If yes, go to enable_thread
 ADD
       r3, r3, \#1; r3 = r3 + 1 (Next register)
      registers_loop; Copy next register
 В
```

r2 contém o endereço do PCB onde os dados serão colocados, r5 funciona como intermediária entre a pilha e a memória, r4 contém o valor final da iteração e r3 o *id* do registrador sendo copiado.

O último passo antes de se retornar à execução do programa é a habilitação do programa no vetor de *threads*.

#### 3.6.3 exec

A chamada de sistema *exec* é responsável por substituir a imagem núcleo de um processo pela imagem do programa passado como argumento (TANENBAUM; WOODHULL, 2006).

Nos sistemas operacionais tradicionais, como o Linux ou o Minix, o exec é utilizado para iniciar um novo programa no mesmo ambiente do programa que executa a chamada de sistema. Normalmente o exec é utilizado na criação de um novo processo da seguinte maneira: um processo já existente se duplica através da chamada de sistema fork. O processo filho tem, então, seu código substituído pelo código que deve ser executado através da chamada de sistema exec, que permite ao processo filho assumir seu próprio conteúdo, apagando de si o conteúdo do processo pai.

No KinOS, para que um *thread* passe a executar outro programa, é necessário reinicializar o seu PCB, isso é feito pela chamada de sistema *exec*.

Existem 4 principais entradas do PCB que necessitam ser reinicializadas:

- o program counter (PC R13);
- o link register (LR R14);
- o stack pointer (SP R15);
- e o saved processor status register (SPSR).

Para reinicializar essas entradas, de forma que a *thread* passe à executar um novo programa, primeiro é necessário calcular o início do PCB da *thread* correspondente.

A rotina *exec*, recebe como parâmetros o id da *thread* que será alterada e o ponteiro para a função/programa que pretende-se executar, como mostrado a seguir:

```
void exec(int process_id, pt2Task process_addr);
```

Assim para calcular o endereço inicial do PCB, obtêm-se o endereço inicial da área reservada para armazenar todos os PCBs, a **process\_control\_block**, e adiciona-se à esta o valor de 68 multiplicado por **process\_id**, visto que cada PCB ocupa um espaço de 68 endereços de memória como mencionado na sessão 3.2.1. O código responsável por calcular o PCB é apresentado a baixo:

```
LDR r3 , =process_control_block ; r3 = the start address of the PCB area MOV r4 ,#68 ; r4 = 68 (space for each process in the PCB) MUL r5 , r1 , r4 ; r5 = (task id) * 68 ADD r3 , r3 , r5 ; r3 = PCB start address + r5
```

Em seguida, calculado o endereço inicial do PCB, altera-se suas entradas da seguinte maneira:

 LR (PCB[-4]) e PC (PCB[-64]) recebem o endereço da primeira instrução do novo programa (process\_addr).

```
PCB[-4] = process_addr;
PCB[-64] = process_addr;
```

• SP (PCB[-8]) recebe o endereço de início da pilha da *thread*, fazendo com que esta seja zerada. Para cada pilha de *thread*, 4048 bytes são reservados.

```
PCB[-8] = início da pilha do modo usuário – (4048 * thread id);
```

• SPSR (PCB[-68]) recebe 0x10, pois os programas devem rodar no modo usuário.

```
PCB[-68] = 0 \times 10;
```

Finalmente, após alterar as entradas mostradas a cima, a *thread* começa a executar o novo programa.

#### 3.6.4 exit

A chamada de sistema *exit* é responsável por finalizar um processo, liberando espaço de memória para a execução de um novo processo (TANENBAUM; WOODHULL, 2006).

No KinOS isso é realizado apenas colocando como desativado (igual à 0) o byte na lista de processos que corresponde a *thread* que se deseja finalizar.

Para isso a rotina exit recebe como parâmetro o id da thread a ser terminada.

```
void exit(int process_id);
```

### 3.7 Shell

Com o desenvolvimento do microkernel e de suas system calls, torna-se necessário o desenvolvimento de outro ramo do projeto, destinado a permitir a interação do usuário com o Sistema Operacional. Essa interação é feita por um editor de linha de comando, também conhecido por Shell.

Na inicialização do microkernel, o Shell é o primeiro processo criado no sistema. Desse momento em diante, cabe ao usuário solicitar a execução ou o término de outros processos. Além disso, o Shell permite a visualização dos diferentes processos em execução no sistema.

### 3.7.1 Comunicação via terminal

O Shell, para fazer a interação com o usuário, utiliza a porta serial COM0 (de uso geral) conectada a uma segunda porta serial da máquina host. A porta COM1 (Debug) deve permanecer conectada, pois o Angel mantém comunicações através dela com o AXD (descrito na seção 2.3.2) durante a execução do KinOS, como ilustrado na figura 3.9.



Figura 3.9: Comunicação da Evaluator-7T em cada porta serial.

## 3.7.2 Configuração e uso da COMO

Para utilizar a porta COM0 da Evaluator-7T, é preciso configurar um conjunto de registradores mapeados em memória relativos à UART0 do microcontrolador. A tabela 3.1 lista os registradores usados no projeto e suas respectivas funções.

| Tabela 3.1: Registradores mapeados em memória | da UARTO (SAMSUNG ELECTRONICS, |
|-----------------------------------------------|--------------------------------|
| 2007)                                         |                                |

| Registrador | Offset | R/W | Descrição                                     |
|-------------|--------|-----|-----------------------------------------------|
| ULCON0      | 0×D000 | R/W | Registrador de controle de linha              |
| UCON0       | 0xD004 | R/W | Registrador de controle                       |
| USTAT0      | 0xD008 | R   | Registrador de status                         |
| UTXBUF0     | 0xD00C | W   | Registrador de buffer de transmissão          |
| URXBUF0     | 0xD010 | R   | Registrador de buffer de recepção             |
| UBRDIV0     | 0xD014 | R/W | Registrador de divisor de taxa de transmissão |

A coluna *offset* da tabela 3.1 indica o endereço de memória do registrador a partir do endereço inicial, que é 0x03FF0000. Esse endereço é o do registrador SYSCFG, de configuração de sistema.

Na inicialização da COM0, escreve-se nos registradores ULCON0, UCON0 e UBRDIV0. Os valores a serem colocados em cada um seus respectivos significados estão descritos na tabela 3.2.

**Tabela 3.2:** Registradores mapeados em memória da UARTO (SAMSUNG ELECTRONICS, 2007)

| Registrador | Valor | Significado                               |
|-------------|-------|-------------------------------------------|
| ULCON0      | 0x03  | 8 bits de dados, 1 bit de parada, sem pa- |
|             |       | ridade, fonte de clock interna e modo de  |
|             |       | operação normal.                          |
| UCON0       | 0x09  | Rx e Tx por requisição de interrupção,    |
|             |       | sem geração de interrupção por status de  |
|             |       | recepção, sem loop-back.                  |
| UBRDIV0     | 0xA20 | Define a taxa de transmissão em 9600      |
|             |       | bauds.                                    |

Inicializada a COMO, a transmissão de um caractere por ela é feita da seguinte maneira: observa-se o conteúdo do bit 6 de USTATO. Quando este é igual a 1, significa que UTXBUFO não contém dados válidos e, portanto, pode-se escrever nele o caractere que pretende-se enviar. Em seguida, coloca-se o caractere desejado em UTXBUFO. A lógica do controlador UART do microcontrolador se encarrega de enviar o dado para o terminal.

A recepção de caracteres é feita de forma parecida: dessa vez, a verificação é feita no bit 5 de USTATO, o qual é igual a 1 quando contém dados válidos recebidos pela porta serial. Quando isso acontece, copia-se o conteúdo de URXBUFO para uma variável no programa do tipo *char*.

#### 3.7.3 Funcionalidades do Shell

O editor de linha de comando do KinOS possui três funcionalidades básicas: listar processos ativos (ps), inicializar novos processos (start) e encerrar processos ativos (end). As sintaxes de cada comando são, respectivamente:

```
start <nome do processo>
end <nome do processo>
```

O comando *ps* utiliza o vetor de threads do sistema operacional para saber quais processos estão ativos. A partir daí, buscam-se as informações sobre cada processo ativo em seu respectivo PCB. Essas informações são, então, listadas ao usuário.

O comando *start* utiliza as system calls *fork* e *exec* para iniciar novos processos no sistema. O usuário deve fornecer o nome do processo como parâmetro do comando. Cada processo que pode ser disparado dentro do KinOS já está definido dentro do código-fonte, e cada um de seus nomes também já está definido.

O comando *end* é similar ao *start*. Dessa vez, o comando recebe o nome de um processo ativo no sistema e utiliza a system call *exit* para encerrá-lo.

## 3.8 Mutex

O mutex ou exclusão mútua, é uma técnica usada para evitar que dois processos tenham acesso a um mesmo espaço de memória. Seu funcionamento é baseado em uma variável que pode ter apenas dois valores, 0 ou 1. Caso ela seja 0, ela indica que a área crítica pode ser acessada e 1 caso contrário. No caso de um processo não obter acesso, ele fica em espera ativa, até que o processo que o bloqueou o desfaça.

No exemplo que é dado no KinOS, tem-se duas funções que realizam o travamento e o destravamento do *mutex* e a variável semaphore, que guarda o valor do *mutex*. A primeira função se chama mutex\_gatelock, que pode ser observada abaixo.

```
void mutex_gatelock (void) {
   __asm {
    spin:
    mov    r1, &semaphore
    mov    r2, #1
```

```
swp r3,r2,[r1]
cmp r3,#1
beq spin
}
```

r1 recebe o endereço da variável semaphore, e r2 recebe 1. A função atômica swp é que permite o correto funcionamento do *mutex*: em uma instrução indivisível, o conteúdo de semaphore é colocado em r3, e 1 é colocado em semaphore. Com isso, é impossível que haja uma interrupção entre estas duas ações, o que poderia arruinar uma rotina de *mutex*. Finalmente, caso semaphore já estivesse ativo quando chamado, a rotina seria executada novamente.

O destravamento é feito de modo similar, com a mesma instrução. Só que neste caso, o valor 0 é colocado em semaphore.

Porém, as rotinas apresentadas não são chamadas diretamente. Usa-se as chamadas abaixo.

```
#define WAIT     while (semaphore==1) {} mutex_gatelock();
#define SIGNAL     mutex_gateunlock();
```

O motivo é que ao se usar o WAIT quando o *mutex* está ativo, faz com que o programa entre em uma espera ativa.

## 3.9 Processos

O kernel pode lidar com no máximo nove processos, nomeados de task1 a task9 no arquivo tasks.c. Como eles não têm área de dados própria, não pode-se chamá-los de processos. A implicação de se ter uma área de dados em comum é que todos os processos que rodam um mesmo programa compartilham os valores das variáveis. O mais correto, portanto, seria o chamá-os de threads.

Criamos algums programas exemplo que se utilizam dos periféricos da placa.

TODO... (Fazer código antes)

# 3.10 Inspiração

Grande parte do código foi retirada do código presente nos exemplos incluídos no CD de demonstração da placa. O principal deles, é o código *mutex*, desenvolvido por Andrew N. Sloss, de onde foi baseado o chaveamento de processos, a função de semáforo e as rotinas de manipulação de hardware.

TODO ...

# 4 CONSIDERAÇÕES FINAIS

#### 4.1 Conclusão

Através deste projeto de formatura foi possível desenvolver, como previsto, um *microkernel* simples para a placa ARM Evaluator-7T.

O KinOS é um *microkernel* que implementa, de maneira didática, os mecanismos básicos de um sistema operacional, como: chaveamento de threads, chamadas de sistema e rotinas de comunicação com os periféricos da placa (*leds*, *display*, botão, *switches*). Além disso, o KinOS possui um simples terminal para a interação do usuário com o sistema e de onde é possível executar os programas adicionados ao *microkernel*.

#### 4.2 Contribuições

Pretende-se que a monografia e a parte prática desenvolvida durante o projeto, sejam utilizados como material didático para o Laboratório de Microprocessadores, fazendo assim com que este se torne mais atual e mais próximo da disciplina de Sistemas Operacionais.

Quanto à contribuição para os integrantes do grupo, este estudo possibilitou principalmente o aprendizado da arquitetura de processadores ARM, além da consolidação dos aspectos teóricos aprendidos em Sistemas Operacionais, através da implementação do *microkernel*.

#### 4.3 Trabalhos Futuros

### REFERÊNCIAS BIBLIOGRÁFICAS

ABDELRAZEK, A. F. M. *Exception and Interrupt Handling in ARM*. [S.I.], Setembro 2006. Disponível em: <a href="http://www.iti.uni-stuttgart.de/">http://www.iti.uni-stuttgart.de/</a> radetzki/Seminar06/08\_report.pdf>.

ARM LIMITED. *ARM7TDMI Data Sheet (ARM DDI 0029E)*. [S.I.], Agosto 1995. Disponível em: <a href="http://www.eecs.umich.edu/panalyzer/pdfs/ARM\_doc.pdf">http://www.eecs.umich.edu/panalyzer/pdfs/ARM\_doc.pdf</a>.

ARM LIMITED. *Application Note 25 - Exception Handling on the ARM (ARM DAI 0025E)*. [S.I.], Setembro 1996. Disponível em: <a href="http://www.imit.kth.se/courses/2B1445/0304/material/Apps25vE.pdf">http://www.imit.kth.se/courses/2B1445/0304/material/Apps25vE.pdf</a>>.

ARM LIMITED. *ARM Evaluator-7T Board User Guide*. [S.I.], Agosto 2000. Disponível em: <a href="http://infocenter.arm.com/help/topic/com.arm.doc.dui0134a/DUI0134A\_evaluator7t\_ug.pdf">http://infocenter.arm.com/help/topic/com.arm.doc.dui0134a/DUI0134A\_evaluator7t\_ug.pdf</a>.

ARM LIMITED. ARM Developer Suite AXD and armsd Debuggers Guide. [S.I.], Novembro 2001. Disponível em: <a href="http://infocenter.arm.com/help/topic/com.arm.doc.dui0066d/DUI0066.pdf">http://infocenter.arm.com/help/topic/com.arm.doc.dui0066d/DUI0066.pdf</a>.

ARM LIMITED. ARM7TDMI Technical Reference Manual (ARM DDI 0029G). Rev 3. [S.I.], Abril 2001. Disponível em: <a href="http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.ddi0029g/index.html">http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.ddi0029g/index.html</a>.

ARM LIMITED. *ARM Architecture Reference Manual (ARM DDI 0100I)*. [S.I.], Julho 2005. Disponível em: <a href="http://www.arm.com/miscPDFs/14128.pdf">http://www.arm.com/miscPDFs/14128.pdf</a>.

FURBER, S. *ARM System-On-Chip Architecture*. 2. ed. [S.I.]: Addison-Wesley, 2000. ISBN 0-20167-519-6.

KINOSHITA, C. C. e. A. H. J. *Experiência 5: Interrupções.* [S.I.], 2007. Disponível em: <a href="http://www.pcs.usp.br/jkinoshi/2007/tomas5.doc">http://www.pcs.usp.br/jkinoshi/2007/tomas5.doc</a>.

MORROW, M. G. ARM7TDMI Instruction Set Reference. [S.I.], Setembro 2008. Disponível em: <a href="http://eceserv0.ece.wisc.edu/morrow/ECE353/arm7tdmi\_instruction\_set\_reference.pdf">http://eceserv0.ece.wisc.edu/morrow/ECE353/arm7tdmi\_instruction\_set\_reference.pdf</a>.

RYZHYK, L. The arm architecture. Junho 2006. Disponível em: <a href="http://www.cse.unsw.edu.au/cs9244/06/seminars/08-leonidr.pdf">http://www.cse.unsw.edu.au/cs9244/06/seminars/08-leonidr.pdf</a>>.

SAMSUNG ELECTRONICS. KS32C50100 RISC MicroController User Manual. [S.I.], Agosto 2007. Disponível em:

<a href="http://www.samsung.com/global/system/business/semiconductor/product/2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2007/6/11/SystemLSI/Net-2

SLOSS, A. Interrupt Handling. [S.I.], Abril 2001.

SLOSS, A.; SYMES, D.; WRIGHT, C. ARM System Developer's Guide: designing and optimizing system software. 1. ed. [S.I.]: Morgan Kauffman, 2004. ISBN 1-55860-874-5.

TANENBAUM, A. S.; WOODHULL, A. S. *Operating Systems: Design and Implementation*. 3rd. ed. [S.I.]: Pearson Prentice Hall, 2006. ISBN 0-13-142938-8.

ZAITSEFF, J. *ELEC2041 Microprocessors - Laboratory Manual*. [S.I.], Junho 2003. Disponível em: <a href="http://www.zap.org.au/elec2041-cdrom/unsw/elec2041/README.html">http://www.zap.org.au/elec2041-cdrom/unsw/elec2041/README.html</a>.

# Apêndice A - ARQUIVOS FONTE

#### A.1 cinit.h

```
1 #include "constants.h"
2 #include "apps/tasks.h"
3 #include "apps/terminal.h"
4 #include "interrupt/irq.h"
5 #include "peripherals/button.h"
  #include "peripherals/segment.h"
  #include "peripherals/timer.h"
7
   extern void handler_board_angel(void);
9
  extern void handler_board_no_angel(void);
10
  extern void handler_swi(void);
11
12
  extern void handler_emulator(void);
   extern void task1(void);
```

#### A.2 cinit.c

```
1
2
     KinOS - Microkernel for ARM Evaluator 7-T
     Seniors project - Computer Engineering
3
     Escola Politecnica da USP, 2009
4
5
     Felipe Giunte Yoshida
6
     Mariana Ramos Franco
7
      Vinicius Tosta Ribeiro
8
9
   */
10
11
   The program was based on the mutex program by ARM - Strategic Support Group
```

```
contained on the ARM Evaluator 7-T example CD, under the folder /Evaluator7
13
       -T/
14
   source/examples/mutex/
15
   */
16
17
   /* Initialization code in C */
18
19
   #include "cinit.h"
20
21
   /* Entry point for C part */
   int C_Entry (void) {
22
23
     /* Initialize 7—segment display */
      segment_init();
24
     /* Initialize timer */
25
26
      timer_init();
     /* Initialize button */
27
28
      button_init();
     /* Install hardware interruption handler */
29
30
      if (emulator = 1) {
        install_handler ((unsigned)handler_emulator, (unsigned *)IRQVector);
31
32
     }
33
      else if (emulator = 0) {
        install_handler ((unsigned)handler_board_angel, (unsigned *)IRQVector);
34
     }
35
      else {
36
        install_handler ((unsigned)handler_board_no_angel, (unsigned *)
37
           IRQVector);
38
39
     /* Install software interruption handler */
      install_handler ((unsigned) handler_swi, (unsigned *)SWIVector);
40
     /* Start timer */
41
      timer_start();
42
43
      /st Enabling IRQ interruption and changing to user mode st/
44
     __asm {
45
       MOV
              r1, \#0x40 | 0x10
       MSR
              CPSR_c, r1
46
47
     }
     /* Start with process 1 */
48
49
     task1();
     //shell();
50
      /* The return below should not be reachable */
51
52
      return 0:
53 | }
```

#### A.3 constants.h

```
2
   /st Defines if the program is running on: st/
   /* 0 - Evaluator 7-T board with Angel */
3
   /* 1 - CodeWarrior ARMUlator */
   /* 2 - Evaluator 7-T board no Angel */
6 #define emulator 0
   /st The number of the operating system software interrupt st/
7
  #define OS_SWI
8
   /* Interrupt table SWI instruction position */
10 #define SWIVector (unsigned *) 0x08
11 /* Interrupt table IRQ instruction position */
12 |#define IRQVector (unsigned *) 0x18
13 /* Time set for the timer */
   //#define COUNTDOWN 0x00effff0
14
15 #define COUNTDOWN 0×000ffff0
16
   17
   /* Timer interrupt ID */
18
19 #define IRQTimer
                        0×0010
   /* IRQ interrupt controller addresses */
20
21 #define IRQEnableSet
                           (volatile unsigned *) 0x0A000008
22 #define IRQEnableClear
                             (volatile unsigned *) 0x0A00000C
   /* Timer registers */
23
  #define EmulatorIRQTimerLoad (volatile unsigned *) 0x0A800000
  #define EmulatorIRQTimerControl (volatile unsigned *) 0x0A800008
26 | #define | IRQTimerClear (volatile unsigned *) 0x0A80000C
27
   /****** BOARD VARIABLES ******/
28
29
   /* Inoput/output data address */
30 #define IOData
                            (volatile unsigned *) 0 \times 03 ff 5008
   /* IRQ interrupt controller addresses */
31
32 #define IRQStatus
                           (volatile unsigned *) 0x03ff4004
   /* Timer registers */
33
34 #define TimerEnableSet
                              (volatile unsigned *) 0 \times 0.3 \text{ff} 6000
35 #define EvaluatorIRQTimerLoad
                                 (volatile unsigned *) 0x03ff6004
36 #define EvaluatorIRQTimerControl (volatile unsigned *) 0x03ff4008
  /* Button addresses */
38 #define IRQButtonControl (volatile unsigned *) 0x03ff5004
```

```
/* Segment addresses */
40 #define IOPMod
                                     (volatile unsigned *)0x03ff5000
   /st The bits taken up by the display in IOData register st/
41
42 #define Segment_mask 0x1FC00
   /* Define segments in terms of IO lines */
43
44
   #define SEG_A
                     (1 < < 10)
   #define SEG_B
45
                     (1 < < 11)
46 #define SEG_C
                     (1 < < 12)
47 #define SEG_D
                     (1 < < 13)
48 #define SEG_E
                     (1 < < 14)
49 #define SEG_F
                     (1 < < 16)
50 #define SEG_G
                     (1 < < 15)
51 #define DISP_0
                        (SEG_A | SEG_B | SEG_C | SEG_D | SEG_E | SEG_F)
52 #define DISP_1
                        (SEG_B|SEG_C)
53 #define DISP_2
                        (SEG_A | SEG_B | SEG_D | SEG_E | SEG_G)
54 #define DISP_3
                        (SEG_A | SEG_B | SEG_C | SEG_D | SEG_G)
55 #define DISP_4
                        (SEG_B|SEG_C|SEG_F|SEG_G)
56 #define DISP_5
                        (SEG_A | SEG_C | SEG_D | SEG_F | SEG_G)
                        (SEG_A | SEG_C | SEG_D | SEG_E | SEG_F | SEG_G)
57 #define DISP_6
58 #define DISP_7
                        (SEG_A | SEG_B | SEG_C)
59 #define DISP_8
                        (SEG_A | SEG_B | SEG_C | SEG_D | SEG_E | SEG_F | SEG_G)
60 #define DISP_9
                        (SEG_A | SEG_B | SEG_C | SEG_D | SEG_F | SEG_G)
   #define DISP_A
                        (SEG_A|SEG_B|SEG_C|SEG_E|SEG_F|SEG_G)
62 #define DISP_B
                        (SEG_C|SEG_D|SEG_E|SEG_F|SEG_G)
63 #define DISP_C
                        (SEG_A | SEG_D | SEG_E | SEG_F)
64 #define DISP_D
                        (SEG_B | SEG_C | SEG_D | SEG_E | SEG_G)
65 #define DISP_E
                        (SEG_A | SEG_D | SEG_E | SEG_F | SEG_G)
   #define DISP_F
                        (SEG_A | SEG_E | SEG_F | SEG_G)
```

#### A.4 startup.s

```
; Startup assembly code
   ; Obs.: This code was built supposing that the generated assembly is ARM
2
   ; assembly, not THUMB!!!
3
4
     IMPORT
5
             current_thread_id
6
     IMPORT
             thread_array
     IMPORT
             C_Entry
7
8
9
     ; Identifying that from below on it is assembly code (readable only)
10
     AREA asm_init, CODE
```

```
11
12
     ; Entry point of the program
13
     ENTRY
14
15
     ; Beginning assembly initialization
16
   start
17
     ; Changing to IRQ mode and disabling interruptions, then setting up
     ; IRQ stack pointer to 0x8000
18
19
     MOV
            r0, \#0xC0|0x12 ; r0 = 0xC0 or 0x12 (0xC0 = IRQ disabled,
20
                    ; 0 \times 12 = IRQ \mod e
     MSR
            CPSR_c, r0
21
                           ; status_register = r0
22
     MOV
           sp , \#0x8000
                           ; stack pointer = 0 \times 8000
23
24
     ; Changing to system mode and disabling interruptions, then setting up
25
     ; user stack pointer to 0x20000
           r0 , \#0xC0|0x1F ; r0 = 0xC0 or 0x1F (0xC0 = IRQ disabled ,
     MOV
26
27
                    ; 0 \times 1F = \text{system mode})
28
     MSR
            CPSR_c, r0
                           ; status_register = r0
29
     MOV
            sp, \#0x20000
                           ; stack pointer = 0 \times 20000
30
     ; Changing to SVC mode and disabling interruptions, then setting up
31
32
     ; SVC stack pointer to 0 \times 8000 - 128
            r0, \#0xC0|0x13; r0 = 0xC0 or 0x13 (0xC0 = IRQ disabled,
33
     MOV
                    ; 0 \times 13 = SVC \mod e
34
     MSR
           CPSR_c, r0
35
                           ; status_register = r0
     MOV
           r0, #0x8000
                           ; r0 = 0 \times 8000
36
     SUB
           r0, r0, #128 ; r0 = r0 - 128
37
     MOV
38
            sp, r0; stack pointer = r0
39
40
     ; Initializes the thread array with zeros (0 = thread disabled,
     ; 1 = thread enabled)
41
42
     LDR
            rO, =thread_array; rO = thread_array start address
     MOV
43
            r1, #1
                           ; r1 = 1
     STR
44
            r1 , [r0]
                           ; address(r0) = r1
45
     MOV
            r1, #0
                           ; r1 = 0 (disabled)
     MOV
            r2, #0
                           ; r2 = 0
46
   init_thread_array_loop
47
                            ; r2 = r2 + 4
48
     ADD
           r2 , r2 , #4
                           ; r2 = 36?
49
     CMP
           r2, #36
50
            set_active_thread ; if yes, go to set_active_thread
     BEQ
           r3 , r0 , r2
                              ; r3 = r0 + r2
51
     ADD
52
     STR
            r1, [r3]
                           ; address(r3) = r1
53
     B init_thread_array_loop ; return to init_thread_array_2
```

```
54
55
       ; Setting the thread id to 1
    set_active_thread
56
       LDR
               r0, =current_thread_id; r0 = current thread id address
57
       MOV
               r1 , \#1
                                   ; r1 = 1
58
59
       STR
               r1 , [r0]
                                   ; current thread \mathsf{id} = 1
60
       ; Pass control to C_Entry
61
62
       LDR
               \label{eq:contraction} \mbox{Ir , } = \mbox{C\_Entry} \qquad \qquad ; \ \mbox{link } \mbox{ } \mbox{\bf register} \ = \mbox{C } \mbox{entry}
63
       MOV
               pc, Ir
                                   ; process counter = C entry
64
65
       ; End of assembly code
       END
66
```

#### A.5 apps/tasks.h

```
#include "../peripherals/segment.h"

#include "../interrupt/swi.h"

void task1 (void);

void task2 (int);

void set_segment(int);
```

### A.6 apps/tasks.c

```
#include "tasks.h"
2
3
4
   void task1 (void) {
5
     int a = 0;
6
     //char* newTask = "set_segment";
7
8
9
     int j;
10
     a = fork();
11
12
     if (a != -1 \&\& a != 0) {
     // exec(a , get_task_addr(newTask), 2);
13
     }
14
```

```
15
16
      while (1) {
17
        segment_set(1);
        if (j == 1000000){
18
19
          exit(a);
20
        }
21
        j++;
      }
22
23
    }
24
25
    void task2 (int value) {
      while (1) {
26
27
        segment_set(2);
28
      }
    }
29
30
31
    void set_segment(int value){}
32
33
      while (1) {
34
        segment_set(value);
35
      }
   }
36
37
38
39
40
41
    void task3 (void) {
42
      while (1) {
43
        segment_set(3);
44
      }
   }
45
46
    void task4 (void) {
47
48
      while (1) {
49
        segment_-set(4);
50
      }
51
    }
52
53
    void task5 (void) {
      while (1) {
54
55
        segment_set(5);
56
      }
57 }
```

```
58
59
   void task6 (void) {
60
      while (1) {
        segment_set(6);
61
62
      }
   }
63
64
65
   void task7 (void) {
      while (1) {
66
67
        segment_set(7);
68
69
   }
70
71
   void task8 (void) {
      while (1) {
72
        segment_set(8);
73
74
      }
75
   }
76
77
   void task9 (void) {
78
      while (1) {
        segment_set(9);
79
80
81
```

## A.7 apps/terminal.h

```
int strcmp(char* str1, char* str2);

void shell (void);
```

# A.8 apps/terminal.c

```
8
9
      Module
                : comm.c
       Description: communicates with the serial driver.
10
       Tool Chain : ARM Developer Suite 1.0
11
       Platform : Evaluator7T
12
13
       History
14
              2000-03-22 Andrew N. Sloss
15
16
              - implemented
17
18
19
20
21
22
    * IMPORT
23
24
25
   #include "serial.h"
26
    #include "tasks.h"
27
28
   #include <string.h>
29
30
31
    * MACROS
32
    ************************
33
  #define
            angel_SWI 0x123456
34
  #define
            CMD_LENGTH 32
35
36
37
38
   struct { char* name; void (*task_ptr)(int); } tasks_name[] = {
39
     {"task2", &task2},
     {"set_segment", &set_segment}
40
   };
41
42
43
44
    * MISC
45
46
    **********************
47
48
   __swi (angel_SWI) void _Exit(unsigned op, unsigned except);
49 #define Exit() _Exit(0x18,0x20026)
50
```

```
__swi (angel_SWI) void _WriteC(unsigned op, const char *c);
51
52
   #define WriteC(c) _WriteC (0x3,c)
53
54
55
56
    * ROUTINES
57
    **********************
58
59
60
   int strcmp (char* str1, char* str2){
61
     int i;
62
     for (i = 0; str1[i] = str2[i]; i++){
63
       if (str1[i] = ' \setminus 0'){
64
         return 0;
65
       }
66
     }
67
     return str1[i] - str2[i];
68
69
   }
   */
70
71
72
73
   pt2Task get_task_addr(char* name){
74
     int i;
     for(i=0; i< sizeof(tasks_name); i++){
75
76
       if (strcmp(tasks_name[i].name, name)==0){
         return tasks_name[i].task_ptr;
77
       }
78
79
     }
     return 0;
80
81
   }
82
83
84
85
   /* -- comm_print -
86
    * Description : write a string via the Angel SWI call WriteC
87
88
89
    * Parameters : const char *string - string to be written
90
    * Return
                : none . . .
91
    * Notes
                : none...
92
93
    */
```

```
94
95
    void comm_print (const char *string)
96
    {
      int pos = 0;
97
      while (string[pos] != 0) WriteC(&string[pos++]);
98
99
    }
100
101
    /* -- comm_init -
102
103
     * Description : initialize the COMO port and set to 9600 baud.
104
105
     * Parameters : none . . .
106
     * Return
                 : none...
107
     * Notes
                 : none...
108
109
     */
110
    void comm_init (void)
111
112
    {
      serial_initcomOuser (BAUD_9600);
113
114
115
    /* -- comm_banner -
116
117
118
     * Description : print out standard banner out of the COMO port
119
120
     * Parameters : none . . .
121
     * Return
                 : none...
122
     * Notes
                 : none...
123
124
     */
125
    void comm_banner (void)
126
127
      serial_print (COM0_USER, "\n**_Welcome_to_KinOS!!");
128
         serial_print (COM0_USER, "_-_Version_0.1_**\n\r");
129
130
    }
131
132
    /* -- comm_getkey -
133
134
     * Description : wait until a key is press from the host PC.
135
136
     * Parameters : none . . .
```

```
137
      * Return : none...
138
      * Notes
                     : none...
139
140
141
142
     void comm_getkey (void)
143
144
        serial_getkey();
145
146
147
148
     char comm_getcmd (void)
149
150
        return serial_getcmd();
151
152
153
154
     /* -- C_Entry --
155
      * Description : Entry point into C
156
157
158
      * Parameters : none . . .
159
                     : none...
      * Return
160
       * Notes
                     : none...
161
162
      */
163
     void shell (void)
164
165
166
        \boldsymbol{char} \hspace{0.1cm} \mathsf{cmd} \hspace{0.1cm} [\hspace{0.1cm} \mathsf{CMD\_LENGTH}\hspace{0.1cm}] \hspace{0.1cm};
167
        char c;
        int i;
168
169
170
        //int a = 0;
171
        //char* newTask = "set_segment";
172
173
        comm\_print \ ("\n-\_switch\_to\_a\_serial\_terminal\_program\_(baud=9600)\n" \ );
174
175
        comm_init();
        comm_banner();
176
177
178
        // wait for a key press...
179
```

```
180
      serial_print (COMO_USER, "--__Press_any_key_\n\r");
181
182
183
      c=0;
184
      i = 0;
185
      while (c != '\r' \&\& i< CMD\_LENGTH) {
        c = comm_getcmd();
186
        if (c = 8) { // backspace
187
           if (i > 0) i - -;
188
189
        } else {
190
          cmd[i++] = c;
191
        }
192
      }
193
194
195
196
      //a = fork();
197
      //if(a != -1 \&\& a != 0){
198
      // exec(a , get_task_addr(newTask), 1);
199
      //}
200
201
      //while(1){
202
        segment_set(1);
203
      //}
204
205
      comm_getkey();
      serial\_print (COM0\_USER, "\n\r—\_Key\_pressed\_\n\r");
206
      serial\_print \ (COM0\_USER, "\n\r**\_Program\_Terminating\_**\n\r");
207
208
209
      comm\_print ("\n\n\_**\_program\_terminating\_normally\_**");
210
211
      Exit();
    }
212
213
214
215
     * END OF comm.c
216
217
     ********************
```

### A.9 interrupt/handler\_irq.s

```
1
   ; Hardware interrupt handling code
2
3
     IMPORT
             button_irq
     IMPORT
4
             timer_irq
5
6
     EXPORT
            Angel_IRQ_Address
     EXPORT current_thread_id
7
     EXPORT handler_board_angel
8
9
     EXPORT
             handler_board_no_angel
     EXPORT handler_emulator
10
11
     EXPORT
             process_control_block
12
     EXPORT thread_array
13
14
     ; Beginning handler code
15
     AREA handler_irq, CODE
16
   ; Routine designed to the emulator, all the hardware IRQ is caused by the
17
      timer
   handler_emulator
18
     STMFD sp!, \{r0 - r3, lr\}; Stacking r0 to r3 and the link register
19
     B handler_timer ; Branch to handler_timer
20
21
22
   ; Routine designed to the board, have the Angel handler routine, button and
        timer
   handler_board_angel
23
     ; Save current context for APCS
24
25
     STMFD sp!, \{r0 - r3, lr\}; Stacking r0 to r3 and the link register
26
     LDR
           r0, IRQStatus; r0 = irq type address
     LDR
           r0 , [r0]
                           ; r0 = irq type
27
28
     TST
           r0, #0×0400
                             ; irq type == 0 \times 0400?
29
     BNE
           handler_timer
                               ; If yes, go to handler_timer
     TST
           r0 , \#0 \times 0001
                             ; irq type = 0 \times 0001?
30
                              ; If yes, go to handler_button
31
     BNE
           handler\_button
32
     LDMFD sp!, \{r0 - r3, lr\}; If it is not any of them, restore r0-r3 and
     LDR pc, Angel_IRQ_Address; and branch to the Angel routine
33
34
35
   ; Routine designed to the board, not have the Angel handler routine, button
        and timer
   handler_board_no_angel
36
       ; Save current context for APCS
37
38
       STMFD sp!, \{r0 - r3, lr\}; Stacking r0 to r3 and the link register
       LDR r0, IRQStatus ; r0 = irq type address
```

```
; r0 = irq type
40
       LDR r0, [r0]
                          ; irq type = 0x0400?
            r0, #0×0400
41
       TST
42
       BNE handler_timer
                               ; If yes, go to handler_timer
       TST r0, #0×0001
                             ; irq type = 0 \times 0001?
43
       BNE handler_button ; If yes, go to handler_button
44
45
       LDMFD sp!, \{r0 - r3, lr\}; If it is not any of them, restore r0-r3
          and Ir
       В
            return
                           ; and return
46
47
48
   ; handler routine for the button interruption
49
   handler_button
     BL button_irq ; C routine for the button
50
     B no_thread_switch ; End the handler
51
52
53
   ; Timer interruption handler routine
   handler_timer
54
     STMFD sp!, \{r4 - r12\}; Stack the rest of the registers (r4-r12)
55
          timer_irq ; Clear timer interruption
56
57
     LDMFD sp!, \{r4 - r12\}; Load r4-12 registers again
         rO, =current_thread_id; rO = current_thread_id address
     LDR
58
     LDR r0, [r0] ; r0 = current_thread_id
59
60
                    ; Send to the next step rO as the current
                    ; thread ID
61
62
   ; Finds out the next active thread id (send result in r1)
63
64
   get_next_taskid_loop
                         ; r0 = 9? (it is the last thread?)
65
     CMP
          r0, #9
66
     BEQ
         last\_thread
                          ; If yes, branch last_thread
     ADD r1, r0, #1
                           ; If not, r1 = r0 + 1
67
     B next_thread ; and branch to next_thread
68
69
   last\_thread
70
    MOV
          r1 , #1
                       ; r1 = 1
71
   next\_thread
72
     SUB
          r2 , r1 , #1
                           ; r2 = r1 - 1
73
     MOV
          r3, #4
                         ; r3 = 4
     MUL
          r2, r3, r2
                           ; r2 = r2 * r3
74
     LDR
           r3, =thread_array; r3 = thread_array bottom address
75
     ADD
                           ; r2 = r3 + r2
76
          r2, r2, r3
77
     LDR
           r2 , [r2]
                         ; r2 = thread array content
           r2, #1
     CMP
                         ; thread array content = 1?
78
79
           set_addresses ; If yes, branch to set_addresses
     BEQ
80
                    ; Send to the next step the next active
81
                    ; thread in r1
```

```
\label{eq:mov_r0} MOV \qquad r0 \;,\;\; r1 \qquad \qquad ;\;\; If\;\; \boldsymbol{not} \;,\;\; r0 \;=\; r1
82
83
      B get_next_taskid_loop; and loop to get_next_taskid_loop
84
85
    ; Sets current and next thread PCB addresses
86
    set_addresses
87
      LDR
            r2, =current_thread_id; r2 = current thread id address
            r2 , [r2]
88
      LDR
                              ; r2 = current thread id
            r2 , r1
89
      CMP
                              ; Is r2 = current thread id =
90
                        ; next thread id
91
      BEQ
            no_thread_switch ; If yes, branch to no_thread_switch
92
    ; Setting current_task_addr
93
      MOV
            r0, #68
                          ; Else start thread switch. r0 = 68
      MUL
94
            r0, r2, r0
                               ; r0 = current thread id * 68
            r2, =process_control_block ; r2 = PCB bottom
95
      LDR
96
      ADD
            r0, r0, r2
                              ; r0 = PCB bottom + id * 68
            r2, =current_task_addr ; r2 = current task addr addr
97
      LDR
98
      STR
            r0, [r2]
                              ; current_task_addr = r0
    ; Setting next_task_addr
99
100
      MOV
            r0, #68
                             : r0 = 68
101
      MUL
            r0 , r1 , r0
                               ; r0 = next thread id * 68
            r2, =process_control_block; r2 = PCB_bottom
102
      LDR
                            ; r0 = PCB bottom + next id * 68
103
      ADD
            r0 , r2 , r0
104
      LDR
            r2, =next_task_addr ; r2 = next_task_addr addr
105
      STR
            r0 , [r2]
                       ; next_task_addr = r0
106
107
    ; Setting new current_thread_id
108
      LDR
            r0, =current_thread_id; r0 = current_thread_id
                       ; current_thread_id = next thread id
109
      STR
            r1 , [r0]
110
    ; Carry out process switch
111
112
    ; Reset and save IRQ stack
      LDR
            r0, =irq\_stack\_pointer; r0 = irq\_stack\_pointer addr
113
      MOV
114
            r1, sp
                      ; r1 = irq stack pointer
           r1, r1, \#5*4; r1 = irq stack pointer + 5 (\# of data in
115
      ADD
116
                     ; the stack, r0-r3, lr) * 4 (size of a word)
117
      STR
            r1 , [r0]
                              ; irq_stack_pointer = irq stack pointer
                         ; without the data that will be removed next
118
      LDMFD sp!, \{r0-r3, Ir\}; Restore the remaining registers
119
120
    ; Load and position r13 to point into current PCB
            r13, =current_task_addr; r13 = current task PCB bottom address
121
         address
                               ; r13 = current task PCB bottom address
122
      LDR
           r13 , [r13]
```

SUB r13, r13,#60 ; r13 = current task PCB bottom address -60

123

```
124
                                                     ; to point to the right place for the stacking
125
                                                     ; (next step)
126
         ; Store the current user registers in current PCB
                           r13, \{r0-r14\}^{\hat{}}
127
             STMIA
                                                                  ; Stacks the r0-r14 registers in the PCB
             MRS
                           r0, SPSR
128
                                                   ; r0 = status register
129
             STMDB r13, {r0,r14}
                                                                   ; Stacks r0 and r14
         ; Load and position r13 to point into next PCB
130
131
                         r13, =next_task_addr ; r13 = next task PCB bottom address
                    address
132
             LDR
                         r13 , [r13]
                                                                    ; r13 = next task PCB bottom address
             SUB r13, r13, \#60; r13 = next task PCB bottom address <math>-60
133
134
                                                     ; to point to the right place for the stacking
135
                                                     ; (next step)
         ; Load the next task \boldsymbol{and} setup \mathsf{PSR}
136
             LDMNEDB r13, \{r0, r14\}; Restore r0 and r14 (IRQ mode)
137
                              spsr_cxsf , r0
                                                                        ; Restore status register
138
             MSRNE
             LDMNEIA r13, \{r0-r14\}^{\hat{}}
                                                                             ; Restore r0-r14 for the user mode
139
                                                         ; NOP! (required for the above instruction)
140
141
         ; Load the IRQ stack into r13_irq
142
                           r13, =irq_stack_pointer; r13 = stack_pointer_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_address_add
             LDR
143
             LDR
                          r13 , [ r13 ]
                                                                ; Restore previous stack pointer
144
             В
                  return
                                                           ; Go to the end
145
146
         no_thread_switch
            LDMFD sp!, \{r0-r3, lr\}; Restore the remaining registers
147
148
149
         return
             SUBS
                               pc, r14, \#4; Process counter = IRQ mode link register - 4
150
151
                                                   ; (-4 \text{ is required } \mathbf{for} \text{ the pipeline})
152
153
             ; Data area
            AREA irq_vars, DATA
154
155
156
        IRQStatus ; IRQ interrupt type address
157
           DCD 0×03ff4004
158
         Angel_IRQ_Address ; Reserved space for the Angel IRQ Interrupt address
            DCD 0×00000000
159
         160
           DCD 0x0
161
         current_task_addr : Address of the PCB for the current Task
162
163
          DCD 0x0
164
        next_task_addr
                                                  ; Address of the PCB for the next Task
165
            DCD 0x0
```

```
166
    irq_stack_pointer ; Copy of the IRQ stack
167
      DCD 0x0
    process\_control\_block; PCB for all the tasks (each size = 68) Offsets =
168
       bottom +
169
      % 612
                 ; 68 * process#
170
    thread_array
                     ; Thread status array, where each thread has one word to
      % 36
                 ; if it is active (1) or inactive (0). Offset = bottom + 4 *
171
         thread#
172
173
      ; End of assembly code
174
      END
```

#### A.10 interrupt/handler\_swi.s

```
; Software interrupt handling code
1
2
3
     IMPORT routine_fork
     IMPORT routine_exec
4
     IMPORT routine_exit
5
6
7
     EXPORT
            Angel_SWI_Address
     EXPORT
             handler_swi
8
9
10
     ; Beginning handler code
     AREA handler, CODE
11
12
   ; Software interruption routine handler
13
14
   handler_swi
15
     STMFD
             sp!, \{r0-r12, lr\}; Stack registers r0-12 and link register
          r0,[1r,\#-4]
                        ; Calculate address of SWI instruction (r0 = Ir
16
     BIC r0, r0, \#0 \times ff000000; Mask off top 8 bits of instruction to give
17
        SWI
18
                      ; number
           r1, Angel_SWI_Number; r1 = Angel SWI Number
19
     LDR
20
     CMP
           r0, r1
                            ; Compare SWI number to angel interrupt number
     BEQ
                              ; If it is angel interrupt, branch to goto\_angel
21
           goto_angel
           r1 , \#0
22
     MOV
                            ; r1 = 0
23
     CMP
           r0, r1
                            ; Compare SWI number to r1
24
     BEQ
                            ; If it is OS SWI, branch to os_swi
           os_swi
```

```
25
26
   ; Go to Angel routine
27
   goto_angel
     LDMFD sp!, \{r0-r12, lr\}; Restore registers r0-r12 and link register
28
29
     LDR
            pc, Angel_SWI_Address; Branch to the Angel
30
31
   ; Operating system SWI handler, identify the routine
32
   os_swi
33
     LDMFD sp!, \{r0-r12, lr\}; Restore r0-r12 registers and link registers
34
             sp!, \{r0-r12, lr\}; and stores them again (in order to clean the
         registers)
35
     MOV
            r1, #0
                         ; r1 = 0
     CMP
            r0 , r1
                          ; Compare the first parameter to 0
36
37
     BEQ
            pre_routine_fork ; If it is equal, branch to the fork
                         ; r1 = 1
38
     MOV
           r1, #1
     CMP
            r0, r1
                          ; Compare the first parameter to 1
39
40
     BEQ
            pre_routine_exec ; If it is equal, branch to the exec
41
     MOV
           r1, #2
                          ; r1 = 2
42
     CMP
           r0 , r1
                         ; Compare the first parameter to 2
            pre_routine_exit; If it is equal, branch to the exit
43
     BEQ
44
     LDMFD sp!, \{r0-r12, pc\}^{\circ}; If it is an unidentified syscall, go back to
         the program,
                    ; restoring the registers and putting the return address in
45
                    ; the process counter
46
47
   ; Fork caller
48
49
   pre_routine_fork
     LDMFD sp!,\{r0-r12, lr\}; Restore r0-r12 registers and link registers
50
     STMFD sp!, \{r0-r12, lr\}; and stores them again (in order to clean the
51
         registers)
     B routine_fork ; Branch to the fork C routine
52
53
54
   ; Exec caller
   pre_routine_exec
55
     LDMFD sp!, \{r0-r12, lr\}; Restore r0-r12 registers and link registers
56
              sp!, \{r0-r12, lr\}; and stores them again (in order to clean the
57
         registers)
     B routine_exec ; Branch to the exec C routine
58
59
60
   ; Exit caller
61
   pre_routine_exit
62
    LDMFD sp!,\{r0-r12, lr\}; Restore r0-r12 registers and link registers
```

```
63
              sp!, \{r0-r12, lr\}; and stores them again (in order to clean the
     STMFD
         registers)
64
     B routine_exit
                       ; Branch to the exit C routine
65
66
     ; Data area
67
     AREA swi_vars, DATA
68
69
   Angel_SWI_Number
                         ; Identification number for the Angel SWI
70
       DCD 0x00123456
71
   Angel_SWI_Address
                        ; Reserved space for the Angel SWI Interrupt address
       DCD 0x00000000
72
73
74
     ; End of assembly code
     END
75
```

#### A.11 interrupt/irq.h

```
#include "timer.h"

void install_handler (unsigned handler_routine_address, unsigned *
    vector_address);
```

## A.12 interrupt/irq.c

```
/* C functions for hardware interruptions */
1
  #include "irq.h"
3
   /* Reserved spaces where the Angel IRQ/SWI addressess will be stored */
5
               Angel_IRQ_Address;
   extern int
7
   extern int
               Angel_SWI_Address;
8
   /* Installs a handler branch on the interrupt vector */
   void install_handler (unsigned handler_routine_address , unsigned *
10
       vector_address) {
11
     /st Case it is running in the emulator or without angel st/
12
13
     if (emulator = 1 \mid \mid emulator = 2) {
       /* The instruction that will be put in the IRQ vector */
14
       unsigned branch_to_handler_instruction;
15
```

```
16
       /* Handler relative address */
       unsigned offset;
17
       /* -0x8 due to the pipeline, >> 2 due to the word alignment */
18
       offset = ((handler_routine_address - (unsigned)vector_address - 0x8) >>
19
            2);
20
       /* Add to the address, the branch instruction */
       branch_to_handler_instruction = 0xea000000 | offset;
21
22
       /* Put the instruction in the vector */
23
       *vector_address = branch_to_handler_instruction;
24
25
     /* Case it is running with the angel */
26
     else {
       /* Angel branch instruction */
27
28
       unsigned Angel_branch_instruction;
29
       /* Angel instruction */
       unsigned *Angel_address;
30
31
       /* Getting Angel branch instruction */
       Angel_branch_instruction = *vector_address;
32
33
         /* Separate the instruction from the address */
       Angel_branch_instruction ^= 0xe59ff000;
34
       /* Calculating absolute address */
35
36
       Angel\_address = (unsigned *) ((unsigned) vector\_address +
           Angel_branch_instruction + 0x8);
       /* Store address in the propoer position */
37
       if ((unsigned) vector_address == 0x18) {
38
         Angel_IRQ_Address = *Angel_address;
39
40
       }
41
       else {
42
         Angel_SWI_Address = *Angel_address;
43
       /* Inserting handler instruction in the vector table */
44
         *Angel_address = handler_routine_address;
45
46
     }
47
```

## A.13 interrupt/swi.h

```
#include "constants.h"

typedef void (*pt2Task)(int);
```

```
5  __swi(OS_SWI) int syscall(int, int, pt2Task, int);
6
7  int fork (void);
8  void exec (int, pt2Task, int);
9  void exit (int);
```

### A.14 interrupt/swi.c

```
#include "swi.h"
3
   extern void routine_fork(void);
   extern void routine_exec(void);
5
   extern void routine_exit(void);
6
   int fork(){
7
     int pid = 0;
8
9
      pid = syscall(0, 0, 0, 0);
10
     return pid;
11
   }
12
13
   void exec(int process_id , pt2Task process_addr , int arg1){
      syscall(1, process_id, process_addr, arg1);
14
   }
15
16
17
   void exit(int process_id){
      syscall(2, process_id, 0, 0);
18
19
```

# A.15 mutex/mutex.h

```
#define WAIT     while (semaphore==1) {} mutex_gatelock();

#define SIGNAL     mutex_gateunlock();

extern unsigned volatile int semaphore; // do not access directly

void mutex_gatelock (void);

void mutex_gateunlock (void);
```

#### A.16 mutex/mutex.c

```
unsigned volatile int semaphore = 2; // this is a start value
1
2
3
   void mutex_gatelock (void) {
4
      __asm {
5
        spin:
6
        mov
               r1, &semaphore
7
               r2, #1
        mov
               r3, r2, [r1]
8
        swp
9
               r3, \#1
        cmp
10
               spin
        beq
11
12
   }
13
   void mutex_gateunlock (void) {
14
15
      __asm
               r1, &semaphore
16
        mov
               r2, #0
17
        mov
               r0, r2, [r1]
18
        swp
19
      }
20
```

## A.17 peripherals/button.h

```
#include "constants.h"

void button_init (void);

void button_irq (void);
```

## A.18 peripherals/button.c

```
/* This file contains routines to initialize and handle button
    interruptions */

#include "button.h"

/* Initializes the button */
void button_init (void) {
    /* Force global disable off */
```

```
8
     *(volatile int*) Evaluator IRQ Timer Control &= ((1 << 21) | (1 << 10) |
         (1 << 0));
     /* Enable int0 */
9
     *(unsigned *)IRQButtonControl |= 1 << 4;
10
     /* Set as active high */
11
12
     *(unsigned *)IRQButtonControl |= 1 << 3;
     /* Allow for rising edge */
13
     *(unsigned *) | RQButtonControl |= 1;
14
15
   }
16
17
   /* Handles a button interruption */
18
   void button_irq (void) {
19
     *(unsigned *) IRQStatus |= 1;
20
21
     /* Do something */
22
23
```

### A.19 peripherals/dips.h

```
#include "constants.h"

unsigned dips_read (void);
```

### A.20 peripherals/dips.c

```
/* This file contains routines to initialize and handle DIPS interruptions
1
      */
2
   #include "dips.h"
4
   /* Return the value of the dip switches */
6
   unsigned dips_read (void)
7
     /* 0xf = switch mask */
8
9
     return 0XF & *IOData;
10
   }
```

#### A.21 peripherals/led.h

```
/* LED changing functions */
2
   #define LEDBANK
                      *((unsigned *)0x03ff5008)
3
4
   #define LED_4_ON
                        (LEDBANK=LEDBANK | 0 × 00000010)
5
  #define LED_3_ON
                     (LEDBANK=LEDBANK | 0 × 00000020)
6
  #define LED_2_ON (LEDBANK=LEDBANK|0x00000040)
7
  #define LED_1_ON (LEDBANK=LEDBANK|0x00000080)
  #define LED_4_OFF (LEDBANK=LEDBANK&~0×00000010)
10 |#define LED_3_OFF (LEDBANK=LEDBANK&~0×00000020)
11 |#define LED_2_OFF (LEDBANK=LEDBANK&~0×00000040)
12 |#define LED_1_OFF (LEDBANK=LEDBANK&~0×00000080)
```

#### A.22 peripherals/segment.h

```
#include "constants.h"

void segment_init (void);

void segment_set (int seg);
```

## A.23 peripherals/segment.c

```
/* This file contains routines to initialize and handle the 7 segment
       display */
   #include "segment.h"
3
4
   /* Calculates the proper display addresses value according to the number */
5
   static unsigned int numeric_display [16] = {
6
     DISP_0,
7
      DISP_1,
8
9
     DISP_2,
      DISP_3,
10
     DISP_4,
11
     DISP_5,
12
13
      DISP_6,
      DISP_7,
14
      DISP<sub>8</sub>,
15
```

```
16
      DISP_9,
17
      DISP_A,
      DISP_B,
18
      DISP_C,
19
      DISP_D,
20
21
      DISP_E,
22
      DISP_F
   };
23
24
25
   /* Set number on the display */
   void segment_set (int seg) {
26
27
      if ( seg >= 0 \& seg <= 0xf ) {
        *IOData &= ~Segment_mask;
28
        *IOData
                 |= numeric_display[seg];
29
     }
30
   }
31
32
33
   /* Initialize 7—segment display */
34
   void segment_init (void) {
     *IOPMod |= Segment_mask;
35
      *IOData |= Segment_mask;
36
37
```

## A.24 peripherals/serial.h

```
1
2
3
       ARM Strategic Support Group
4
5
6
7
8
9
10
       Module
                 : serial.h
        Description: simple code to drive the serial port on the
11
                Evaluator7T.
12
        Tool Chain : ARM Developer Suite 1.0
13
       Platform : Evaluator7T
14
15
       History
16
```

```
2000-3-29 Andrew N. Sloss
17
18
      - started serial module
19
20
   *******************
21
22
  /************************
23
  * IMPORT
24
  ******************
25
26
  // none . . .
27
28
29
  * MACROS
  *******************
30
31
 #define BAUD_9600
32
              (162 << 4)
33
 #define COM1_DEBUG
34
                (1)
 #define COM0_USER
               (0)
36
37
  38
  * DATATYPES
39
  ******************
40
41
  // none...
42
43
44
  * STATICS
45
  46
47
  // none...
48
49
  /***********************
  * ROUTINES
50
51
52
53
  /* -- serial_initcomOuser ----
54
  * Description : initializes the USER/COMO serial port.
55
56
57
  * Parameters : unsigned baudrate - baudrate i.e. 9600
58
  * Return
          : none...
59
  * Notes
          : none...
```

```
60
61
    */
62
    void serial_initcomOuser (unsigned baudrate);
63
64
65
    /* -- serial_initcom1debug --
66
67
     * Description : initializes the DEBUG/COM1 serial port.
68
69
     * Parameters : unsigned baudrate - baudrate i.e. 9600
70
     * Return : none...
71
     * Notes : none...
72
73
    */
74
    void serial_initcom1debug (unsigned baudrate);
75
76
77
    /* -- serial_print ---
78
79
     * Description : print out a string through the com port
80
81
     * Parameters : unsigned port — USER/DEBUG
     * : char *s - string to be printed out.
82
83
     * Return : none...
     * Notes : none...
84
85
86
     */
87
88
    void serial_print (unsigned port, char *s);
89
90
    /* -- serial_getkey ---
91
     * Description : standard implementation of getkey.
92
93
     * Parameters : none . . .
95
     * Return : none...
     * Notes
96
97
98
         waits until a key is pressed then echo's back.
99
100
     */
101
102 | void serial_getkey (void);
```

## A.25 peripherals/serial.c

```
1
2
3
   * ARM Strategic Support Group
4
5
6
7
   8
9
      Module
              : serial.c
      Description: simple code to drive the serial port on the
10
11
             Evaluator7T.
      Tool Chain : ARM Developer Suite 1.0
12
      Platform : Evaluator7T
13
      History
14
15
        2000-3-29 Andrew N. Sloss
16
        - started serial module
17
18
19
20
21
22
   * IMPORT
23
   ************************
24
25
  // none...
26
27
28
   * MACROS
29
30
31 #define SYSCFG
                  (0 \times 03 ff 0000)
```

```
#define UARTO_BASE (SYSCFG + 0×D000)
32
   #define UART1_BASE (SYSCFG + 0×E000)
33
34
35
   /*
36
    * Serial settings.....
37
38
  #define ULCON 0x00
39
  #define UCON 0x04
40
41 #define USTAT 0x08
42 #define UTXBUF 0x0C
43 #define URXBUF 0×10
  #define UBRDIV 0x14
44
45
46
   /*
    * Line control register bits.....
47
48
    */
49
50
  #define ULCR8bits
                       (3)
  #define ULCRS1StopBit (0)
51
  #define ULCRNoParity (0)
52
53
54
   /*
    * UART Control Register bits.....
55
    */
56
57
  #define
             UCRR \times M (1)
59 #define
             UCRR×SI (1 << 2)
60 #define
             UCRTxM (1 \ll 3)
  #define
             UCRLPB (1 \ll 7)
61
62
63
    * UART Status Register bits
64
65
    */
66
67 #define USROverrun
                           (1 << 0)
68 #define USRParity
                           (1 << 1)
  #define USRFraming
                           (1 << 2)
69
  #define USRBreak
                           (1 << 3)
71 #define USRDTR
                       (1 << 4)
72 #define USRRxData
                           (1 << 5)
73 #define USRTxHoldEmpty (1 << 6)
74 #define USRTxEmpty
                           (1 << 7)
```

```
75
76
     /* default baud rate value */
77
    #define BAUD_9600
                          (162 << 4)
78
79
80
    // UART registers are on word aligned, D8
81
82
    /* UART primitives */
83
84
   #define GET_STATUS(p) (*(volatile unsigned
                                                  *)((p) + USTAT))
    #define RX_DATA(s)
                             ((s) & USRR×Data)
86
   #define GET_CHAR(p)
                           (*(volatile unsigned *)((p) + URXBUF))
    #define TX_READY(s)
                             ((s) & USRTxHoldEmpty)
87
    #define PUT_CHAR(p,c) (*(unsigned *)((p) + UTXBUF) = (unsigned )(c))
88
89
    #define COM1_DEBUG (1)
90
   #define COMO_USER (0)
91
92
93
    /* -- serial_init -
94
     * Description : wait until a key is press from the host PC.
95
96
97
     * Parameters : unsigned int port — com port either USER/DEBUG
               : unsigned int baud — baud rate i.e. 9600
98
99
     * Return
                 : none . . .
100
     * Notes
                 : none . . .
101
102
     */
103
104
    void serial_init (unsigned int port, unsigned int baud)
105
    {
106
       /* Disable interrupts */
107
       *(volatile unsigned *) (port + UCON) = 0;
108
109
       /* Set port for 8 bit, one stop, no parity */
       *(volatile unsigned *) (port + ULCON) = (ULCR8bits);
110
111
       /* Enable interrupt operation on UART */
112
       *(volatile unsigned *) (port + UCON) = UCRRxM | UCRTxM;
113
114
115
       /* Set baud rate */
116
       *(volatile unsigned *) (port + UBRDIV) = baud;
117
```

```
118 | }
119
    /* -- serial_initcomOuser --
120
121
122
     * Description : initializes the USER/COMO serial port.
123
124
     * Parameters: unsigned baudrate - baudrate i.e. 9600
125
     * Return
                 : none...
126
     * Notes
                : none...
127
128
     */
129
    void serial_initcomOuser (unsigned baudrate)
130
131
      serial_init (UART0_BASE, baudrate);
132
    }
133
134
    /* -- serial_initcom1debug --
135
136
     * Description : initializes the DEBUG/COM1 serial port.
137
138
139
     * Parameters : unsigned baudrate - baudrate i.e. 9600
140
     * Return
               : none...
141
     * Notes
                : none...
142
143
     */
144
    void serial_initcom1debug (unsigned baudrate)
145
146
    { serial_init (UART1_BASE, baudrate); }
147
    /* -- serial_print -
148
149
150
     * Description : print out a string through the com port
151
152
     * Parameters : unsigned port — USER/DEBUG
              : char *s - string to be printed out.
153
154
     * Return : none...
     * Notes
155
                : none...
156
157
     */
158
159
    void serial_print (unsigned port, char *s)
160
    {
```

```
161
       while ( *s != 0 ) {
162
         switch (port) {
         case COM0_USER:
163
164
         while ( TX_READY(GET_STATUS(UART0_BASE))==0);
        PUT_CHAR(UART0_BASE,*s++);
165
166
         break;
         case COM1_DEBUG:
167
168
         while ( TX_READY(GET_STATUS(UART1_BASE))==0);
           PUT_CHAR(UART1_BASE, * s++);
169
170
         break;
171
         }
172
      }
173
    }
174
    /* -- serial_getkey -
175
176
177
     * Description : standard implementation of getkey.
178
179
     * Parameters : none . . .
180
     * Return
                 : none...
181
     * Notes
                 :
182
183
             waits until a key is pressed then echo's back.
184
185
     */
186
187
    void serial_getkey (void)
188
    {
189
      char c;
190
191
       while ( (RX_DATA(GET_STATUS(UART0_BASE)))==0 )
192
      {
193
194
       };
195
196
       c = GET_CHAR(UART0_BASE);
197
       while ( TX_READY(GET_STATUS(UART0_BASE))==0);
198
199
      PUT_CHAR(UART0_BASE, c);
    }
200
201
202
203
```

```
/* -- serial_getkey -
204
205
     * Description : standard implementation of getkey.
206
207
     * Parameters : none . . .
208
209
     * Return
              : none...
210
     * Notes
211
212
           waits until a key is pressed then echo's back.
213
214
     */
215
216
    char serial_getcmd (void)
217
218
      char c:
219
      while ( (RX_DATA(GET_STATUS(UART0_BASE)))==0 )
220
221
222
223
      };
224
225
      c = GET_CHAR(UART0_BASE);
226
      while ( TX_READY(GET_STATUS(UART0_BASE))==0);
227
       PUT_CHAR(UART0_BASE, c);
228
229
230
      return c;
231
    }
232
233
234
     * END OF serial.c
235
     236
```

## A.26 peripherals/timer.h

```
#include "constants.h"

void timer_init (void);

void timer_irq (void);

void timer_start (void);
```

#### A.27 peripherals/timer.c

```
/* This file contains routines to initialize and handle timer interruptions
        */
2
3
   #include "timer.h"
4
   /* Initiate timer settings */
5
   void timer_init (void) {
6
7
     /* Case it's from the emulator */
     if (emulator = 1) {
8
       /* Clear/disable all interrupts */
9
          *IRQEnableClear = ~0;
10
       /* Disable counters by clearing the control bytes */
11
          *EmulatorIRQTimerControl = 0;
12
       /* Clear counter/timer interrupts */
13
14
          *IRQTimerClear = 0;
15
     /* Case it's the board */
16
17
      else {
       /* Disable interrupt */
18
        *TimerEnableSet = 0;
19
20
        /* Clear pending interrupts */
          *IRQStatus = 0x00000000;
21
22
     }
23
   }
24
   /* Restart timer interrupt */
25
   void timer_irq(void) {
26
27
      if (emulator = 1) {
       /* Clear the interrupt */
28
        *IRQTimerClear = 0;
29
30
     }
     else {
31
        /* Clear pending interrupts */
32
33
        *IRQStatus = 1 << 10;
        /* Load counter values */
34
        *EvaluatorIRQTimerLoad = COUNTDOWN;
35
        /* Unmask the interrupt source */
36
        *(volatile int*) Evaluator IRQ Timer Control &= ((1 << 21) \mid (1 << 10) \mid
37
           (1 << 0));
38
     }
39 | }
```

```
40
41
   /* Start timer */
   void timer_start (void) {
42
     if (emulator = 1) {
43
       /* Load counter values */
44
45
          *EmulatorIRQTimerLoad = COUNTDOWN;
       /* Enable the Timer | Periodic Timer producing interrupt | Set Maximum
46
           Prescale - 8 bits */
       *EmulatorIRQTimerControl = (0x80 \mid 0x40 \mid 0x08);
47
48
       /* Enable interrupt */
          *IRQEnableSet = IRQTimer;
49
50
51
       else {
       /* Load counter values */
52
          *EvaluatorIRQTimerLoad = COUNTDOWN;
53
       /* Enable interrupt */
54
          *TimerEnableSet = 0x1;
55
       /* Unmask the interrupt source */
56
57
          *(volatile int*) Evaluator IRQ Timer Control &= ((1 << 21) | (1 << 10) |
              (1 << 0);
     }
58
59
   }
```

### A.28 syscalls/exec.s

```
1
   ; Exec system call
2
     EXPORT routine_exec
3
4
5
     IMPORT process_control_block
7
     ; Beginning fork code
     AREA exec, CODE
8
   ; From the call of the function: r1 = task id, r2 = task address
10
11
   routine_exec
12
   ; Store variables
              sp!, \{r0-r12, Ir\}; Push r0-12 in the stack
13
14
15
     MOV
            r6, r3
                               ; r6 = value of the first argument
16
```

```
17
   ; Put the task address in task_pcb_address - 4 (Process counter)
18
19
     MOV
                             ; r0 = task address
           r0 , r2
     ADD
           r0 , r0 , #4
                           ; r0 = task address + 4 (+4 due to the pipeline
20
      )
21
     LDR
           r3, =process_control_block; r3 = PCB bottom
                             ; r4 = 68
22
     MOV
           r4, #68
23
     MUL
           r5 , r1 , r4
                               ; r5 = (task id) * 68
24
     ADD
           r3 , r3 , r5
                              ; r3 = PCB bottom + (task id) * 68
25
     SUB
           r3 , r3 , #4
                               ; r3 = r3 - 4
     STR
           r0 , [r3]
                             MEM[r3] = r0
26
27
   ; Set up user stack for the task
28
29
     SUB
           r3 , r3 , #4
                              ; r3 = r3 - 4 (stack pointer)
           r4, #0x20000
     MOV
                            : r4 = SP\_USER\_BOTTOM
30
31
   loop
32
     SUB
           r1 , r1 , #1
                              ; r1 = task id - 1
     CMP
           r1 , #0
                             ; r1 = 0 ?
33
34
     BEQ
           end_loop
                            ; if equal, end_loop
     SUB r4, r4, \#4048 ; r0 = r4 - 4048 (next stack)
35
36
     B loop
                   ; Go to next stack
37
   end_loop
     STR r0, [r3]; MEM[r3] = r4 (the process stack pointer)
38
39
   ; Set up the r0
40
     SUB r3, r3, #52
                             ; r3 = r3 - 52
41
     STR r6,[r3]
42
43
44
   ; Set up link register
     SUB
                             ; r3 = r3 - 4 (link register)
45
           r3 , r3 , #4
46
     MOV
           r0 , r2
                            ; r0 = task address
     ADD
           r0 , r0 , #4
                               ; r0 = r0 - 4
47
     STR
                             ; MEM[r3] = r0
48
           r0 , [r3]
49
50
   ; Set up SPSR
           r3 , r3 , #4
51
     SUB
                              ; r3 = r3 - 4
                              ; r0 = 0 \times 10 (user mode)
     MOV
          \mathsf{r0} , \#\mathsf{0}{	imes}\mathsf{10}
52
     STR
                         ; MEM[r3] = r0
53
         r0 , [r3]
54
   ; Return
55
     LDMFD sp!, \{r0-r12,pc\}^{\hat{}}; Pop r0-r12 and link register to process counter
56
57
    ; End of assembly code
```

### A.29 syscalls/exit.s

```
; Exec system call
2
     EXPORT routine_exit
3
4
     IMPORT thread_array
5
6
7
     ; Beginning fork code
     AREA exit, CODE
8
9
   ; r1 comes as task id
10
11
   routine_exit
12
     STMFD sp!,\{r0-r12, Ir\}; save registers
                           ; r2 = task id
     MOV
           r2, r1
13
     LDR
           r0 , =thread_array ; r0 = thread_array
14
15
     MOV
           r1, #0
                           ; r1 is the state value = inactive
     SUB
           r2 , r2 , #1
                             ; r2 = task id - 1
16
           r3, #4
     MOV
                           ; r3 = 4
17
                           ; r4 = (task id - 1) * 4
           r4 , r2 , r3
18
     MUL
19
     ADD
           r4 , r0 , r4
                             ; r4 = thread_array + (task id - 1) * 4
20
     STR
           r1, [r4] ; Mem[r4] = r1 (inactive)
21
22
     LDMFD sp!,\{r0-r12,pc\}^{\hat{}}; return
23
24
     ; End of assembly code
25
     END
```

# A.30 syscalls/fork.s

```
; Fork system call
1
2
3
    IMPORT
            thread_array
    IMPORT
             process_control_block
4
5
    IMPORT
            current_thread_id
6
7
    EXPORT routine_fork
8
```

```
; Beginning fork code
     AREA fork, CODE
10
11
   ; Routine to duplicate a process code
12
    routine_fork
13
14
   ; Stacks current state twice
              sp!, \{r1-r12, lr\} \hspace{0.5cm} ; \hspace{0.5cm} Stacks \hspace{0.5cm} the \hspace{0.5cm} link \hspace{0.5cm} \textbf{register} \hspace{0.5cm} \textbf{and} \hspace{0.5cm} r1-r12
15
              sp!, \{ \, r0 - r12 \, \} \qquad ; \quad Stacks \quad r0 - r12 \,
     STMFD
16
17
     STMFD
              sp!,{Ir}; Stacks the link register (In a separate
         instruction
18
                     ; to stack it in the top)
19
20
   ; Finds the first available space in the process table (return id in r0 and
        its address in r1)
21
     LDR
            r1, =thread_array; r1 = bottom of the thread array address
22
     MOV
            r0 , #1
                           ; r0 = 1
23
   routine_fork_loop
24
     LDR
            r2 , [r1]
                           ; r2 = thread array position
25
     CMP
            r2, #0
                           r2 = 0?
     BEQ
            pcb_bottom ; If the position is available (r2 = 0), go to
26
         pcb_bottom
27
     ADD
            r0 , r0 , #1
                            ; r0 = r0 + 1 (next id)
28
     CMP
            r0, #9
                            ; Is this the last thread slot being checked?
29
     BEQ
            fork_fail
                          ; if it is, there is no available slot, go to
         fork_fail
            r1, r1, \#4; r1 = r1 + 4 (next address)
30
     ADD
31
     B routine_fork_loop; Check next slot (go to routine_fork_loop)
32
33
    ; Get the PCB bottom of the new process (return it in r2)
34
    pcb_bottom
35
     LDR
            r2, =process_control_block; r2 = pcb_bottom
            r3, #68
     MOV
                                ; r3 = 68
36
            r3 , r0 , r3
                                  ; r3 = 68 * available thread id
37
     MUL
38
     ADD
            r2, r2, r3
                               ; r2 = pcb bottom + (thread id * 68)
39
    ; Retrieves user mode stack pointer (returns it in r3)
40
            r13, r13, \#4 ; Opens a space in the stack
41
     SUB
42
     STMIA r13, \{r13\}^{\hat{}}; Store user mode stack pointer in the SVC stack
43
                    ; No operation (necessary for the above instruction)
     LDMFD sp!,\{r3\}; r3 = user mode stack pointer
44
45
   ; Retrieves user mode stack base (returns in r4)
46
     MOV r4, \#0 \times 20000 ; r4 = 0 \times 20000 (User mode stack pointer base)
```

```
48
     MOV
           r6, #4048
                           ; r6 = 4048 (Distance between each thread stack)
           r5, =current_thread_id; r5 = current thread id address
49
     LDR
50
     LDR
           r5, [r5]
                            ; r5 = current thread id
     SUB
           r5, r5, #1
                              ; r5 = current thread id - 1
51
     MUL
                             ; r6 = (current thread id - 1) * 4048
52
           r6, r5, r6
53
     SUB
           r4, r4, r6
                             ; r4 = 0 \times 20000 - (current thread id - 1) * 4048
54
                      ; (this is the base of the current thread stack)
55
56
   ; Retrieves new thread stack base (returns in r5)
57
     MOV
           r5, \#0x20000; r5 = 0x20000 (User mode stack pointer base)
     MOV
                      ; r6 = 4048 (Distance between each thread stack)
58
           r6, #4048
59
     SUB
           r7, r0, #1
                         ; r7 = \mathbf{new} thread id -1
     MUL
                         ; r6 = (new thread id - 1) * 4048
           r6, r7, r6
60
     SUB
                         ; r5 = 0 \times 20000 - ((new thread id - 1) * 4048)
61
           r5, r5, r6
62
   ; Duplicates stack
63
   loop_stack_copy
64
                         ; r6 = original stack data
65
     LDR
           r6 , [r4]
66
     STR
           r6 , [r5]
                         ; Stores data in new stack (stack_top = r6)
     CMP
           r4, r3
                         ; Is this the top of the stack? (r4 = r3?)
67
           build_new_pcb ; if it is, branch to build_new_pcb
68
     BEQ
69
     SUB
           r5 , r5 , #4
                           ; if not, go to next space in the new stack (r5 =
         r5 - 4)
     SUB
           r4, r4, \#4; and next data in the original stack (r4 = r4 - 4)
70
        loop_stack_copy ; restart sequence (go to loop_stack_copy)
71
72
73
   build_new_pcb
   ; Store SPSR
74
75
     SUB
           r2, r2, \#68; r2 = r2 - 68 (r2 = PCB[-68] address)
76
     MOV
           r3, \#0x10 ; r3 = \#0x10 (User mode)
77
     STR
           r3, [r2] ; PCB[-68] = #0x10
78
79
   ; Store stack pointer
           r2, r2, \#60; r2 = r2 + 60 (r2 = PCB[-8] address)
80
     ADD
81
     STR
           r5, [r2]; PCB[-8] = new stack pointer
82
   ; Stores r14 and LR
83
           r2, r2, \#4; r2 = r2 + 4 (r2 = PCB[-4] address)
84
     ADD
     LDMFD sp!, \{r3\}; Restore link register from the stack to r3
85
           r3, r3, \#4; r3 = r3 + 4 (due to the pipeline)
     ADD
86
           r3, [r2] ; PCB[-4] = return address
87
     STR
88
     SUB
           r2, r2, \#60; r2 = r2 - 60 (r2 = PCB[-64] address)
89
     STR
           r3, [r2] ; PCB[-64] = return address
```

```
90
91
    ; Copy registers
      MOV
            r3, #0
                     ; r3 = 0
92
      MOV
            r4, #12
                     ; r4 = 12
93
    registers_loop
94
95
      ADD
            r2, r2, #4
                         ; r2 = r2 + 4 (Next PCB register space)
      LDMFD sp!, \{r5\}; Restore register from the stack to r5
96
97
      STR
            r5 , [r2]
                       ; Store register in the PCB
98
      CMP
            r3, r4
                   ; r12 was copied? (r3 = r4?)
99
      BEQ
            enable_thread; If yes, go to enable_thread
      ADD
            r3, r3, #1; r3 = r3 + 1 (Next register)
100
101
      B registers_loop ; Copy next register
102
103
    ; Enable thread in the thread vector
    enable_thread
104
105
      MOV
            r2 , \#1
                         ; r2 = 1
106
      STR
            r2 , [r1]
                         ; New process in thread array = 1
107
      LDMFD sp!, \{r1-r12, pc\}^{\hat{}}; Restore all the registers but r0
108
                   ; (it contains the new process id)
109
110
    ; Case when there is no thread space
111
    fork_fail
      LDMFD sp!, {|r|}; Restore link register
112
      LDMFD sp!, \{r0-r12\}; Restore r0-r12
113
114
      LDMFD sp!, \{r1-r12\}; Restore r1-r12
115
      MOV
          r0, \#0xFFFFFFFFF; r0 = -1 (r0 is the return value)
116
      LDMFD sp!, {pc}^ ; Restore return address to the process counter
117
118
      ; End of assembly code
      END
119
```