Análise de desempenho das técnicas de vetorização, predicação e loads não temporais em processadores Skylake
Este trabalho avalia o desempenho, em termos de tempo de execução, de três técnicas de otimização de código. Embora as técnicas de vetorização de instruções e predicação demonstrem uma redução nesse tempo em cada benchmark proposto, a técnica de load não temporal, ao contrário do esperado, teve um desempenho inferior quando comparado com o modelo base proposto.
Este repositório faz parte de um trabalho científico publicado na XXI Escola Regional de Alto Desempenho da Região Sul (ERAD). O trabalho pode ser acessado neste link.
O projeto foi desenvolvido durante uma Iniciação Científica desenvolvida no laboratório HiPES (High Performance and Efficient Systems) da UFPR. A estrutura do projeto foi feita majoritamente em C, tendo os seus testes de execução automatizados utilizando Shell Script.