I Name some characteristics of the instructions sets: SSE, AVX(2) and AVX-512.

|  |  |  |  |
| --- | --- | --- | --- |
|  | Vector Length | Year | Registers |
| SSE | 128 bit | 1999 | Xmm0 – xmm 15 |
| AVX(2) | 256 bit | 2013 | Ymm0 – ymm 15 |
| AVX-512 | 512 bit | 2017 | Zmm0 – zmm31 |

I How can memory aliasing affect performance?

Wenn man dem compiler nicht „sagt“, dass bei zwei übergebenen pointer(oder Referenzen) garantiert kein memory aliasing auftritt, dann optimiert dieser schlechter, da er automatisch annimmt, dass memory aliasing auftreten wird. Es werden in diesem Fall nur „safe optimizations“ durchgeführt.

Lösung ist z.B. das restrict keyword

I What are the advantages of unit stride (stride-1) memory access compared to accessing memory with larger strides (for example, stride-8)?

Bei einem stride von 1 lesen wir jedes Element der cache-line, nutzen also jedes Laden in den cache besser aus, als höhere strides. Wir nutzen also die Bandbreite besser aus.

Vektorisierung wird auch bei höheren strides langsamer, da wir mehr Gather Befehle brauchen.

I When would you prefer arranging records in memory as a Structure of Arrays?

Wenn wir eine Operation auf bestimmten structure instances ausführen wollen, also z.B. über alle x-koordinaten, während y und z egal sind. Hierbei ist SoA schneller, da wir mit einer stride Länge von 1 arbeiten können.

Wenn wir AoS im gleichen Beispiel benutzen würden, bräuchten wir stride-3.