Add vectorized packing for FP16 and BF16 for RISC-V. Reactivate vector packing for FP64 transposed #5465

ChipKerchner · 2025-09-26T15:20:32Z

Add vectorized packing for FP16 and BF16 - up to a 3X improvement.

Reactivate vector packing for FP64 transposed - turned out slowdown in previous MR was from use of vector load/store segment (which is slow on some platforms for FP64).

…or FP64 transposed.

ChipKerchner · 2025-09-26T15:22:16Z

#5457

Add vectorized packing for FP16 and BF16. Reactivate vector packing f…

07d0e74

…or FP64 transposed.

ChipKerchner changed the title ~~Add vectorized packing for FP16 and BF16. Reactivate vector packing for FP64 transposed~~ Add vectorized packing for FP16 and BF16 for RISC-V. Reactivate vector packing for FP64 transposed Sep 26, 2025

martin-frbg added this to the 0.3.31 milestone Sep 30, 2025

martin-frbg merged commit aaa5c37 into OpenMathLib:develop Sep 30, 2025
84 of 88 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Add vectorized packing for FP16 and BF16 for RISC-V. Reactivate vector packing for FP64 transposed #5465

Add vectorized packing for FP16 and BF16 for RISC-V. Reactivate vector packing for FP64 transposed #5465

Uh oh!

ChipKerchner commented Sep 26, 2025

Uh oh!

ChipKerchner commented Sep 26, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Add vectorized packing for FP16 and BF16 for RISC-V. Reactivate vector packing for FP64 transposed #5465

Add vectorized packing for FP16 and BF16 for RISC-V. Reactivate vector packing for FP64 transposed #5465

Uh oh!

Conversation

ChipKerchner commented Sep 26, 2025

Uh oh!

ChipKerchner commented Sep 26, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants