Parallelize sensor model update #32

nahueespinosa · 2022-12-30T13:45:18Z

This patch parallelizes the computation of particle weights using standard C++ execution policies (libstdc++ uses libtbb to implement them). It also adds logs for the update steps.

Particles: 2000
Laser points: 1080

	Sequential Duration [seconds]	Parallel Duration [seconds]	Speed up
Motion update	0.0055	0.0055	0.9928128766
Sensor update	0.1423	0.0172	8.268438989
Resampling	0.0092	0.0094	0.9754982861
Total	0.1570	0.0321	4.883631913

Benchmarked in a system with the following CPU specs:

$ lscpu
Architecture:                    x86_64                                                                                                                     
CPU op-mode(s):                  32-bit, 64-bit                                                                                                             
Byte Order:                      Little Endian
Address sizes:                   48 bits physical, 48 bits virtual
CPU(s):                          16
On-line CPU(s) list:             0-15
Thread(s) per core:              2
Core(s) per socket:              8
Socket(s):                       1
NUMA node(s):                    1
Vendor ID:                       AuthenticAMD
CPU family:                      25
Model:                           80
Model name:                      AMD Ryzen 9 5900HX with Radeon Graphics
Stepping:                        0
Frequency boost:                 enabled
CPU MHz:                         3148.815
CPU max MHz:                     4680,0000
CPU min MHz:                     400,0000
BogoMIPS:                        6587.55
Virtualization:                  AMD-V
L1d cache:                       256 KiB
L1i cache:                       256 KiB
L2 cache:                        4 MiB
L3 cache:                        16 MiB

Related to #3.

glpuga

Only one probing question, but LGTM. Great speedup!

beluga/include/beluga/algorithm/particle_filter.hpp

As there is no observable difference in performance and the unsequenced version imposes additional restrictions to user mixins (users cannot perform any insecure vectoring operations when using these policies).

nahueespinosa · 2022-12-30T17:57:10Z

@glpuga Thanks for the review! Going in!

nahueespinosa force-pushed the nahuel/parallel branch 2 times, most recently from 0c42547 to 9db4a0a Compare December 30, 2022 15:13

nahueespinosa self-assigned this Dec 30, 2022

nahueespinosa requested a review from glpuga December 30, 2022 15:19

Parallelize sensor model update

709a250

nahueespinosa force-pushed the nahuel/parallel branch from 9db4a0a to 709a250 Compare December 30, 2022 16:01

glpuga previously approved these changes Dec 30, 2022

View reviewed changes

beluga/include/beluga/algorithm/particle_filter.hpp Outdated Show resolved Hide resolved

Use parallel_policy instead of parallel_unsequenced_policy

0ac66d8

As there is no observable difference in performance and the unsequenced version imposes additional restrictions to user mixins (users cannot perform any insecure vectoring operations when using these policies).

nahueespinosa dismissed glpuga’s stale review via 0ac66d8 December 30, 2022 17:48

nahueespinosa merged commit 1dddc9d into master Dec 30, 2022

nahueespinosa deleted the nahuel/parallel branch December 30, 2022 17:59

nahueespinosa added enhancement New feature or request cpp Related to C++ code labels Jan 6, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Parallelize sensor model update #32

Parallelize sensor model update #32

nahueespinosa commented Dec 30, 2022 •

edited

Loading

glpuga left a comment

nahueespinosa commented Dec 30, 2022

Parallelize sensor model update #32

Parallelize sensor model update #32

Conversation

nahueespinosa commented Dec 30, 2022 • edited Loading

glpuga left a comment

Choose a reason for hiding this comment

nahueespinosa commented Dec 30, 2022

nahueespinosa commented Dec 30, 2022 •

edited

Loading