CloverLeaf_MPI

This is the MPI only version of CloverLeaf version 1.3. All OpenMP pragmas have been removed.

Release Notes

Version 1.3

CloverLeaf 1.3 contains a number of optimisations over previous releases. These include a number of loop fusion optimisations and the use of scalar variables over work arrays. Overall this improves cache efficiency.

This version also contains some support for explicit tiling. This is activated through the two input deck parameters:

tiles_per_chunk To specify how many tiles per MPI ranks there are.
tiles_per_problem To specify how many global tiles there are, this is rounded down to be an even number per MPI rank.

Performance

Expected performance is give below.

If you do not see this performance, or you see variability, then is it recommended that you check MPI task placement and OpenMP thread affinities, because it is essential these are pinned and placed optimally to obtain best performance.

Note that performance can depend on compiler (brand and release), memory speed, system settings (e.g. turbo, huge pages), system load etc.

Performance Table

Test Problem	Time	Time	Time
Hardware	E5-2670 0 @ 2.60GHz Core	E5-2670 0 @ 2.60GHz Node	E5-2698 v3 @ 2.30GHz Node
Options	make COMPILER=INTEL	make COMPILER=INTEL	make COMPILER=CRAY
Options	mpirun -np 1	mpirun -np 16	aprun -n4 -N4 -d8
2	20.0	2.5	0.9
3	960.0	100.0
4	460.0	40.0	23.44
5	13000.0	1700.0

Weak Scaling - Test 4

Node Count	Time
1	40.0
2
4
8
16

Strong Scaling - Test 5

Node Count	Time	Speed Up
1	1700	1.0
2
4
8
16

Name		Name	Last commit message	Last commit date
Latest commit History 43 Commits
InputDecks		InputDecks
python		python
.gitignore		.gitignore
Makefile		Makefile
PdV.f90		PdV.f90
PdV_kernel.f90		PdV_kernel.f90
PdV_kernel_c.c		PdV_kernel_c.c
README.md		README.md
accelerate.f90		accelerate.f90
accelerate_kernel.f90		accelerate_kernel.f90
accelerate_kernel_c.c		accelerate_kernel_c.c
advec_cell_driver.f90		advec_cell_driver.f90
advec_cell_kernel.f90		advec_cell_kernel.f90
advec_cell_kernel_c.c		advec_cell_kernel_c.c
advec_mom_driver.f90		advec_mom_driver.f90
advec_mom_kernel.f90		advec_mom_kernel.f90
advec_mom_kernel_c.c		advec_mom_kernel_c.c
advection.f90		advection.f90
build_field.f90		build_field.f90
calc_dt.f90		calc_dt.f90
calc_dt_kernel.f90		calc_dt_kernel.f90
calc_dt_kernel_c.c		calc_dt_kernel_c.c
clover.f90		clover.f90
clover.in		clover.in
clover.in.tmp		clover.in.tmp
clover.out		clover.out
clover_leaf.f90		clover_leaf.f90
data.f90		data.f90
definitions.f90		definitions.f90
field_summary.f90		field_summary.f90
field_summary_kernel.f90		field_summary_kernel.f90
field_summary_kernel_c.c		field_summary_kernel_c.c
flux_calc.f90		flux_calc.f90
flux_calc_kernel.f90		flux_calc_kernel.f90
flux_calc_kernel_c.c		flux_calc_kernel_c.c
ftocmacros.h		ftocmacros.h
generate_chunk.f90		generate_chunk.f90
generate_chunk_kernel.f90		generate_chunk_kernel.f90
generate_chunk_kernel_c.c		generate_chunk_kernel_c.c
hydro.f90		hydro.f90
ideal_gas.f90		ideal_gas.f90
ideal_gas_kernel.f90		ideal_gas_kernel.f90
ideal_gas_kernel_c.c		ideal_gas_kernel_c.c
initialise.f90		initialise.f90
initialise_chunk.f90		initialise_chunk.f90
initialise_chunk_kernel.f90		initialise_chunk_kernel.f90
initialise_chunk_kernel_c.c		initialise_chunk_kernel_c.c
mpi_interface.f90		mpi_interface.f90
pack_kernel.f90		pack_kernel.f90
pack_kernel_c.c		pack_kernel_c.c
parse.f90		parse.f90
read_input.f90		read_input.f90
report.f90		report.f90
reset_field.f90		reset_field.f90
reset_field_kernel.f90		reset_field_kernel.f90
reset_field_kernel_c.c		reset_field_kernel_c.c
revert.f90		revert.f90
revert_kernel.f90		revert_kernel.f90
revert_kernel_c.c		revert_kernel_c.c
start.f90		start.f90
timer.f90		timer.f90
timer_c.c		timer_c.c
timestep.f90		timestep.f90
update_halo.f90		update_halo.f90
update_halo_kernel.f90		update_halo_kernel.f90
update_halo_kernel_c.c		update_halo_kernel_c.c
update_tile_halo.f90		update_tile_halo.f90
update_tile_halo_kernel.f90		update_tile_halo_kernel.f90
viscosity.f90		viscosity.f90
viscosity_kernel.f90		viscosity_kernel.f90
viscosity_kernel_c.c		viscosity_kernel_c.c
visit.f90		visit.f90
write_res_vis.f90		write_res_vis.f90

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

CloverLeaf_MPI

Release Notes

Version 1.3

Performance

Performance Table

Weak Scaling - Test 4

Strong Scaling - Test 5

About

Releases

Packages

Contributors 3

Languages

yektaKamane/Fault-Resilient-CloverLeaf

Folders and files

Latest commit

History

Repository files navigation

CloverLeaf_MPI

Release Notes

Version 1.3

Performance

Performance Table

Weak Scaling - Test 4

Strong Scaling - Test 5

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages