-------- Analyze -------- -------------------------------------------------------------------------------- 0. Top Stat ╒════╤══════════════════════════════════════════╤═════════╤═══════════════╤══════════════╤══════════════╤═══════╕ │ │ KernelName │ Count │ Sum(ns) │ Mean(ns) │ Median(ns) │ Pct │ ╞════╪══════════════════════════════════════════╪═════════╪═══════════════╪══════════════╪══════════════╪═══════╡ │ 0 │ s_convert_conservative_to_primitive_vari │ 30.00 │ 5320256325.25 │ 177341877.51 │ 176818215.38 │ 58.28 │ │ │ ables$m_variables_conversion_$ck_L890_1_ │ │ │ │ │ │ │ │ cce$noloop$form.kd │ │ │ │ │ │ ├────┼──────────────────────────────────────────┼─────────┼───────────────┼──────────────┼──────────────┼───────┤ │ 1 │ s_finalize_riemann_solver$m_riemann_solv │ 30.00 │ 314581841.00 │ 10486061.37 │ 10477533.88 │ 3.45 │ │ │ ers_$ck_L4080_74.kd │ │ │ │ │ │ ├────┼──────────────────────────────────────────┼─────────┼───────────────┼──────────────┼──────────────┼───────┤ │ 2 │ s_weno$m_weno_$ck_L581_5.kd │ 120.00 │ 234018088.00 │ 1950150.73 │ 1950257.62 │ 2.56 │ ├────┼──────────────────────────────────────────┼─────────┼───────────────┼──────────────┼──────────────┼───────┤ │ 3 │ s_weno$m_weno_$ck_L581_6.kd │ 120.00 │ 233974721.75 │ 1949789.35 │ 1949617.38 │ 2.56 │ ├────┼──────────────────────────────────────────┼─────────┼───────────────┼──────────────┼──────────────┼───────┤ │ 4 │ s_weno$m_weno_$ck_L581_4.kd │ 120.00 │ 233695364.50 │ 1947461.37 │ 1948657.88 │ 2.56 │ ├────┼──────────────────────────────────────────┼─────────┼───────────────┼──────────────┼──────────────┼───────┤ │ 5 │ s_initialize_weno$m_weno_$ck_L846_12.kd │ 120.00 │ 201354271.50 │ 1677952.26 │ 1676335.00 │ 2.21 │ ├────┼──────────────────────────────────────────┼─────────┼───────────────┼──────────────┼──────────────┼───────┤ │ 6 │ s_hllc_riemann_solver$m_riemann_solvers_ │ 30.00 │ 200299543.50 │ 6676651.45 │ 6645819.00 │ 2.19 │ │ │ $ck_L916_8.kd │ │ │ │ │ │ ├────┼──────────────────────────────────────────┼─────────┼───────────────┼──────────────┼──────────────┼───────┤ │ 7 │ s_hllc_riemann_solver$m_riemann_solvers_ │ 30.00 │ 169147108.00 │ 5638236.93 │ 5632850.38 │ 1.85 │ │ │ $ck_L916_12.kd │ │ │ │ │ │ ├────┼──────────────────────────────────────────┼─────────┼───────────────┼──────────────┼──────────────┼───────┤ │ 8 │ s_hllc_riemann_solver$m_riemann_solvers_ │ 30.00 │ 168124218.00 │ 5604140.60 │ 5600689.75 │ 1.84 │ │ │ $ck_L916_4.kd │ │ │ │ │ │ ├────┼──────────────────────────────────────────┼─────────┼───────────────┼──────────────┼──────────────┼───────┤ │ 9 │ s_weno$m_weno_$ck_L565_3.kd │ 60.00 │ 158412768.00 │ 2640212.80 │ 2622263.38 │ 1.74 │ ╘════╧══════════════════════════════════════════╧═════════╧═══════════════╧══════════════╧══════════════╧═══════╛ -------------------------------------------------------------------------------- 1. System Info ╒══════════════════╤═════════════════════════════════════════════════════════════════════════════════════════════════════╕ │ │ Info │ ╞══════════════════╪═════════════════════════════════════════════════════════════════════════════════════════════════════╡ │ workload_name │ asdf │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ command │ /lustre/orion/cfd154/scratch/bwilfong3/software/MFC-Wilfong/build/install/ffcf3c1854/bin/simulation │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ host_name │ frontier10250 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ host_cpu │ AMD EPYC 7A53 64-Core Processor │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ host_distro │ SUSE Linux Enterprise Server 15 SP4 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ host_kernel │ 5.14.21-150400.24.46_12.0.83-cray_shasta_c │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ host_rocmver │ 5.5.1-74 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ date │ Thu May 16 11:29:37 2024 (EDT) │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ gpu_soc │ gfx90a │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ numSE │ 8 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ numCU │ 110 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ numSIMD │ 4 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ waveSize │ 64 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ maxWavesPerCU │ 32 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ maxWorkgroupSize │ 1024 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ L1 │ 16 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ L2 │ 8192 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ sclk │ 1700 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ mclk │ 1600 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ cur_sclk │ 800 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ cur_mclk │ 1600 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ L2Banks │ 32 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ LDSBanks │ 32 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ name │ mi200 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ numSQC │ 56 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ hbmBW │ 1638.4 │ ├──────────────────┼─────────────────────────────────────────────────────────────────────────────────────────────────────┤ │ ip_blocks │ roofline|SQ|LDS|SQC|TA|TD|TCP|TCC|SPI|CPC|CPF │ ╘══════════════════╧═════════════════════════════════════════════════════════════════════════════════════════════════════╛ -------------------------------------------------------------------------------- 2. System Speed-of-Light 2.1 Speed-of-Light ╒═════════╤═══════════════════════════╤═════════╤══════════════════╤══════════╤═══════╕ │ Index │ Metric │ Value │ Unit │ Peak │ PoP │ ╞═════════╪═══════════════════════════╪═════════╪══════════════════╪══════════╪═══════╡ │ 2.1.0 │ VALU FLOPs │ 582.98 │ Gflop │ 23936.0 │ 2.44 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.1 │ VALU IOPs │ 2551.51 │ Giop │ 23936.0 │ 10.66 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.2 │ MFMA FLOPs (BF16) │ 0.00 │ Gflop │ 191488.0 │ 0.0 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.3 │ MFMA FLOPs (F16) │ 0.00 │ Gflop │ 191488.0 │ 0.0 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.4 │ MFMA FLOPs (F32) │ 0.00 │ Gflop │ 47872.0 │ 0.0 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.5 │ MFMA FLOPs (F64) │ 0.00 │ Gflop │ 47872.0 │ 0.0 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.6 │ MFMA IOPs (Int8) │ 0.00 │ Giop │ 191488.0 │ 0.0 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.7 │ Active CUs │ 105.00 │ Cus │ 110.0 │ 95.45 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.8 │ SALU Util │ 9.73 │ Pct │ 100.0 │ 9.73 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.9 │ VALU Util │ 37.44 │ Pct │ 100.0 │ 37.44 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.10 │ MFMA Util │ 0.00 │ Pct │ 100.0 │ 0.0 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.11 │ VALU Active Threads/Wave │ 60.71 │ Threads │ 64.0 │ 94.86 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.12 │ IPC - Issue │ 0.96 │ Instr/cycle │ 5.0 │ 19.19 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.13 │ LDS BW │ 708.30 │ Gb/sec │ 23936.0 │ 2.96 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.14 │ LDS Bank Conflict │ 0.00 │ Conflicts/access │ 32.0 │ 0.0 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.15 │ Instr Cache Hit Rate │ 99.97 │ Pct │ 100.0 │ 99.97 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.16 │ Instr Cache BW │ 1079.74 │ Gb/s │ 6092.8 │ 17.72 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.17 │ Scalar L1D Cache Hit Rate │ 88.00 │ Pct │ 100.0 │ 88.0 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.18 │ Scalar L1D Cache BW │ 59.10 │ Gb/s │ 6092.8 │ 0.97 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.19 │ Vector L1D Cache Hit Rate │ 74.13 │ Pct │ 100.0 │ 74.13 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.20 │ Vector L1D Cache BW │ 4010.45 │ Gb/s │ 11968.0 │ 33.51 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.21 │ L2 Cache Hit Rate │ 58.49 │ Pct │ 100.0 │ 58.49 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.22 │ L2-Fabric Read BW │ 290.31 │ Gb/s │ 1638.4 │ 17.72 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.23 │ L2-Fabric Write BW │ 190.82 │ Gb/s │ 1638.4 │ 11.65 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.24 │ L2-Fabric Read Latency │ 601.80 │ Cycles │ │ │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.25 │ L2-Fabric Write Latency │ 426.43 │ Cycles │ │ │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.26 │ Wave Occupancy │ 1166.84 │ Wavefronts │ 3520.0 │ 33.15 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.27 │ Instr Fetch BW │ 539.96 │ Gb/s │ 3046.4 │ 17.72 │ ├─────────┼───────────────────────────┼─────────┼──────────────────┼──────────┼───────┤ │ 2.1.28 │ Instr Fetch Latency │ 20.73 │ Cycles │ │ │ ╘═════════╧═══════════════════════════╧═════════╧══════════════════╧══════════╧═══════╛ -------------------------------------------------------------------------------- 5. Command Processor (CPC/CPF) 5.1 Command Processor Fetcher ╒═════════╤════════════════════╤════════════╤══════════╤══════════════╤═══════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪════════════════════╪════════════╪══════════╪══════════════╪═══════════════╡ │ 5.1.0 │ GPU Busy Cycles │ 6160574.21 │ 53238.00 │ 320781229.00 │ Cycles/kernel │ ├─────────┼────────────────────┼────────────┼──────────┼──────────────┼───────────────┤ │ 5.1.1 │ CPF Busy │ 6160574.21 │ 53238.00 │ 320781229.00 │ Cycles/kernel │ ├─────────┼────────────────────┼────────────┼──────────┼──────────────┼───────────────┤ │ 5.1.2 │ CPF Util │ 100.00 │ 100.00 │ 100.00 │ Pct │ ├─────────┼────────────────────┼────────────┼──────────┼──────────────┼───────────────┤ │ 5.1.3 │ CPF Stall │ 0.00 │ 0.00 │ 0.05 │ Cycles/kernel │ ├─────────┼────────────────────┼────────────┼──────────┼──────────────┼───────────────┤ │ 5.1.4 │ L2Cache Intf Busy │ 1059.85 │ 665.00 │ 2747.00 │ Cycles/kernel │ ├─────────┼────────────────────┼────────────┼──────────┼──────────────┼───────────────┤ │ 5.1.5 │ L2Cache Intf Util │ 0.24 │ 0.00 │ 2.08 │ Pct │ ├─────────┼────────────────────┼────────────┼──────────┼──────────────┼───────────────┤ │ 5.1.6 │ L2Cache Intf Stall │ 0.00 │ 0.00 │ 0.00 │ Pct │ ├─────────┼────────────────────┼────────────┼──────────┼──────────────┼───────────────┤ │ 5.1.7 │ UTCL1 Stall │ 0.50 │ 0.00 │ 396.00 │ Cycles/kernel │ ╘═════════╧════════════════════╧════════════╧══════════╧══════════════╧═══════════════╛ 5.2 Command Processor Compute ╒═════════╤════════════════════════╤════════════╤══════════╤══════════════╤════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪════════════════════════╪════════════╪══════════╪══════════════╪════════╡ │ 5.2.0 │ GPU Busy Cycles │ 6160574.21 │ 53238.00 │ 320781229.00 │ Cycles │ ├─────────┼────────────────────────┼────────────┼──────────┼──────────────┼────────┤ │ 5.2.1 │ CPC Busy Cycles │ 6160260.24 │ 53238.00 │ 320271322.00 │ Cycles │ ├─────────┼────────────────────────┼────────────┼──────────┼──────────────┼────────┤ │ 5.2.2 │ CPC Util │ 99.99 │ 84.14 │ 100.00 │ Pct │ ├─────────┼────────────────────────┼────────────┼──────────┼──────────────┼────────┤ │ 5.2.3 │ CPC Stall Cycles │ 279636.86 │ 7073.00 │ 2275421.00 │ Cycles │ ├─────────┼────────────────────────┼────────────┼──────────┼──────────────┼────────┤ │ 5.2.4 │ CPC Stall Rate │ 11.64 │ 0.01 │ 23.48 │ Pct │ ├─────────┼────────────────────────┼────────────┼──────────┼──────────────┼────────┤ │ 5.2.5 │ CPC Packet Decoding │ 2085431.22 │ 10222.00 │ 17209378.00 │ Cycles │ ├─────────┼────────────────────────┼────────────┼──────────┼──────────────┼────────┤ │ 5.2.6 │ SPI Intf Busy Cycles │ 4110916.89 │ 702.00 │ 319091041.00 │ Cycles │ ├─────────┼────────────────────────┼────────────┼──────────┼──────────────┼────────┤ │ 5.2.7 │ SPI Intf Util │ 20.66 │ 0.01 │ 104.86 │ Pct │ ├─────────┼────────────────────────┼────────────┼──────────┼──────────────┼────────┤ │ 5.2.8 │ L2Cache Intf Util │ 0.07 │ 0.00 │ 0.56 │ Pct │ ├─────────┼────────────────────────┼────────────┼──────────┼──────────────┼────────┤ │ 5.2.9 │ UTCL1 Stall Cycles │ 3433.80 │ 2336.00 │ 6016.00 │ Cycles │ ├─────────┼────────────────────────┼────────────┼──────────┼──────────────┼────────┤ │ 5.2.10 │ UTCL2 Intf Busy Cycles │ 3603.09 │ 3375.00 │ 6801.00 │ Cycles │ ├─────────┼────────────────────────┼────────────┼──────────┼──────────────┼────────┤ │ 5.2.11 │ UTCL2 Intf Util │ 0.82 │ 0.00 │ 7.89 │ Pct │ ╘═════════╧════════════════════════╧════════════╧══════════╧══════════════╧════════╛ -------------------------------------------------------------------------------- 6. Shader Processor Input (SPI) 6.1 SPI Stats ╒═════════╤════════════════════════╤═════════════╤═══════════╤═══════════════╤════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪════════════════════════╪═════════════╪═══════════╪═══════════════╪════════════╡ │ 6.1.0 │ GPU Busy │ 6160574.21 │ 53238.00 │ 320781229.00 │ Cycles │ ├─────────┼────────────────────────┼─────────────┼───────────┼───────────────┼────────────┤ │ 6.1.1 │ CS Busy │ 0.00 │ 0.00 │ 0.00 │ Cycles │ ├─────────┼────────────────────────┼─────────────┼───────────┼───────────────┼────────────┤ │ 6.1.2 │ SPI Busy │ 6168509.07 │ 45413.00 │ 318887053.00 │ Cycles │ ├─────────┼────────────────────────┼─────────────┼───────────┼───────────────┼────────────┤ │ 6.1.3 │ SQ Busy │ 48711801.53 │ 345436.00 │ 2540148827.00 │ Cycles │ ├─────────┼────────────────────────┼─────────────┼───────────┼───────────────┼────────────┤ │ 6.1.4 │ Dispatched Workgroups │ 0.00 │ 0.00 │ 0.00 │ Workgroups │ ├─────────┼────────────────────────┼─────────────┼───────────┼───────────────┼────────────┤ │ 6.1.5 │ Dispatched Wavefronts │ 0.00 │ 0.00 │ 0.00 │ Wavefronts │ ├─────────┼────────────────────────┼─────────────┼───────────┼───────────────┼────────────┤ │ 6.1.6 │ Wave Alloc Failed │ 0.00 │ 0.00 │ 0.00 │ Cycles │ ├─────────┼────────────────────────┼─────────────┼───────────┼───────────────┼────────────┤ │ 6.1.7 │ Wave Alloc Failed - CS │ 0.00 │ 0.00 │ 0.00 │ Cycles │ ╘═════════╧════════════════════════╧═════════════╧═══════════╧═══════════════╧════════════╛ 6.2 SPI Resource Allocation ╒═════════╤═════════════════════════════╤═══════╤═══════╤═══════╤═════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪═════════════════════════════╪═══════╪═══════╪═══════╪═════════════╡ │ 6.2.0 │ Wave request Failed (CS) │ 0.0 │ 0.0 │ 0.0 │ Cycles │ ├─────────┼─────────────────────────────┼───────┼───────┼───────┼─────────────┤ │ 6.2.1 │ CS Stall │ 0.0 │ 0.0 │ 0.0 │ Cycles │ ├─────────┼─────────────────────────────┼───────┼───────┼───────┼─────────────┤ │ 6.2.2 │ CS Stall Rate │ 0.0 │ 0.0 │ 0.0 │ Pct │ ├─────────┼─────────────────────────────┼───────┼───────┼───────┼─────────────┤ │ 6.2.3 │ Scratch Stall │ 0.0 │ 0.0 │ 0.0 │ Cycles │ ├─────────┼─────────────────────────────┼───────┼───────┼───────┼─────────────┤ │ 6.2.4 │ Insufficient SIMD Waveslots │ 0.0 │ 0.0 │ 0.0 │ Simd │ ├─────────┼─────────────────────────────┼───────┼───────┼───────┼─────────────┤ │ 6.2.5 │ Insufficient SIMD VGPRs │ 0.0 │ 0.0 │ 0.0 │ Simd │ ├─────────┼─────────────────────────────┼───────┼───────┼───────┼─────────────┤ │ 6.2.6 │ Insufficient SIMD SGPRs │ 0.0 │ 0.0 │ 0.0 │ Simd │ ├─────────┼─────────────────────────────┼───────┼───────┼───────┼─────────────┤ │ 6.2.7 │ Insufficient CU LDS │ 0.0 │ 0.0 │ 0.0 │ Cu │ ├─────────┼─────────────────────────────┼───────┼───────┼───────┼─────────────┤ │ 6.2.8 │ Insufficient CU Barries │ 0.0 │ 0.0 │ 0.0 │ Cu │ ├─────────┼─────────────────────────────┼───────┼───────┼───────┼─────────────┤ │ 6.2.9 │ Insufficient Bulky Resource │ 0.0 │ 0.0 │ 0.0 │ Cu │ ├─────────┼─────────────────────────────┼───────┼───────┼───────┼─────────────┤ │ 6.2.10 │ Reach CU Threadgroups Limit │ 0.0 │ 0.0 │ 0.0 │ Cycles │ ├─────────┼─────────────────────────────┼───────┼───────┼───────┼─────────────┤ │ 6.2.11 │ Reach CU Wave Limit │ 0.0 │ 0.0 │ 0.0 │ Cycles │ ├─────────┼─────────────────────────────┼───────┼───────┼───────┼─────────────┤ │ 6.2.12 │ VGPR Writes │ │ │ │ Cycles/wave │ ├─────────┼─────────────────────────────┼───────┼───────┼───────┼─────────────┤ │ 6.2.13 │ SGPR Writes │ │ │ │ Cycles/wave │ ╘═════════╧═════════════════════════════╧═══════╧═══════╧═══════╧═════════════╛ -------------------------------------------------------------------------------- 7. Wavefront 7.1 Wavefront Launch Stats ╒═════════╤═════════════════════╤════════════╤══════════╤═════════════╤════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪═════════════════════╪════════════╪══════════╪═════════════╪════════════╡ │ 7.1.0 │ Grid Size │ 5257817.46 │ 28160.00 │ 88000000.00 │ Work items │ ├─────────┼─────────────────────┼────────────┼──────────┼─────────────┼────────────┤ │ 7.1.1 │ Workgroup Size │ 256.00 │ 256.00 │ 256.00 │ Work items │ ├─────────┼─────────────────────┼────────────┼──────────┼─────────────┼────────────┤ │ 7.1.2 │ Total Wavefronts │ 0.00 │ 0.00 │ 0.00 │ Wavefronts │ ├─────────┼─────────────────────┼────────────┼──────────┼─────────────┼────────────┤ │ 7.1.3 │ Saved Wavefronts │ 0.00 │ 0.00 │ 0.00 │ Wavefronts │ ├─────────┼─────────────────────┼────────────┼──────────┼─────────────┼────────────┤ │ 7.1.4 │ Restored Wavefronts │ 0.00 │ 0.00 │ 0.00 │ Wavefronts │ ├─────────┼─────────────────────┼────────────┼──────────┼─────────────┼────────────┤ │ 7.1.5 │ VGPRs │ 48.96 │ 20.00 │ 128.00 │ Registers │ ├─────────┼─────────────────────┼────────────┼──────────┼─────────────┼────────────┤ │ 7.1.6 │ AGPRs │ 9.33 │ 0.00 │ 152.00 │ Registers │ ├─────────┼─────────────────────┼────────────┼──────────┼─────────────┼────────────┤ │ 7.1.7 │ SGPRs │ 86.41 │ 48.00 │ 112.00 │ Registers │ ├─────────┼─────────────────────┼────────────┼──────────┼─────────────┼────────────┤ │ 7.1.8 │ LDS Allocation │ 0.00 │ 0.00 │ 0.00 │ Bytes │ ├─────────┼─────────────────────┼────────────┼──────────┼─────────────┼────────────┤ │ 7.1.9 │ Scratch Allocation │ 9.14 │ 0.00 │ 216.00 │ Bytes │ ╘═════════╧═════════════════════╧════════════╧══════════╧═════════════╧════════════╛ 7.2 Wavefront Runtime Stats ╒═════════╤════════════════════════╤════════════╤══════════╤══════════════╤═════════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪════════════════════════╪════════════╪══════════╪══════════════╪═════════════════╡ │ 7.2.0 │ Kernel Time (Nanosec) │ 3739655.15 │ 24320.00 │ 191859309.50 │ Ns │ ├─────────┼────────────────────────┼────────────┼──────────┼──────────────┼─────────────────┤ │ 7.2.1 │ Kernel Time (Cycles) │ 6160574.21 │ 53238.00 │ 320781229.00 │ Cycle │ ├─────────┼────────────────────────┼────────────┼──────────┼──────────────┼─────────────────┤ │ 7.2.2 │ Instr/wavefront │ 141192.77 │ 317.00 │ 744284.76 │ Instr/wavefront │ ├─────────┼────────────────────────┼────────────┼──────────┼──────────────┼─────────────────┤ │ 7.2.3 │ Wave Cycles │ 1983698.77 │ 8421.76 │ 16727567.15 │ Cycles per wave │ ├─────────┼────────────────────────┼────────────┼──────────┼──────────────┼─────────────────┤ │ 7.2.4 │ Dependency Wait Cycles │ 1283994.68 │ 3150.55 │ 11589413.66 │ Cycles per wave │ ├─────────┼────────────────────────┼────────────┼──────────┼──────────────┼─────────────────┤ │ 7.2.5 │ Issue Wait Cycles │ 125117.78 │ 13.78 │ 3863477.36 │ Cycles per wave │ ├─────────┼────────────────────────┼────────────┼──────────┼──────────────┼─────────────────┤ │ 7.2.6 │ Active Cycles │ 575145.83 │ 1252.00 │ 2983942.86 │ Cycles per wave │ ├─────────┼────────────────────────┼────────────┼──────────┼──────────────┼─────────────────┤ │ 7.2.7 │ Wavefront Occupancy │ 1166.84 │ 367.39 │ 3372.24 │ Wavefronts │ ╘═════════╧════════════════════════╧════════════╧══════════╧══════════════╧═════════════════╛ -------------------------------------------------------------------------------- 10. Compute Units - Instruction Mix 10.1 Instruction Mix ╒═════════╤═══════════════╤═══════════╤════════╤═══════════╤════════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪═══════════════╪═══════════╪════════╪═══════════╪════════════════╡ │ 10.1.0 │ VALU - Vector │ 118479.54 │ 170.00 │ 587363.16 │ Instr per wave │ ├─────────┼───────────────┼───────────┼────────┼───────────┼────────────────┤ │ 10.1.1 │ VMEM │ 4598.91 │ 6.00 │ 29687.50 │ Instr per wave │ ├─────────┼───────────────┼───────────┼────────┼───────────┼────────────────┤ │ 10.1.2 │ LDS │ 768.23 │ 0.00 │ 21875.00 │ Instr per wave │ ├─────────┼───────────────┼───────────┼────────┼───────────┼────────────────┤ │ 10.1.3 │ VALU - MFMA │ 0.00 │ 0.00 │ 0.00 │ Instr per wave │ ├─────────┼───────────────┼───────────┼────────┼───────────┼────────────────┤ │ 10.1.4 │ SALU │ 10245.41 │ 95.00 │ 86584.56 │ Instr per wave │ ├─────────┼───────────────┼───────────┼────────┼───────────┼────────────────┤ │ 10.1.5 │ SMEM │ 16.57 │ 6.00 │ 57.00 │ Instr per wave │ ├─────────┼───────────────┼───────────┼────────┼───────────┼────────────────┤ │ 10.1.6 │ Branch │ 3648.02 │ 11.00 │ 16641.75 │ Instr per wave │ ├─────────┼───────────────┼───────────┼────────┼───────────┼────────────────┤ │ 10.1.7 │ GDS │ 0.00 │ 0.00 │ 0.00 │ Instr per wave │ ╘═════════╧═══════════════╧═══════════╧════════╧═══════════╧════════════════╛ 10.2 VALU Arithmetic Instr Mix ╒═════════╤════════════╤══════════╤═══════╤═══════════╤════════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪════════════╪══════════╪═══════╪═══════════╪════════════════╡ │ 10.2.0 │ INT32 │ 49331.33 │ 95.00 │ 203130.00 │ Instr per wave │ ├─────────┼────────────┼──────────┼───────┼───────────┼────────────────┤ │ 10.2.1 │ INT64 │ 8472.03 │ 16.00 │ 37502.00 │ Instr per wave │ ├─────────┼────────────┼──────────┼───────┼───────────┼────────────────┤ │ 10.2.2 │ F16-ADD │ 0.00 │ 0.00 │ 0.00 │ Instr per wave │ ├─────────┼────────────┼──────────┼───────┼───────────┼────────────────┤ │ 10.2.3 │ F16-MUL │ 0.00 │ 0.00 │ 0.00 │ Instr per wave │ ├─────────┼────────────┼──────────┼───────┼───────────┼────────────────┤ │ 10.2.4 │ F16-FMA │ 0.00 │ 0.00 │ 0.00 │ Instr per wave │ ├─────────┼────────────┼──────────┼───────┼───────────┼────────────────┤ │ 10.2.5 │ F16-Trans │ 0.00 │ 0.00 │ 0.00 │ Instr per wave │ ├─────────┼────────────┼──────────┼───────┼───────────┼────────────────┤ │ 10.2.6 │ F32-ADD │ 0.00 │ 0.00 │ 0.00 │ Instr per wave │ ├─────────┼────────────┼──────────┼───────┼───────────┼────────────────┤ │ 10.2.7 │ F32-MUL │ 984.87 │ 2.00 │ 5124.16 │ Instr per wave │ ├─────────┼────────────┼──────────┼───────┼───────────┼────────────────┤ │ 10.2.8 │ F32-FMA │ 0.00 │ 0.00 │ 0.00 │ Instr per wave │ ├─────────┼────────────┼──────────┼───────┼───────────┼────────────────┤ │ 10.2.9 │ F32-Trans │ 984.87 │ 2.00 │ 5124.16 │ Instr per wave │ ├─────────┼────────────┼──────────┼───────┼───────────┼────────────────┤ │ 10.2.10 │ F64-ADD │ 1925.97 │ 0.00 │ 26505.83 │ Instr per wave │ ├─────────┼────────────┼──────────┼───────┼───────────┼────────────────┤ │ 10.2.11 │ F64-MUL │ 4445.41 │ 0.00 │ 35968.19 │ Instr per wave │ ├─────────┼────────────┼──────────┼───────┼───────────┼────────────────┤ │ 10.2.12 │ F64-FMA │ 10823.54 │ 0.00 │ 83003.52 │ Instr per wave │ ├─────────┼────────────┼──────────┼───────┼───────────┼────────────────┤ │ 10.2.13 │ F64-Trans │ 1281.60 │ 0.00 │ 10144.88 │ Instr per wave │ ├─────────┼────────────┼──────────┼───────┼───────────┼────────────────┤ │ 10.2.14 │ Conversion │ 1995.22 │ 4.00 │ 10248.33 │ Instr per wave │ ╘═════════╧════════════╧══════════╧═══════╧═══════════╧════════════════╛ 10.3 VMEM Instr Mix ╒═════════╤═══════════════╤═════════╕ │ Index │ type │ Count │ ╞═════════╪═══════════════╪═════════╡ │ 10.3.0 │ Buffer Instr │ 237.25 │ ├─────────┼───────────────┼─────────┤ │ 10.3.1 │ Buffer Read │ 107.77 │ ├─────────┼───────────────┼─────────┤ │ 10.3.2 │ Buffer Write │ 129.34 │ ├─────────┼───────────────┼─────────┤ │ 10.3.3 │ Buffer Atomic │ 0.00 │ ├─────────┼───────────────┼─────────┤ │ 10.3.4 │ Flat Instr │ 4361.74 │ ├─────────┼───────────────┼─────────┤ │ 10.3.5 │ Flat Read │ 3701.91 │ ├─────────┼───────────────┼─────────┤ │ 10.3.6 │ Flat Write │ 658.50 │ ├─────────┼───────────────┼─────────┤ │ 10.3.7 │ Flat Atomic │ 1.32 │ ╘═════════╧═══════════════╧═════════╛ 10.4 MFMA Arithmetic Instr Mix ╒═════════╤═══════════╤═════════╕ │ Index │ type │ Count │ ╞═════════╪═══════════╪═════════╡ │ 10.4.0 │ MFMA-I8 │ 0.00 │ ├─────────┼───────────┼─────────┤ │ 10.4.1 │ MFMA-F16 │ 0.00 │ ├─────────┼───────────┼─────────┤ │ 10.4.2 │ MFMA-BF16 │ 0.00 │ ├─────────┼───────────┼─────────┤ │ 10.4.3 │ MFMA-F32 │ 0.00 │ ├─────────┼───────────┼─────────┤ │ 10.4.4 │ MFMA-F64 │ 0.00 │ ╘═════════╧═══════════╧═════════╛ -------------------------------------------------------------------------------- 11. Compute Units - Compute Pipeline 11.1 Speed-of-Light ╒═════════╤═════════════════════╤═════════╤═════════════╕ │ Index │ Metric │ Value │ Unit │ ╞═════════╪═════════════════════╪═════════╪═════════════╡ │ 11.1.0 │ valu_flops_pop │ 2.44 │ Pct of peak │ ├─────────┼─────────────────────┼─────────┼─────────────┤ │ 11.1.1 │ mfma_flops_bf16_pop │ 0.00 │ Pct of peak │ ├─────────┼─────────────────────┼─────────┼─────────────┤ │ 11.1.2 │ mfma_flops_f16_pop │ 0.00 │ Pct of peak │ ├─────────┼─────────────────────┼─────────┼─────────────┤ │ 11.1.3 │ mfma_flops_f32_pop │ 0.00 │ Pct of peak │ ├─────────┼─────────────────────┼─────────┼─────────────┤ │ 11.1.4 │ mfma_flops_f64_pop │ 0.00 │ Pct of peak │ ├─────────┼─────────────────────┼─────────┼─────────────┤ │ 11.1.5 │ mfma_flops_i8_pop │ 0.00 │ Pct of peak │ ╘═════════╧═════════════════════╧═════════╧═════════════╛ 11.2 Pipeline Stats ╒═════════╤═════════════════════╤═══════╤═══════╤═══════╤══════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪═════════════════════╪═══════╪═══════╪═══════╪══════════════╡ │ 11.2.0 │ IPC (Avg) │ 0.52 │ 0.02 │ 1.5 │ Instr/cycle │ ├─────────┼─────────────────────┼───────┼───────┼───────┼──────────────┤ │ 11.2.1 │ IPC (Issue) │ 0.96 │ 0.91 │ 1.01 │ Instr/cycle │ ├─────────┼─────────────────────┼───────┼───────┼───────┼──────────────┤ │ 11.2.2 │ SALU Util │ 9.73 │ 0.44 │ 63.96 │ Pct │ ├─────────┼─────────────────────┼───────┼───────┼───────┼──────────────┤ │ 11.2.3 │ VALU Util │ 37.44 │ 0.83 │ 77.74 │ Pct │ ├─────────┼─────────────────────┼───────┼───────┼───────┼──────────────┤ │ 11.2.4 │ VALU Active Threads │ 60.71 │ 35.94 │ 64.0 │ Threads │ ├─────────┼─────────────────────┼───────┼───────┼───────┼──────────────┤ │ 11.2.5 │ MFMA Util │ 0.0 │ 0.0 │ 0.0 │ Pct │ ├─────────┼─────────────────────┼───────┼───────┼───────┼──────────────┤ │ 11.2.6 │ MFMA Instr Cycles │ │ │ │ Cycles/instr │ ╘═════════╧═════════════════════╧═══════╧═══════╧═══════╧══════════════╛ 11.3 Arithmetic Operations ╒═════════╤═══════════════╤════════════╤════════╤═════════════╤══════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪═══════════════╪════════════╪════════╪═════════════╪══════════════╡ │ 11.3.0 │ FLOPs (Total) │ 2001266.91 │ 511.95 │ 14520338.91 │ Ops per wave │ ├─────────┼───────────────┼────────────┼────────┼─────────────┼──────────────┤ │ 11.3.1 │ INT8 OPs │ 0.00 │ 0.00 │ 0.00 │ Ops per wave │ ├─────────┼───────────────┼────────────┼────────┼─────────────┼──────────────┤ │ 11.3.2 │ F16 OPs │ 0.00 │ 0.00 │ 0.00 │ Ops per wave │ ├─────────┼───────────────┼────────────┼────────┼─────────────┼──────────────┤ │ 11.3.3 │ BF16 OPs │ 0.00 │ 0.00 │ 0.00 │ Ops per wave │ ├─────────┼───────────────┼────────────┼────────┼─────────────┼──────────────┤ │ 11.3.4 │ F32 OPs │ 126063.76 │ 256.00 │ 655892.80 │ Ops per wave │ ├─────────┼───────────────┼────────────┼────────┼─────────────┼──────────────┤ │ 11.3.5 │ F64 OPs │ 1875203.15 │ 0.00 │ 14165934.55 │ Ops per wave │ ╘═════════╧═══════════════╧════════════╧════════╧═════════════╧══════════════╛ -------------------------------------------------------------------------------- 12. Local Data Share (LDS) 12.1 Speed-of-Light ╒═════════╤═════════════════════════╤═════════╤═════════════╕ │ Index │ Metric │ Value │ Unit │ ╞═════════╪═════════════════════════╪═════════╪═════════════╡ │ 12.1.0 │ Utilization │ 3.20 │ Pct of peak │ ├─────────┼─────────────────────────┼─────────┼─────────────┤ │ 12.1.1 │ Access Rate │ 0.00 │ Pct of peak │ ├─────────┼─────────────────────────┼─────────┼─────────────┤ │ 12.1.2 │ Bandwidth (Pct-of-Peak) │ 2.96 │ Pct of peak │ ├─────────┼─────────────────────────┼─────────┼─────────────┤ │ 12.1.3 │ Bank Conflict Rate │ 0.00 │ Pct of peak │ ╘═════════╧═════════════════════════╧═════════╧═════════════╛ 12.2 LDS Stats ╒═════════╤══════════════════════╤═══════════╤═══════╤═════════════╤══════════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪══════════════════════╪═══════════╪═══════╪═════════════╪══════════════════╡ │ 12.2.0 │ LDS Instrs │ 768.23 │ 0.00 │ 21875.00 │ Instr per wave │ ├─────────┼──────────────────────┼───────────┼───────┼─────────────┼──────────────────┤ │ 12.2.1 │ Bandwidth │ 475861.97 │ 0.00 │ 14400000.00 │ Bytes per wave │ ├─────────┼──────────────────────┼───────────┼───────┼─────────────┼──────────────────┤ │ 12.2.2 │ Bank Conficts/Access │ 0.00 │ 0.00 │ 0.00 │ Conflicts/access │ ├─────────┼──────────────────────┼───────────┼───────┼─────────────┼──────────────────┤ │ 12.2.3 │ Index Accesses │ 3717.67 │ 0.00 │ 112500.00 │ Cycles per wave │ ├─────────┼──────────────────────┼───────────┼───────┼─────────────┼──────────────────┤ │ 12.2.4 │ Atomic Cycles │ 0.00 │ 0.00 │ 0.00 │ Cycles per wave │ ├─────────┼──────────────────────┼───────────┼───────┼─────────────┼──────────────────┤ │ 12.2.5 │ Bank Conflict │ 0.00 │ 0.00 │ 0.00 │ Cycles per wave │ ├─────────┼──────────────────────┼───────────┼───────┼─────────────┼──────────────────┤ │ 12.2.6 │ Addr Conflict │ 0.00 │ 0.00 │ 0.01 │ Cycles per wave │ ├─────────┼──────────────────────┼───────────┼───────┼─────────────┼──────────────────┤ │ 12.2.7 │ Unaligned Stall │ 0.00 │ 0.00 │ 0.00 │ Cycles per wave │ ├─────────┼──────────────────────┼───────────┼───────┼─────────────┼──────────────────┤ │ 12.2.8 │ Mem Violations │ 0.00 │ 0.00 │ 0.00 │ per wave │ ├─────────┼──────────────────────┼───────────┼───────┼─────────────┼──────────────────┤ │ 12.2.9 │ LDS Latency │ 48.30 │ 45.51 │ 61.42 │ Cycles │ ╘═════════╧══════════════════════╧═══════════╧═══════╧═════════════╧══════════════════╛ -------------------------------------------------------------------------------- 13. Instruction Cache 13.1 Speed-of-Light ╒═════════╤═══════════╤═════════╤═════════════╕ │ Index │ Metric │ Value │ Unit │ ╞═════════╪═══════════╪═════════╪═════════════╡ │ 13.1.0 │ Bandwidth │ 17.72 │ Pct of peak │ ├─────────┼───────────┼─────────┼─────────────┤ │ 13.1.1 │ Cache Hit │ 98.82 │ Pct of peak │ ╘═════════╧═══════════╧═════════╧═════════════╛ 13.2 Instruction Cache Accesses ╒═════════╤═════════════════════════╤══════════╤═══════╤═══════════╤═════════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪═════════════════════════╪══════════╪═══════╪═══════════╪═════════════════╡ │ 13.2.0 │ Req │ 28873.03 │ 59.00 │ 157442.15 │ Req per wave │ ├─────────┼─────────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 13.2.1 │ Hits │ 28618.68 │ 58.77 │ 153793.20 │ Hits per wave │ ├─────────┼─────────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 13.2.2 │ Misses - Non Duplicated │ 9.25 │ 0.00 │ 293.80 │ Misses per wave │ ├─────────┼─────────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 13.2.3 │ Misses - Duplicated │ 245.27 │ 0.00 │ 15197.06 │ Misses per wave │ ├─────────┼─────────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 13.2.4 │ Cache Hit │ 98.82 │ 88.33 │ 100.00 │ Pct │ ╘═════════╧═════════════════════════╧══════════╧═══════╧═══════════╧═════════════════╛ -------------------------------------------------------------------------------- 14. Scalar L1 Data Cache 14.1 Speed-of-Light ╒═════════╤═══════════╤═════════╤═════════════╕ │ Index │ Metric │ Value │ Unit │ ╞═════════╪═══════════╪═════════╪═════════════╡ │ 14.1.0 │ Bandwidth │ 0.97 │ Pct of peak │ ├─────────┼───────────┼─────────┼─────────────┤ │ 14.1.1 │ Cache Hit │ 46.88 │ Pct of peak │ ╘═════════╧═══════════╧═════════╧═════════════╛ 14.2 Scalar L1D Cache Accesses ╒═════════╤═════════════════════════╤═══════╤═══════╤═══════╤══════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪═════════════════════════╪═══════╪═══════╪═══════╪══════════════╡ │ 14.2.0 │ Req │ 16.67 │ 6.00 │ 58.00 │ Req per wave │ ├─────────┼─────────────────────────┼───────┼───────┼───────┼──────────────┤ │ 14.2.1 │ Hits │ 7.13 │ 3.00 │ 47.76 │ Req per wave │ ├─────────┼─────────────────────────┼───────┼───────┼───────┼──────────────┤ │ 14.2.2 │ Misses - Non Duplicated │ 0.82 │ 0.00 │ 4.58 │ Req per wave │ ├─────────┼─────────────────────────┼───────┼───────┼───────┼──────────────┤ │ 14.2.3 │ Misses- Duplicated │ 8.72 │ 0.00 │ 34.36 │ Req per wave │ ├─────────┼─────────────────────────┼───────┼───────┼───────┼──────────────┤ │ 14.2.4 │ Cache Hit │ 46.88 │ 15.00 │ 99.94 │ Pct │ ├─────────┼─────────────────────────┼───────┼───────┼───────┼──────────────┤ │ 14.2.5 │ Read Req (Total) │ 16.57 │ 6.00 │ 57.00 │ Req per wave │ ├─────────┼─────────────────────────┼───────┼───────┼───────┼──────────────┤ │ 14.2.6 │ Atomic Req │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼─────────────────────────┼───────┼───────┼───────┼──────────────┤ │ 14.2.7 │ Read Req (1 DWord) │ 5.84 │ 2.00 │ 30.51 │ Req per wave │ ├─────────┼─────────────────────────┼───────┼───────┼───────┼──────────────┤ │ 14.2.8 │ Read Req (2 DWord) │ 6.82 │ 1.00 │ 23.00 │ Req per wave │ ├─────────┼─────────────────────────┼───────┼───────┼───────┼──────────────┤ │ 14.2.9 │ Read Req (4 DWord) │ 1.16 │ 0.00 │ 10.00 │ Req per wave │ ├─────────┼─────────────────────────┼───────┼───────┼───────┼──────────────┤ │ 14.2.10 │ Read Req (8 DWord) │ 0.65 │ 0.00 │ 2.00 │ Req per wave │ ├─────────┼─────────────────────────┼───────┼───────┼───────┼──────────────┤ │ 14.2.11 │ Read Req (16 DWord) │ 2.10 │ 0.00 │ 11.00 │ Req per wave │ ╘═════════╧═════════════════════════╧═══════╧═══════╧═══════╧══════════════╛ 14.3 Scalar L1D Cache - L2 Interface ╒═════════╤════════════╤═══════╤═══════╤═══════╤═════════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪════════════╪═══════╪═══════╪═══════╪═════════════════╡ │ 14.3.0 │ Read Req │ 0.82 │ 0.00 │ 4.58 │ Req per wave │ ├─────────┼────────────┼───────┼───────┼───────┼─────────────────┤ │ 14.3.1 │ Write Req │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼────────────┼───────┼───────┼───────┼─────────────────┤ │ 14.3.2 │ Atomic Req │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼────────────┼───────┼───────┼───────┼─────────────────┤ │ 14.3.3 │ Stall │ 0.00 │ 0.00 │ 0.00 │ Cycles per wave │ ╘═════════╧════════════╧═══════╧═══════╧═══════╧═════════════════╛ -------------------------------------------------------------------------------- 15. Texture Addresser and Texture Data (TA/TD) 15.1 TA ╒═════════╤════════════════════════╤═════════╤═══════╤══════════╤═════════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪════════════════════════╪═════════╪═══════╪══════════╪═════════════════╡ │ 15.1.0 │ TA Busy │ 58.83 │ 15.80 │ 99.33 │ Pct │ ├─────────┼────────────────────────┼─────────┼───────┼──────────┼─────────────────┤ │ 15.1.1 │ TC2TA Addr Stall │ 21.28 │ 0.60 │ 95.89 │ Pct │ ├─────────┼────────────────────────┼─────────┼───────┼──────────┼─────────────────┤ │ 15.1.2 │ TC2TA Data Stall │ 7.93 │ 0.48 │ 96.00 │ Pct │ ├─────────┼────────────────────────┼─────────┼───────┼──────────┼─────────────────┤ │ 15.1.3 │ TD2TA Addr Stall │ 0.00 │ 0.00 │ 0.00 │ Pct │ ├─────────┼────────────────────────┼─────────┼───────┼──────────┼─────────────────┤ │ 15.1.4 │ Total Instructions │ 4598.83 │ 6.00 │ 29687.50 │ Instr per wave │ ├─────────┼────────────────────────┼─────────┼───────┼──────────┼─────────────────┤ │ 15.1.5 │ Flat Instr │ 4361.74 │ 6.00 │ 29687.50 │ Instr per wave │ ├─────────┼────────────────────────┼─────────┼───────┼──────────┼─────────────────┤ │ 15.1.6 │ Flat Read Instr │ 3701.91 │ 5.00 │ 28125.00 │ Instr per wave │ ├─────────┼────────────────────────┼─────────┼───────┼──────────┼─────────────────┤ │ 15.1.7 │ Flat Write Instr │ 658.50 │ 1.00 │ 5549.12 │ Instr per wave │ ├─────────┼────────────────────────┼─────────┼───────┼──────────┼─────────────────┤ │ 15.1.8 │ Flat Atomic Instr │ 1.32 │ 0.00 │ 110.57 │ Instr per wave │ ├─────────┼────────────────────────┼─────────┼───────┼──────────┼─────────────────┤ │ 15.1.9 │ Buffer Instr │ 237.25 │ 0.00 │ 6334.57 │ Instr per wave │ ├─────────┼────────────────────────┼─────────┼───────┼──────────┼─────────────────┤ │ 15.1.10 │ Buffer Read Instr │ 107.77 │ 0.00 │ 2908.43 │ Instr per wave │ ├─────────┼────────────────────────┼─────────┼───────┼──────────┼─────────────────┤ │ 15.1.11 │ Buffer Write Instr │ 129.34 │ 0.00 │ 3426.14 │ Instr per wave │ ├─────────┼────────────────────────┼─────────┼───────┼──────────┼─────────────────┤ │ 15.1.12 │ Buffer Atomic Instr │ 0.00 │ 0.00 │ 0.00 │ Instr per wave │ ├─────────┼────────────────────────┼─────────┼───────┼──────────┼─────────────────┤ │ 15.1.13 │ Buffer Total Cylces │ 962.69 │ 0.00 │ 25757.96 │ Cycles per wave │ ├─────────┼────────────────────────┼─────────┼───────┼──────────┼─────────────────┤ │ 15.1.14 │ Buffer Coalesced Read │ 426.53 │ 0.00 │ 11501.33 │ Cycles per wave │ ├─────────┼────────────────────────┼─────────┼───────┼──────────┼─────────────────┤ │ 15.1.15 │ Buffer Coalesced Write │ 517.37 │ 0.00 │ 13704.55 │ Cycles per wave │ ╘═════════╧════════════════════════╧═════════╧═══════╧══════════╧═════════════════╛ 15.2 TD ╒═════════╤═══════════════════╤═════════╤═══════╤══════════╤════════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪═══════════════════╪═════════╪═══════╪══════════╪════════════════╡ │ 15.2.0 │ TD Busy │ 83.71 │ 38.77 │ 99.37 │ Pct │ ├─────────┼───────────────────┼─────────┼───────┼──────────┼────────────────┤ │ 15.2.1 │ TC2TD Stall │ 56.39 │ 21.23 │ 98.16 │ Pct │ ├─────────┼───────────────────┼─────────┼───────┼──────────┼────────────────┤ │ 15.2.2 │ SPI2TD Stall │ 0.00 │ 0.00 │ 0.04 │ Pct │ ├─────────┼───────────────────┼─────────┼───────┼──────────┼────────────────┤ │ 15.2.3 │ Coalescable Instr │ 265.85 │ 0.00 │ 6905.59 │ Instr per wave │ ├─────────┼───────────────────┼─────────┼───────┼──────────┼────────────────┤ │ 15.2.4 │ Load Instr │ 3809.61 │ 5.00 │ 28125.00 │ Instr per wave │ ├─────────┼───────────────────┼─────────┼───────┼──────────┼────────────────┤ │ 15.2.5 │ Store Instr │ 787.98 │ 1.00 │ 8975.26 │ Instr per wave │ ├─────────┼───────────────────┼─────────┼───────┼──────────┼────────────────┤ │ 15.2.6 │ Atomic Instr │ 1.32 │ 0.00 │ 111.18 │ Instr per wave │ ╘═════════╧═══════════════════╧═════════╧═══════╧══════════╧════════════════╛ -------------------------------------------------------------------------------- 16. Vector L1 Data Cache 16.1 Speed-of-Light ╒═════════╤═══════════════════╤═════════╤═════════════╕ │ Index │ Metric │ Value │ Unit │ ╞═════════╪═══════════════════╪═════════╪═════════════╡ │ 16.1.0 │ Buffer Coalescing │ 25.28 │ Pct of peak │ ├─────────┼───────────────────┼─────────┼─────────────┤ │ 16.1.1 │ Cache Util │ 86.66 │ Pct of peak │ ├─────────┼───────────────────┼─────────┼─────────────┤ │ 16.1.2 │ Cache BW │ 33.51 │ Pct of peak │ ├─────────┼───────────────────┼─────────┼─────────────┤ │ 16.1.3 │ Cache Hit │ 74.13 │ Pct of peak │ ╘═════════╧═══════════════════╧═════════╧═════════════╛ 16.2 L1D Cache Stalls ╒═════════╤════════════════════════╤═══════╤═══════╤═══════╤════════╕ │ Index │ Metric │ Avg │ Min │ Max │ unit │ ╞═════════╪════════════════════════╪═══════╪═══════╪═══════╪════════╡ │ 16.2.0 │ Stalled on L2 Data │ 54.05 │ 19.05 │ 96.46 │ Pct │ ├─────────┼────────────────────────┼───────┼───────┼───────┼────────┤ │ 16.2.1 │ Stalled on L2 Req │ 2.47 │ 0.00 │ 86.09 │ Pct │ ├─────────┼────────────────────────┼───────┼───────┼───────┼────────┤ │ 16.2.2 │ Tag RAM Stall (Read) │ 0.58 │ 0.00 │ 4.79 │ Pct │ ├─────────┼────────────────────────┼───────┼───────┼───────┼────────┤ │ 16.2.3 │ Tag RAM Stall (Write) │ 0.14 │ 0.00 │ 2.40 │ Pct │ ├─────────┼────────────────────────┼───────┼───────┼───────┼────────┤ │ 16.2.4 │ Tag RAM Stall (Atomic) │ 0.00 │ 0.00 │ 0.01 │ Pct │ ╘═════════╧════════════════════════╧═══════╧═══════╧═══════╧════════╛ 16.3 L1D Cache Accesses ╒═════════╤═════════════════════╤════════════╤════════════╤════════════╤════════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪═════════════════════╪════════════╪════════════╪════════════╪════════════════╡ │ 16.3.0 │ Total Req │ 281899.40 │ 384.00 │ 1900000.00 │ Req per wave │ ├─────────┼─────────────────────┼────────────┼────────────┼────────────┼────────────────┤ │ 16.3.1 │ Read Req │ 237601.47 │ 320.00 │ 1800000.00 │ Req per wave │ ├─────────┼─────────────────────┼────────────┼────────────┼────────────┼────────────────┤ │ 16.3.2 │ Write Req │ 44213.50 │ 64.00 │ 409962.18 │ Req per wave │ ├─────────┼─────────────────────┼────────────┼────────────┼────────────┼────────────────┤ │ 16.3.3 │ Atomic Req │ 83.68 │ 0.00 │ 7034.27 │ Req per wave │ ├─────────┼─────────────────────┼────────────┼────────────┼────────────┼────────────────┤ │ 16.3.4 │ Cache BW │ 4010.45 │ 586.54 │ 10957.91 │ Gb/s │ ├─────────┼─────────────────────┼────────────┼────────────┼────────────┼────────────────┤ │ 16.3.5 │ Cache Accesses │ 93555.65 │ 120.00 │ 532954.55 │ Req per wave │ ├─────────┼─────────────────────┼────────────┼────────────┼────────────┼────────────────┤ │ 16.3.6 │ Cache Hits │ 70065.39 │ 78.63 │ 478002.21 │ Req per wave │ ├─────────┼─────────────────────┼────────────┼────────────┼────────────┼────────────────┤ │ 16.3.7 │ Cache Hit Rate │ 74.13 │ 0.26 │ 94.83 │ Pct │ ├─────────┼─────────────────────┼────────────┼────────────┼────────────┼────────────────┤ │ 16.3.8 │ Invalidate │ 0.07 │ 0.00 │ 5.56 │ Req per wave │ ├─────────┼─────────────────────┼────────────┼────────────┼────────────┼────────────────┤ │ 16.3.9 │ L1-L2 BW │ 1503376.54 │ 1503376.54 │ 1503376.54 │ Bytes per wave │ ├─────────┼─────────────────────┼────────────┼────────────┼────────────┼────────────────┤ │ 16.3.10 │ L1-L2 Read │ 16745.81 │ 1.38 │ 146443.17 │ Req per wave │ ├─────────┼─────────────────────┼────────────┼────────────┼────────────┼────────────────┤ │ 16.3.11 │ L1-L2 Write │ 6738.96 │ 8.00 │ 66486.25 │ Req per wave │ ├─────────┼─────────────────────┼────────────┼────────────┼────────────┼────────────────┤ │ 16.3.12 │ L1-L2 Atomic │ 5.48 │ 0.00 │ 459.50 │ Req per wave │ ├─────────┼─────────────────────┼────────────┼────────────┼────────────┼────────────────┤ │ 16.3.13 │ L1 Access Latency │ 955.65 │ 231.30 │ 4276.00 │ Cycles │ ├─────────┼─────────────────────┼────────────┼────────────┼────────────┼────────────────┤ │ 16.3.14 │ L1-L2 Read Latency │ 630.87 │ 163.52 │ 3696.35 │ Cycles │ ├─────────┼─────────────────────┼────────────┼────────────┼────────────┼────────────────┤ │ 16.3.15 │ L1-L2 Write Latency │ 280.79 │ 192.40 │ 1418.30 │ Cycles │ ╘═════════╧═════════════════════╧════════════╧════════════╧════════════╧════════════════╛ 16.4 L1D - L2 Transactions ╒═════════╤═════════════╤════════╤═════════════╤══════════╤═══════╤═══════════╤══════════════╕ │ Index │ Metric │ Xfer │ Coherency │ Avg │ Min │ Max │ Unit │ ╞═════════╪═════════════╪════════╪═════════════╪══════════╪═══════╪═══════════╪══════════════╡ │ 16.4.0 │ NC - Read │ Read │ NC │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼─────────────┼────────┼─────────────┼──────────┼───────┼───────────┼──────────────┤ │ 16.4.1 │ UC - Read │ Read │ UC │ 0.00 │ 0.00 │ 0.06 │ Req per wave │ ├─────────┼─────────────┼────────┼─────────────┼──────────┼───────┼───────────┼──────────────┤ │ 16.4.2 │ CC - Read │ Read │ CC │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼─────────────┼────────┼─────────────┼──────────┼───────┼───────────┼──────────────┤ │ 16.4.3 │ RW - Read │ Read │ RW │ 16744.56 │ 1.38 │ 146443.09 │ Req per wave │ ├─────────┼─────────────┼────────┼─────────────┼──────────┼───────┼───────────┼──────────────┤ │ 16.4.4 │ RW - Write │ Write │ RW │ 6738.96 │ 8.00 │ 66486.25 │ Req per wave │ ├─────────┼─────────────┼────────┼─────────────┼──────────┼───────┼───────────┼──────────────┤ │ 16.4.5 │ NC - Write │ Write │ NC │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼─────────────┼────────┼─────────────┼──────────┼───────┼───────────┼──────────────┤ │ 16.4.6 │ UC - Write │ Write │ UC │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼─────────────┼────────┼─────────────┼──────────┼───────┼───────────┼──────────────┤ │ 16.4.7 │ CC - Write │ Write │ CC │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼─────────────┼────────┼─────────────┼──────────┼───────┼───────────┼──────────────┤ │ 16.4.8 │ NC - Atomic │ Atomic │ NC │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼─────────────┼────────┼─────────────┼──────────┼───────┼───────────┼──────────────┤ │ 16.4.9 │ UC - Atomic │ Atomic │ UC │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼─────────────┼────────┼─────────────┼──────────┼───────┼───────────┼──────────────┤ │ 16.4.10 │ CC - Atomic │ Atomic │ CC │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼─────────────┼────────┼─────────────┼──────────┼───────┼───────────┼──────────────┤ │ 16.4.11 │ RW - Atomic │ Atomic │ RW │ 5.44 │ 0.00 │ 457.40 │ Req per wave │ ╘═════════╧═════════════╧════════╧═════════════╧══════════╧═══════╧═══════════╧══════════════╛ 16.5 L1D Addr Translation ╒═════════╤══════════════════════╤══════════╤═══════╤═══════════╤═════════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Units │ ╞═════════╪══════════════════════╪══════════╪═══════╪═══════════╪═════════════════╡ │ 16.5.0 │ Req │ 85574.75 │ 96.31 │ 475585.97 │ Req per wave │ ├─────────┼──────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 16.5.1 │ Hit Ratio │ 93.70 │ 20.31 │ 99.96 │ Pct │ ├─────────┼──────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 16.5.2 │ Hits │ 79608.57 │ 95.08 │ 471963.02 │ Hits per wave │ ├─────────┼──────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 16.5.3 │ Misses (Translation) │ 3671.16 │ 0.06 │ 98732.08 │ Misses per wave │ ├─────────┼──────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 16.5.4 │ Misses (Permission) │ 9.75 │ 0.00 │ 243.93 │ Misses per wave │ ╘═════════╧══════════════════════╧══════════╧═══════╧═══════════╧═════════════════╛ -------------------------------------------------------------------------------- 17. L2 Cache 17.1 Speed-of-Light ╒═════════╤═════════════╤═════════╤════════╕ │ Index │ Metric │ Value │ Unit │ ╞═════════╪═════════════╪═════════╪════════╡ │ 17.1.0 │ L2 Util │ 90.83 │ Pct │ ├─────────┼─────────────┼─────────┼────────┤ │ 17.1.1 │ Cache Hit │ 58.49 │ Pct │ ├─────────┼─────────────┼─────────┼────────┤ │ 17.1.2 │ L2-EA Rd BW │ 290.31 │ Gb/s │ ├─────────┼─────────────┼─────────┼────────┤ │ 17.1.3 │ L2-EA Wr BW │ 190.82 │ Gb/s │ ╘═════════╧═════════════╧═════════╧════════╛ 17.2 L2 - Fabric Transactions ╒═════════╤══════════════════════╤═══════════╤════════╤════════════╤════════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪══════════════════════╪═══════════╪════════╪════════════╪════════════════╡ │ 17.2.0 │ Read BW │ 623291.18 │ 2.50 │ 8309635.42 │ Bytes per wave │ ├─────────┼──────────────────────┼───────────┼────────┼────────────┼────────────────┤ │ 17.2.1 │ Write BW │ 366725.23 │ 497.43 │ 3643634.62 │ Bytes per wave │ ├─────────┼──────────────────────┼───────────┼────────┼────────────┼────────────────┤ │ 17.2.2 │ Read (32B) │ 0.06 │ 0.00 │ 2.27 │ Req per wave │ ├─────────┼──────────────────────┼───────────┼────────┼────────────┼────────────────┤ │ 17.2.3 │ Read (Uncached 32B) │ 0.31 │ 0.00 │ 1.11 │ Req per wave │ ├─────────┼──────────────────────┼───────────┼────────┼────────────┼────────────────┤ │ 17.2.4 │ Read (64B) │ 9738.89 │ 0.04 │ 129837.71 │ Req per wave │ ├─────────┼──────────────────────┼───────────┼────────┼────────────┼────────────────┤ │ 17.2.5 │ HBM Read │ 9735.97 │ 0.04 │ 130087.65 │ Req per wave │ ├─────────┼──────────────────────┼───────────┼────────┼────────────┼────────────────┤ │ 17.2.6 │ Write (32B) │ 83.60 │ 0.00 │ 1504.84 │ Req per wave │ ├─────────┼──────────────────────┼───────────┼────────┼────────────┼────────────────┤ │ 17.2.7 │ Write (Uncached 32B) │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼──────────────────────┼───────────┼────────┼────────────┼────────────────┤ │ 17.2.8 │ Write (64B) │ 5688.28 │ 7.77 │ 56904.60 │ Req per wave │ ├─────────┼──────────────────────┼───────────┼────────┼────────────┼────────────────┤ │ 17.2.9 │ HBM Write │ 5771.67 │ 7.77 │ 56972.64 │ Req per wave │ ├─────────┼──────────────────────┼───────────┼────────┼────────────┼────────────────┤ │ 17.2.10 │ Read Latency │ 601.80 │ 223.08 │ 2988.44 │ Cycles │ ├─────────┼──────────────────────┼───────────┼────────┼────────────┼────────────────┤ │ 17.2.11 │ Write Latency │ 426.43 │ 131.60 │ 1354.66 │ Cycles │ ├─────────┼──────────────────────┼───────────┼────────┼────────────┼────────────────┤ │ 17.2.12 │ Atomic Latency │ 744.21 │ 0.00 │ 1488.42 │ Cycles │ ├─────────┼──────────────────────┼───────────┼────────┼────────────┼────────────────┤ │ 17.2.13 │ Read Stall │ 0.09 │ 0.00 │ 2.02 │ Pct │ ├─────────┼──────────────────────┼───────────┼────────┼────────────┼────────────────┤ │ 17.2.14 │ Write Stall │ 0.01 │ 0.00 │ 3.22 │ Pct │ ╘═════════╧══════════════════════╧═══════════╧════════╧════════════╧════════════════╛ 17.3 L2 Cache Accesses ╒═════════╤════════════════════╤══════════╤═══════╤═══════════╤═════════════════╕ │ Index │ Metric │ Avg │ Min │ Max │ Unit │ ╞═════════╪════════════════════╪══════════╪═══════╪═══════════╪═════════════════╡ │ 17.3.0 │ Req │ 21206.25 │ 14.43 │ 146616.06 │ Req per wave │ ├─────────┼────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 17.3.1 │ Streaming Req │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 17.3.2 │ Read Req │ 14462.54 │ 2.13 │ 146445.04 │ Req per wave │ ├─────────┼────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 17.3.3 │ Write Req │ 6738.96 │ 8.00 │ 66486.25 │ Req per wave │ ├─────────┼────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 17.3.4 │ Atomic Req │ 5.41 │ 0.00 │ 457.14 │ Req per wave │ ├─────────┼────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 17.3.5 │ Probe Req │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 17.3.6 │ Hits │ 11449.64 │ 6.31 │ 85688.77 │ Hits per wave │ ├─────────┼────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 17.3.7 │ Misses │ 9754.49 │ 8.12 │ 124939.78 │ Misses per wave │ ├─────────┼────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 17.3.8 │ Cache Hit │ 58.49 │ 14.78 │ 98.29 │ Pct │ ├─────────┼────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 17.3.9 │ Writeback │ 2921.99 │ 3.89 │ 28499.46 │ per wave │ ├─────────┼────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 17.3.10 │ NC Req │ 0.28 │ 0.00 │ 1.65 │ Req per wave │ ├─────────┼────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 17.3.11 │ UC Req │ 0.15 │ 0.00 │ 0.57 │ Req per wave │ ├─────────┼────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 17.3.12 │ CC Req │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 17.3.13 │ RW Req │ 21209.39 │ 14.43 │ 146615.64 │ Req per wave │ ├─────────┼────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 17.3.14 │ Writeback (Normal) │ 2921.28 │ 3.89 │ 28497.05 │ per wave │ ├─────────┼────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 17.3.15 │ Writeback (TC Req) │ 0.00 │ 0.00 │ 0.22 │ per wave │ ├─────────┼────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 17.3.16 │ Evict (Normal) │ 9678.22 │ 0.30 │ 125200.27 │ per wave │ ├─────────┼────────────────────┼──────────┼───────┼───────────┼─────────────────┤ │ 17.3.17 │ Evict (TC Req) │ 0.00 │ 0.00 │ 0.36 │ per wave │ ╘═════════╧════════════════════╧══════════╧═══════╧═══════════╧═════════════════╛ 17.4 L2 - Fabric Interface Stalls ╒═════════╤═════════════════════════════╤═════════════════════╤═══════════════╤═══════╤═══════╤══════════╤══════════════╕ │ Index │ Metric │ Type │ Transaction │ Avg │ Min │ Max │ Unit │ ╞═════════╪═════════════════════════════╪═════════════════════╪═══════════════╪═══════╪═══════╪══════════╪══════════════╡ │ 17.4.0 │ Read - Remote Socket Stall │ Remote Socket Stall │ Read │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼─────────────────────────────┼─────────────────────┼───────────────┼───────┼───────┼──────────┼──────────────┤ │ 17.4.1 │ Read - Peer GCD Stall │ Peer GCD Stall │ Read │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼─────────────────────────────┼─────────────────────┼───────────────┼───────┼───────┼──────────┼──────────────┤ │ 17.4.2 │ Read - HBM Stall │ HBM Stall │ Read │ 13.77 │ 0.00 │ 9148.80 │ Req per wave │ ├─────────┼─────────────────────────────┼─────────────────────┼───────────────┼───────┼───────┼──────────┼──────────────┤ │ 17.4.3 │ Write - Remote Socket Stall │ Remote Socket Stall │ Write │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼─────────────────────────────┼─────────────────────┼───────────────┼───────┼───────┼──────────┼──────────────┤ │ 17.4.4 │ Write - Peer GCD Stall │ Peer GCD Stall │ Write │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼─────────────────────────────┼─────────────────────┼───────────────┼───────┼───────┼──────────┼──────────────┤ │ 17.4.5 │ Write - HBM Stall │ HBM Stall │ Write │ 18.06 │ 0.00 │ 13946.25 │ Req per wave │ ├─────────┼─────────────────────────────┼─────────────────────┼───────────────┼───────┼───────┼──────────┼──────────────┤ │ 17.4.6 │ Write - Credit Starvation │ Credit Starvation │ Write │ 0.28 │ 0.00 │ 20.93 │ Req per wave │ ╘═════════╧═════════════════════════════╧═════════════════════╧═══════════════╧═══════╧═══════╧══════════╧══════════════╛ -------------------------------------------------------------------------------- 18. L2 Cache (per Channel) 18.1 Aggregate Stats (All 32 channels) ╒═════════╤════════════════════════════╤════════╤═══════════╤════════╤═════════╤═════════════════╕ │ Index │ Metric │ Avg │ Std Dev │ Min │ Max │ Unit │ ╞═════════╪════════════════════════════╪════════╪═══════════╪════════╪═════════╪═════════════════╡ │ 18.1.0 │ L2 Cache Hit Rate │ 58.49 │ 16.60 │ 14.48 │ 98.24 │ Pct │ ├─────────┼────────────────────────────┼────────┼───────────┼────────┼─────────┼─────────────────┤ │ 18.1.1 │ Req │ 662.82 │ 1050.87 │ 0.45 │ 4581.77 │ Req per wave │ ├─────────┼────────────────────────────┼────────┼───────────┼────────┼─────────┼─────────────────┤ │ 18.1.2 │ L1 - L2 Read Req │ 451.99 │ 845.10 │ 0.07 │ 4576.43 │ Req per wave │ ├─────────┼────────────────────────────┼────────┼───────────┼────────┼─────────┼─────────────────┤ │ 18.1.3 │ L1 - L2 Write Req │ 210.59 │ 405.05 │ 0.25 │ 2077.70 │ Req per wave │ ├─────────┼────────────────────────────┼────────┼───────────┼────────┼─────────┼─────────────────┤ │ 18.1.4 │ L1 - L2 Atomic Req │ 0.17 │ 1.52 │ 0.00 │ 14.38 │ Req per wave │ ├─────────┼────────────────────────────┼────────┼───────────┼────────┼─────────┼─────────────────┤ │ 18.1.5 │ L2 - EA Read Req │ 304.41 │ 704.57 │ 0.00 │ 4051.64 │ Req per wave │ ├─────────┼────────────────────────────┼────────┼───────────┼────────┼─────────┼─────────────────┤ │ 18.1.6 │ L2 - EA Write Req │ 180.36 │ 345.71 │ 0.24 │ 1780.56 │ Req per wave │ ├─────────┼────────────────────────────┼────────┼───────────┼────────┼─────────┼─────────────────┤ │ 18.1.7 │ L2 - EA Atomic Req │ 0.00 │ 0.00 │ 0.00 │ 0.00 │ Req per wave │ ├─────────┼────────────────────────────┼────────┼───────────┼────────┼─────────┼─────────────────┤ │ 18.1.8 │ L2 - EA Read Lat │ 602.40 │ 524.97 │ 208.36 │ 3023.45 │ Cycles │ ├─────────┼────────────────────────────┼────────┼───────────┼────────┼─────────┼─────────────────┤ │ 18.1.9 │ L2 - EA Write Lat │ 425.44 │ 250.07 │ 131.46 │ 1345.08 │ Cycles │ ├─────────┼────────────────────────────┼────────┼───────────┼────────┼─────────┼─────────────────┤ │ 18.1.10 │ L2 - EA Atomic Lat │ 494.00 │ 40.66 │ 465.25 │ 522.75 │ Cycles │ ├─────────┼────────────────────────────┼────────┼───────────┼────────┼─────────┼─────────────────┤ │ 18.1.11 │ L2 - EA Read Stall (IO) │ 0.00 │ 0.00 │ 0.00 │ 0.00 │ Cycles per wave │ ├─────────┼────────────────────────────┼────────┼───────────┼────────┼─────────┼─────────────────┤ │ 18.1.12 │ L2 - EA Read Stall (GMI) │ 0.00 │ 0.00 │ 0.00 │ 0.00 │ Cycles per wave │ ├─────────┼────────────────────────────┼────────┼───────────┼────────┼─────────┼─────────────────┤ │ 18.1.13 │ L2 - EA Read Stall (DRAM) │ 0.43 │ 9.10 │ 0.00 │ 286.14 │ Cycles per wave │ ├─────────┼────────────────────────────┼────────┼───────────┼────────┼─────────┼─────────────────┤ │ 18.1.14 │ L2 - EA Write Stall (IO) │ 0.00 │ 0.00 │ 0.00 │ 0.00 │ Cycles per wave │ ├─────────┼────────────────────────────┼────────┼───────────┼────────┼─────────┼─────────────────┤ │ 18.1.15 │ L2 - EA Write Stall (GMI) │ 0.00 │ 0.00 │ 0.00 │ 0.00 │ Cycles per wave │ ├─────────┼────────────────────────────┼────────┼───────────┼────────┼─────────┼─────────────────┤ │ 18.1.16 │ L2 - EA Write Stall (DRAM) │ 0.55 │ 12.55 │ 0.00 │ 474.21 │ Cycles per wave │ ├─────────┼────────────────────────────┼────────┼───────────┼────────┼─────────┼─────────────────┤ │ 18.1.17 │ L2 - EA Write Starve │ 0.01 │ 0.06 │ 0.00 │ 0.72 │ Cycles per wave │ ╘═════════╧════════════════════════════╧════════╧═══════════╧════════╧═════════╧═════════════════╛ 18.2 Channel 0-15 ╒═════════════════════════════════════════╤══════════╤══════════╤══════════╤══════════╤══════════╤══════════╤══════════╤══════════╤══════════╤══════════╤═══════════╤═══════════╤═══════════╤═══════════╤═══════════╤═══════════╕ │ │ 18.2.0 │ 18.2.1 │ 18.2.2 │ 18.2.3 │ 18.2.4 │ 18.2.5 │ 18.2.6 │ 18.2.7 │ 18.2.8 │ 18.2.9 │ 18.2.10 │ 18.2.11 │ 18.2.12 │ 18.2.13 │ 18.2.14 │ 18.2.15 │ ╞═════════════════════════════════════════╪══════════╪══════════╪══════════╪══════════╪══════════╪══════════╪══════════╪══════════╪══════════╪══════════╪═══════════╪═══════════╪═══════════╪═══════════╪═══════════╪═══════════╡ │ Channel │ 0.0 │ 1.0 │ 2.0 │ 3.0 │ 4.0 │ 5.0 │ 6.0 │ 7.0 │ 8.0 │ 9.0 │ 10.0 │ 11.0 │ 12.00 │ 13.0 │ 14.0 │ 15.0 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2 Cache Hit Rate (%) │ 58.42 │ 58.89 │ 56.07 │ 58.42 │ 58.83 │ 58.67 │ 56.85 │ 58.39 │ 58.48 │ 58.47 │ 58.84 │ 54.84 │ 58.31 │ 58.85 │ 58.5 │ 55.19 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ Requests (Requests) │ 676.29 │ 677.78 │ 632.67 │ 687.4 │ 670.49 │ 667.98 │ 640.51 │ 671.09 │ 670.94 │ 675.39 │ 677.34 │ 609.51 │ 679.10 │ 673.3 │ 669.59 │ 613.83 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L1-L2 Read (Requests) │ 464.77 │ 467.38 │ 421.02 │ 477.53 │ 459.54 │ 457.5 │ 429.16 │ 460.28 │ 460.12 │ 463.9 │ 466.95 │ 397.86 │ 469.23 │ 462.37 │ 459.13 │ 402.44 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L1-L2 Write (Requests) │ 211.45 │ 210.02 │ 211.58 │ 209.81 │ 210.88 │ 210.42 │ 210.65 │ 210.42 │ 210.45 │ 211.43 │ 210.01 │ 211.58 │ 209.80 │ 210.87 │ 210.4 │ 210.68 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L1-L2 Atomic (Requests) │ 0.79 │ 0.09 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.79 │ 0.03 │ 0.0 │ 0.00 │ 0.0 │ 0.0 │ 0.0 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Read (Requests) │ 304.97 │ 303.81 │ 305.05 │ 304.42 │ 304.18 │ 304.3 │ 304.44 │ 304.12 │ 304.15 │ 304.86 │ 303.75 │ 305.03 │ 304.40 │ 304.23 │ 304.35 │ 304.44 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Write (Requests) │ 181.21 │ 179.77 │ 181.35 │ 179.55 │ 180.69 │ 180.13 │ 180.41 │ 180.17 │ 180.19 │ 181.18 │ 179.77 │ 181.34 │ 179.54 │ 180.7 │ 180.12 │ 180.43 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Atomic (Requests) │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.00 │ 0.0 │ 0.0 │ 0.0 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Read Latency (Cycles) │ 636.48 │ 645.36 │ 769.98 │ 584.66 │ 679.9 │ 631.94 │ 649.99 │ 674.25 │ 595.26 │ 639.52 │ 566.12 │ 615.31 │ 589.73 │ 586.42 │ 600.62 │ 604.75 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Write Latency (Cycles) │ 418.77 │ 420.24 │ 415.28 │ 440.1 │ 421.8 │ 428.1 │ 423.07 │ 437.24 │ 411.07 │ 427.85 │ 414.65 │ 426.78 │ 425.08 │ 424.82 │ 425.58 │ 448.91 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Atomic Latency (Cycles) │ │ │ │ │ │ │ │ │ │ │ │ │ 501.86 │ │ │ │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Read Stall - IO (Cycles per) │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.00 │ 0.0 │ 0.0 │ 0.0 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Read Stall - GMI (Cycles per) │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.00 │ 0.0 │ 0.0 │ 0.0 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Read Stall - DRAM (Cycles per) │ 0.44 │ 0.45 │ 0.44 │ 0.41 │ 0.45 │ 0.43 │ 0.4 │ 0.44 │ 0.41 │ 0.44 │ 0.44 │ 0.41 │ 0.43 │ 0.44 │ 0.41 │ 0.45 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Write Stall - IO (Cycles per) │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.00 │ 0.0 │ 0.0 │ 0.0 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Write Stall - GMI (Cycles per) │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.00 │ 0.0 │ 0.0 │ 0.0 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Write Stall - DRAM (Cycles per) │ 0.51 │ 0.6 │ 0.53 │ 0.56 │ 0.54 │ 0.57 │ 0.53 │ 0.67 │ 0.58 │ 0.53 │ 0.58 │ 0.58 │ 0.54 │ 0.59 │ 0.56 │ 0.59 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Write Stall - Starve (Cycles per) │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ ╘═════════════════════════════════════════╧══════════╧══════════╧══════════╧══════════╧══════════╧══════════╧══════════╧══════════╧══════════╧══════════╧═══════════╧═══════════╧═══════════╧═══════════╧═══════════╧═══════════╛ 18.3 Channel 16-31 ╒═════════════════════════════════════════╤══════════╤══════════╤══════════╤══════════╤══════════╤══════════╤══════════╤══════════╤══════════╤══════════╤═══════════╤═══════════╤═══════════╤═══════════╤═══════════╤═══════════╕ │ │ 18.3.0 │ 18.3.1 │ 18.3.2 │ 18.3.3 │ 18.3.4 │ 18.3.5 │ 18.3.6 │ 18.3.7 │ 18.3.8 │ 18.3.9 │ 18.3.10 │ 18.3.11 │ 18.3.12 │ 18.3.13 │ 18.3.14 │ 18.3.15 │ ╞═════════════════════════════════════════╪══════════╪══════════╪══════════╪══════════╪══════════╪══════════╪══════════╪══════════╪══════════╪══════════╪═══════════╪═══════════╪═══════════╪═══════════╪═══════════╪═══════════╡ │ Channel │ 16.0 │ 17.0 │ 18.0 │ 19.0 │ 20.0 │ 21.0 │ 22.0 │ 23.0 │ 24.0 │ 25.0 │ 26.0 │ 27.0 │ 28.0 │ 29.0 │ 30.00 │ 31.0 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2 Cache Hit Rate (%) │ 55.18 │ 58.45 │ 58.54 │ 59.25 │ 54.83 │ 58.63 │ 58.86 │ 58.82 │ 58.67 │ 57.01 │ 58.43 │ 58.68 │ 59.32 │ 56.96 │ 58.60 │ 58.89 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ Requests (Requests) │ 609.32 │ 672.15 │ 673.39 │ 683.04 │ 605.69 │ 677.93 │ 670.98 │ 672.43 │ 672.37 │ 637.24 │ 670.7 │ 684.02 │ 684.9 │ 644.98 │ 678.11 │ 679.7 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L1-L2 Read (Requests) │ 399.0 │ 459.82 │ 463.1 │ 471.89 │ 395.71 │ 466.84 │ 461.66 │ 460.73 │ 460.65 │ 426.94 │ 458.37 │ 473.74 │ 473.74 │ 434.97 │ 467.02 │ 470.38 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L1-L2 Write (Requests) │ 209.63 │ 211.83 │ 210.22 │ 210.79 │ 209.92 │ 210.98 │ 209.26 │ 211.63 │ 211.65 │ 209.62 │ 211.84 │ 210.21 │ 210.79 │ 209.95 │ 210.96 │ 209.25 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L1-L2 Atomic (Requests) │ 0.0 │ 0.0 │ 0.82 │ 1.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.81 │ 1.0 │ 0.1 │ 0.00 │ 0.0 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Read (Requests) │ 304.0 │ 304.59 │ 304.4 │ 304.34 │ 304.41 │ 304.58 │ 304.0 │ 305.05 │ 305.02 │ 304.04 │ 304.64 │ 304.38 │ 304.35 │ 304.43 │ 304.54 │ 304.01 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Write (Requests) │ 179.37 │ 181.6 │ 179.98 │ 180.56 │ 179.7 │ 180.75 │ 179.0 │ 181.54 │ 181.55 │ 179.35 │ 181.59 │ 179.97 │ 180.56 │ 179.73 │ 180.73 │ 179.0 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Atomic (Requests) │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.00 │ 0.0 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Read Latency (Cycles) │ 616.66 │ 605.75 │ 639.57 │ 806.57 │ 571.47 │ 823.69 │ 914.11 │ 752.82 │ 572.54 │ 631.91 │ 604.5 │ 590.66 │ 609.56 │ 617.3 │ 860.47 │ 666.57 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Write Latency (Cycles) │ 422.04 │ 425.76 │ 410.58 │ 432.7 │ 419.61 │ 427.55 │ 422.08 │ 444.5 │ 419.5 │ 420.29 │ 411.02 │ 436.37 │ 423.9 │ 428.56 │ 429.69 │ 438.5 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Atomic Latency (Cycles) │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ 470.42 │ │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Read Stall - IO (Cycles per) │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.00 │ 0.0 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Read Stall - GMI (Cycles per) │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.00 │ 0.0 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Read Stall - DRAM (Cycles per) │ 0.42 │ 0.43 │ 0.45 │ 0.43 │ 0.42 │ 0.44 │ 0.43 │ 0.43 │ 0.41 │ 0.42 │ 0.41 │ 0.41 │ 0.43 │ 0.46 │ 0.43 │ 0.45 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Write Stall - IO (Cycles per) │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.00 │ 0.0 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Write Stall - GMI (Cycles per) │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.0 │ 0.00 │ 0.0 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Write Stall - DRAM (Cycles per) │ 0.5 │ 0.48 │ 0.45 │ 0.69 │ 0.51 │ 0.54 │ 0.58 │ 0.51 │ 0.46 │ 0.51 │ 0.46 │ 0.49 │ 0.65 │ 0.53 │ 0.55 │ 0.58 │ ├─────────────────────────────────────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼──────────┼───────────┼───────────┼───────────┼───────────┼───────────┼───────────┤ │ L2-EA Write Stall - Starve (Cycles per) │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ 0.01 │ ╘═════════════════════════════════════════╧══════════╧══════════╧══════════╧══════════╧══════════╧══════════╧══════════╧══════════╧══════════╧══════════╧═══════════╧═══════════╧═══════════╧═══════════╧═══════════╧═══════════╛