Integrate llvm/llvm-project@27ac46e6bea2 #17662

antiagainst · 2024-06-13T04:09:52Z

Updated to llvm/llvm-project@27ac46e6bea2

Used LLVM MathExtras.h to replace MLIR one
Updated applySignatureConversion usage

Updated to openxla/stablehlo@dd48ec5

chlo.minimum_broadcast_shapes op was removed
Delete chlo.minimum_broadcast_shapes op openxla/stablehlo#2287
chlo.dynamic_reshape op was removed
Remove unused chlo.dynamic_reshape and downstream ops openxla/stablehlo#2286
Added batching dims to scatter dims
[stablehlo] Add batching dims to stablehlo.gather and stablehlo.scatter openxla/stablehlo#2259

Updated to llvm/torch-mlir@77d7f64

github-actions · 2024-06-13T05:19:05Z

Abbreviated Benchmark Summary

@ commit b918d15fd1fa968cb5c401910f67edd7cd702c58 (vs. base f4279657ef8da12d07f068a37cbd93986edb47d8)

Data-Tiling Comparison Table

Click to show

Name	No-DT (baseline)	DT-Only	DT-UK
BertForMaskedLMTF(stablehlo) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[30-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	216.588 (1.0X)	136.228 (1.6X)	107.958 (2.0X)
BertLargeTF(stablehlo) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[30-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	742.909 (1.0X)	273.101 (2.7X)	222.530 (3.3X)
DeepLabV3_fp32(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	31.949 (1.0X)	36.997 (0.9X)	30.029 (1.1X)
DeepLabV3_fp32(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[8-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	6.924 (1.0X)	9.291 (0.7X)	8.488 (0.8X)
EfficientNetV2STF(stablehlo) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	273.836 (1.0X)	258.584 (1.1X)	229.107 (1.2X)
EfficientNetV2STF(stablehlo) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[15-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	35.882 (1.0X)	36.161 (1.0X)	34.048 (1.1X)
EfficientNet_int8(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	26.875 (1.0X)	51.654 (0.5X)	13.073 (2.1X)
EfficientNet_int8(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[8-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	5.810 (1.0X)	10.966 (0.5X)	5.011 (1.2X)
GPT2_117M_TF_1X1XI32(stablehlo) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	70.099 (1.0X)	39.009 (1.8X)	39.880 (1.8X)
GPT2_117M_TF_1X1XI32(stablehlo) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[15-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	9.132 (1.0X)	8.426 (1.1X)	8.427 (1.1X)
GPT2_117M_TF_1X4XI32(stablehlo) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	88.627 (1.0X)	42.185 (2.1X)	41.799 (2.1X)
GPT2_117M_TF_1X4XI32(stablehlo) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[15-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	11.043 (1.0X)	8.942 (1.2X)	8.844 (1.2X)
MiniLML12H384Uncased(stablehlo) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	79.368 (1.0X)	78.974 (1.0X)	57.119 (1.4X)
MiniLML12H384Uncased(stablehlo) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[15-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	12.297 (1.0X)	15.543 (0.8X)	13.807 (0.9X)
MobileBertSquad_fp16(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	180.604 (1.0X)	249.701 (0.7X)	185.516 (1.0X)
MobileBertSquad_fp16(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[15-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	34.365 (1.0X)	65.402 (0.5X)	61.207 (0.6X)
MobileBertSquad_fp32(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	181.452 (1.0X)	258.734 (0.7X)	190.092 (1.0X)
MobileBertSquad_fp32(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[15-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	34.127 (1.0X)	66.019 (0.5X)	61.293 (0.6X)
MobileBertSquad_int8(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	490.488 (1.0X)	1069.969 (0.5X)	214.015 (2.3X)
MobileBertSquad_int8(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[15-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	66.354 (1.0X)	132.469 (0.5X)	62.066 (1.1X)
MobileNetV1_fp32(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	24.524 (1.0X)	22.923 (1.1X)	18.116 (1.4X)
MobileNetV1_fp32(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[8-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	4.975 (1.0X)	5.314 (0.9X)	4.534 (1.1X)
MobileNetV2_fp32(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	11.844 (1.0X)	15.349 (0.8X)	11.374 (1.0X)
MobileNetV2_fp32(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[8-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	3.728 (1.0X)	5.376 (0.7X)	4.886 (0.8X)
MobileNetV2_int8(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	21.595 (1.0X)	42.746 (0.5X)	11.864 (1.8X)
MobileNetV2_int8(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[8-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	5.843 (1.0X)	9.586 (0.6X)	5.403 (1.1X)
MobileNetV3Small_fp32(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_sync(embedded_elf)[full-inference,default-flags] with default @ c2-standard-60[cpu]	2.771 (1.0X)	3.335 (0.8X)	2.719 (1.0X)
MobileNetV3Small_fp32(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	2.848 (1.0X)	3.462 (0.8X)	2.824 (1.0X)
MobileSSD_fp32(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	35.119 (1.0X)	39.143 (0.9X)	31.758 (1.1X)
MobileSSD_fp32(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[8-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	8.480 (1.0X)	10.922 (0.8X)	9.806 (0.9X)
PersonDetect_int8(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_sync(embedded_elf)[full-inference,default-flags] with default @ c2-standard-60[cpu]	0.698 (1.0X)	1.300 (0.5X)	0.573 (1.2X)
PersonDetect_int8(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	0.766 (1.0X)	1.378 (0.6X)	0.632 (1.2X)
PoseNet_fp32(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	17.591 (1.0X)	24.207 (0.7X)	18.919 (0.9X)
PoseNet_fp32(tflite) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_task(embedded_elf)[8-thread,full-inference,default-flags] with default @ c2-standard-60[cpu]	4.113 (1.0X)	5.902 (0.7X)	5.123 (0.8X)
matmul_256x256x2048_i8_i4_i32_tile_config_default(linalg) [x86_64-cascadelake-linux_gnu-llvm_cpu] local_sync(embedded_elf)[full-inference,default-flags] with default @ c2-standard-60[cpu]	7.593 (1.0X)	7.552 (1.0X)	7.579 (1.0X)
DeepLabV3_fp32(tflite) [armv8.2-a-generic-linux_android29-llvm_cpu] local_sync(embedded_elf)[full-inference,default-flags] with default @ pixel-6-pro[big-cores]	48.870 (1.0X)	85.362 (0.6X)	43.950 (1.1X)
DeepLabV3_fp32(tflite) [armv8.2-a-generic-linux_android29-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,system-scheduling] with default @ pixel-6-pro[big-cores]	50.161 (1.0X)	86.173 (0.6X)	44.522 (1.1X)
DeepLabV3_fp32(tflite) [armv8.2-a-generic-linux_android29-llvm_cpu] local_task(embedded_elf)[2-thread,full-inference,system-scheduling] with default @ pixel-6-pro[big-cores]	30.148 (1.0X)	50.222 (0.6X)	27.713 (1.1X)
GPT2_117M_TF_1X1XI32(stablehlo) [armv8.2-a-generic-linux_android29-llvm_cpu] local_sync(embedded_elf)[full-inference,default-flags] with default @ pixel-6-pro[big-cores]	91.988 (1.0X)	21.605 (4.3X)	21.298 (4.3X)
GPT2_117M_TF_1X1XI32(stablehlo) [armv8.2-a-generic-linux_android29-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,system-scheduling] with default @ pixel-6-pro[big-cores]	92.809 (1.0X)	22.112 (4.2X)	21.786 (4.3X)
GPT2_117M_TF_1X1XI32(stablehlo) [armv8.2-a-generic-linux_android29-llvm_cpu] local_task(embedded_elf)[2-thread,full-inference,system-scheduling] with default @ pixel-6-pro[big-cores]	52.257 (1.0X)	21.971 (2.4X)	21.738 (2.4X)
GPT2_117M_TF_1X4XI32(stablehlo) [armv8.2-a-generic-linux_android29-llvm_cpu] local_sync(embedded_elf)[full-inference,default-flags] with default @ pixel-6-pro[big-cores]	134.269 (1.0X)	27.732 (4.8X)	27.705 (4.8X)
GPT2_117M_TF_1X4XI32(stablehlo) [armv8.2-a-generic-linux_android29-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,system-scheduling] with default @ pixel-6-pro[big-cores]	134.984 (1.0X)	30.162 (4.5X)	29.443 (4.6X)
GPT2_117M_TF_1X4XI32(stablehlo) [armv8.2-a-generic-linux_android29-llvm_cpu] local_task(embedded_elf)[2-thread,full-inference,system-scheduling] with default @ pixel-6-pro[big-cores]	75.121 (1.0X)	26.746 (2.8X)	26.845 (2.8X)
MobileBertSquad_fp32(tflite) [armv8.2-a-generic-linux_android29-llvm_cpu] local_sync(embedded_elf)[full-inference,default-flags] with default @ pixel-6-pro[big-cores]	709.751 (1.0X)	449.043 (1.6X)	349.952 (2.0X)
MobileBertSquad_fp32(tflite) [armv8.2-a-generic-linux_android29-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,system-scheduling] with default @ pixel-6-pro[big-cores]	710.270 (1.0X)	464.069 (1.5X)	358.349 (2.0X)
MobileBertSquad_fp32(tflite) [armv8.2-a-generic-linux_android29-llvm_cpu] local_task(embedded_elf)[2-thread,full-inference,system-scheduling] with default @ pixel-6-pro[big-cores]	398.723 (1.0X)	276.855 (1.4X)	217.366 (1.8X)
MobileBertSquad_int8(tflite) [armv8.2-a-generic-linux_android29-llvm_cpu] local_sync(embedded_elf)[full-inference,default-flags] with default @ pixel-6-pro[big-cores]	1115.003 (1.0X)	1069.568 (1.0X)	304.249 (3.7X)
MobileBertSquad_int8(tflite) [armv8.2-a-generic-linux_android29-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,system-scheduling] with default @ pixel-6-pro[big-cores]	1118.333 (1.0X)	1074.236 (1.0X)	307.661 (3.6X)
MobileBertSquad_int8(tflite) [armv8.2-a-generic-linux_android29-llvm_cpu] local_task(embedded_elf)[2-thread,full-inference,system-scheduling] with default @ pixel-6-pro[big-cores]	580.417 (1.0X)	584.437 (1.0X)	182.949 (3.2X)
Vit_int8(tflite) [armv8.2-a-generic-linux_android29-llvm_cpu] local_sync(embedded_elf)[full-inference,default-flags] with default @ pixel-6-pro[big-cores]	2099.719 (1.0X)	1856.552 (1.1X)	302.392 (6.9X)
Vit_int8(tflite) [armv8.2-a-generic-linux_android29-llvm_cpu] local_task(embedded_elf)[1-thread,full-inference,system-scheduling] with default @ pixel-6-pro[big-cores]	2102.297 (1.0X)	1881.012 (1.1X)	301.545 (7.0X)
Vit_int8(tflite) [armv8.2-a-generic-linux_android29-llvm_cpu] local_task(embedded_elf)[2-thread,full-inference,system-scheduling] with default @ pixel-6-pro[big-cores]	1133.840 (1.0X)	1077.407 (1.1X)	179.527 (6.3X)
matmul_256x256x2048_i8_i4_i32_tile_config_default(linalg) [armv8.2-a-generic-linux_android29-llvm_cpu] local_sync(embedded_elf)[full-inference,default-flags] with default @ pixel-6-pro[big-cores]	12.382 (1.0X)	14.433 (0.9X)	1.304 (9.5X)

Regressed Latencies 🚩

Benchmark Name	Average Latency (ms)	Median Latency (ms)	Latency Standard Deviation (ms)
matmul\_2562x2561x2561\_f32t\_f32t\_f32t\_tile\_config\_default(linalg) [cuda-sm\_80-linux\_gnu-cuda][ukernel,matmul] cuda(none)[full-inference,default-flags] with default @ a2-highgpu-1g[gpu]	1.534 (vs. 1.368, 12.15%↑)	1.534	0.001
matmul\_123x2561x2561\_f32t\_f32t\_f32t\_tile\_config\_default(linalg) [cuda-sm\_80-linux\_gnu-cuda][ukernel,matmul] cuda(none)[full-inference,default-flags] with default @ a2-highgpu-1g[gpu]	0.222 (vs. 0.200, 11.16%↑)	0.222	0.000
MobileBertSquad\_int8(tflite) [arm-valhall-vulkan\_android31-vulkan\_spirv][default-flags] vulkan(none)[full-inference,default-flags] with default @ pixel-6-pro[gpu]	94.955 (vs. 86.395, 9.91%↑)	95.940	2.322

[Top 3 out of 4 results showed]

Improved Latencies 🎉

Benchmark Name	Average Latency (ms)	Median Latency (ms)	Latency Standard Deviation (ms)
matmul\_3456x1024x2048\_f32t\_tile\_config\_default(linalg) [cuda-sm\_80-linux\_gnu-cuda][ukernel,matmul] cuda(none)[full-inference,default-flags] with default @ a2-highgpu-1g[gpu]	0.130 (vs. 0.166, 21.53%↓)	0.130	0.000
MobileBertSquad\_int8(tflite) [armv8.2-a-generic-linux\_android29-llvm\_cpu][experimental-flags,dt-only] local\_sync(embedded\_elf)[full-inference,default-flags] with default @ pixel-6-pro[big-cores]	1069.568 (vs. 1222.156, 12.49%↓)	1070.319	4.894
MobileBertSquad\_int8(tflite) [armv8.2-a-generic-linux\_android29-llvm\_cpu][experimental-flags,dt-only] local\_task(embedded\_elf)[2-thread,full-inference,system-scheduling] with default @ pixel-6-pro[big-cores]	584.437 (vs. 652.467, 10.43%↓)	588.813	12.434

[Top 3 out of 21 results showed]

Improved Total Dispatch Sizes 🎉

Benchmark Name	Total Dispatch Size (bytes)
GPT2\_117M\_TF\_1X1XI32(stablehlo) [x86\_64-cascadelake-linux\_gnu-llvm\_cpu][experimental-flags,dt-only,compile-stats]	11392 (vs. 12864, 11.44%↓)
GPT2\_117M\_TF\_1X1XI32(stablehlo) [x86\_64-cascadelake-linux\_gnu-llvm\_cpu][default-flags,dt-uk,compile-stats]	11280 (vs. 12336, 8.56%↓)
GPT2\_117M\_TF\_1X4XI32(stablehlo) [x86\_64-cascadelake-linux\_gnu-llvm\_cpu][experimental-flags,dt-only,compile-stats]	18224 (vs. 19328, 5.71%↓)

[Top 3 out of 6 results showed]

Regressed Stream IR Dispatch Count (# of cmd.dispatch ops) 🚩

Benchmark Name	Stream IR Dispatch Count (# of cmd.dispatch ops)
GPT2\_117M\_TF\_1X4XI32(stablehlo) [x86\_64-cascadelake-linux\_gnu-llvm\_cpu][experimental-flags,dt-only,compile-stats]	330 (vs. 318, 3.77%↑)
GPT2\_117M\_TF\_1X4XI32(stablehlo) [x86\_64-cascadelake-linux\_gnu-llvm\_cpu][default-flags,dt-uk,compile-stats]	330 (vs. 318, 3.77%↑)
GPT2\_117M\_TF\_1X4XI32(stablehlo) [armv8.2-a-generic-linux\_android29-llvm\_cpu][default-flags,dt-uk,compile-stats]	330 (vs. 318, 3.77%↑)

[Top 3 out of 10 results showed]

Improved Stream IR Dispatch Count (# of cmd.dispatch ops) 🎉

Benchmark Name	Stream IR Dispatch Count (# of cmd.dispatch ops)
GPT2\_117M\_TF\_1X1XI32(stablehlo) [x86\_64-cascadelake-linux\_gnu-llvm\_cpu][experimental-flags,dt-only,compile-stats]	355 (vs. 367, 3.27%↓)
GPT2\_117M\_TF\_1X1XI32(stablehlo) [x86\_64-cascadelake-linux\_gnu-llvm\_cpu][default-flags,dt-uk,compile-stats]	355 (vs. 367, 3.27%↓)
GPT2\_117M\_TF\_1X1XI32(stablehlo) [armv8.2-a-generic-linux\_android29-llvm\_cpu][default-flags,dt-uk,compile-stats]	355 (vs. 367, 3.27%↓)

[Top 3 out of 6 results showed]

For more information:

Source Workflow Run

MaheshRavishankar

We need to look at the regressions in number of dispatches. I can help (but not today).

qedawkins · 2024-06-17T20:39:19Z

This seems like a fairly likely candidate for the source of dispatch count changes: iree-org/llvm-project@7ef83f5

Especially because the changes are being observed in data tiling enabled benchmarks. cc @Max191

nirvedhmeshram · 2024-06-20T18:12:58Z

We need to look at the regressions in number of dispatches. I can help (but not today).

@MaheshRavishankar are you blocking the integrate for this or would you look at it in a follow up since Quinn has explained the possible reason for the difference?

MaheshRavishankar · 2024-06-20T20:27:28Z

We need to look at the regressions in number of dispatches. I can help (but not today).

@MaheshRavishankar are you blocking the integrate for this or would you look at it in a follow up since Quinn has explained the possible reason for the difference?

Could you try reverting that locally to see if that is the issue. Then we can decide what to do next

nirvedhmeshram · 2024-06-20T22:42:38Z

We need to look at the regressions in number of dispatches. I can help (but not today).

@MaheshRavishankar are you blocking the integrate for this or would you look at it in a follow up since Quinn has explained the possible reason for the difference?

Could you try reverting that locally to see if that is the issue. Then we can decide what to do next

@MaheshRavishankar PTAL at the benchmark comment now, the bot has edited it and it seems the dispatch number regression is gone with the revert.

MaheshRavishankar

Thanks!

Updated to llvm/llvm-project@27ac46e6bea2 * Used LLVM `MathExtras.h` to replace MLIR one * Updated `applySignatureConversion` usage Updated to openxla/stablehlo@dd48ec5 * `chlo.minimum_broadcast_shapes` op was removed openxla/stablehlo#2287 * `chlo.dynamic_reshape` op was removed openxla/stablehlo#2286 * Added batching dims to scatter dims openxla/stablehlo#2259 Updated to llvm/torch-mlir@77d7f64 --------- Co-authored-by: hanhanW <hanhan0912@gmail.com> Co-authored-by: Rob Suderman <rob.suderman@gmail.com> Co-authored-by: Quinn Dawkins <quinn@nod-labs.com> Co-authored-by: Nirvedh Meshram <nirvedh@gmail.com> Signed-off-by: Lubo Litchev <lubol@google.com>

ScottTodd · 2024-08-19T23:13:53Z

compiler/setup.py

@@ -464,6 +464,7 @@ def find_git_submodule_revision(submodule_path):
    install_requires=[
        "numpy",
        "PyYAML",
+        "sympy",


Looks like this new dep is for the fx_importer in torch-mlir. That should have at least been documented in the PR description.

This should probably go in extras_require for a iree-compiler[torch] package, not the general requirements here. The dep seems relatively small, but I want to keep the core project's dependencies minimal.

antiagainst added 5 commits June 12, 2024 08:32

Integreate llvm/llvm-project@27ac46e6bea2

a8cbacb

Update to openxla/stablehlo@dd48ec5

3acfcc8

Drop mlir/Support/MatchExtras.h

be028a6

Bump to llvm/torch-mlir@77d7f64

988ac09

Update new binding exports

1727460

antiagainst requested review from MaheshRavishankar, rsuderman, hanhanW, stellaraccident, qedawkins, kuhar, Groverkss and benvanik as code owners June 13, 2024 04:09

antiagainst mentioned this pull request Jun 13, 2024

Integrate llvm/llvm-project@27ac46e6bea2 #17649

Closed

antiagainst removed request for benvanik, stellaraccident, kuhar, hanhanW and qedawkins June 13, 2024 04:10

kuhar approved these changes Jun 13, 2024

View reviewed changes

MaheshRavishankar requested changes Jun 13, 2024

View reviewed changes

hanhanW and others added 3 commits June 13, 2024 14:46

fixes for pack/unpack decomposition tests

e392b22

fixes for python and torch-mlir failures

ba96f17

Fix some format issues

e8a413b

ScottTodd mentioned this pull request Jun 14, 2024

Integrate iree-org/torch-mlir@41d04a89959d9197e167302fcae375f947848a88 #17652

Closed

rsuderman and others added 4 commits June 14, 2024 12:49

add sympy dep

d93c099

another spot for sympy missing

3bc279a

Fix distribute_multi_mma

1b984b7

Merge remote-tracking branch 'origin/main' into integrate-llvm-20240612

8c66c49

update onnx jsons to match current test status

ff158ce

nirvedhmeshram requested a review from ScottTodd as a code owner June 20, 2024 17:55

nirvedhmeshram added 2 commits June 20, 2024 12:45

fix BAZEL issue in compiler/API

da38fc3

lint fix

76f7e69

nirvedhmeshram added 3 commits June 20, 2024 15:06

cherry-pick necessary missing extern C patch

8669349

re-run CI

96944af

revert llvm/llvm-project#93055 for testing purpose

2506849

nirvedhmeshram requested a review from MaheshRavishankar June 20, 2024 22:45

add back the commit that was removed for testing

80ad63f

MaheshRavishankar approved these changes Jun 20, 2024

View reviewed changes

nirvedhmeshram enabled auto-merge (squash) June 20, 2024 23:32

nirvedhmeshram merged commit ac418d1 into main Jun 21, 2024
64 checks passed

nirvedhmeshram deleted the integrate-llvm-20240612 branch June 21, 2024 02:24

ScottTodd reviewed Aug 19, 2024

View reviewed changes

ScottTodd mentioned this pull request Aug 19, 2024

Remove PyYAML dependency from Python bindings. #18262

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Integrate llvm/llvm-project@27ac46e6bea2 #17662

Integrate llvm/llvm-project@27ac46e6bea2 #17662

antiagainst commented Jun 13, 2024

github-actions bot commented Jun 13, 2024 •

edited

Loading

MaheshRavishankar left a comment

qedawkins commented Jun 17, 2024

nirvedhmeshram commented Jun 20, 2024 •

edited

Loading

MaheshRavishankar commented Jun 20, 2024

nirvedhmeshram commented Jun 20, 2024

MaheshRavishankar left a comment

ScottTodd Aug 19, 2024

Integrate llvm/llvm-project@27ac46e6bea2 #17662

Integrate llvm/llvm-project@27ac46e6bea2 #17662

Conversation

antiagainst commented Jun 13, 2024

github-actions bot commented Jun 13, 2024 • edited Loading

Abbreviated Benchmark Summary

Data-Tiling Comparison Table

Regressed Latencies 🚩

Improved Latencies 🎉

Improved Total Dispatch Sizes 🎉

Regressed Stream IR Dispatch Count (# of cmd.dispatch ops) 🚩

Improved Stream IR Dispatch Count (# of cmd.dispatch ops) 🎉

MaheshRavishankar left a comment

Choose a reason for hiding this comment

qedawkins commented Jun 17, 2024

nirvedhmeshram commented Jun 20, 2024 • edited Loading

MaheshRavishankar commented Jun 20, 2024

nirvedhmeshram commented Jun 20, 2024

MaheshRavishankar left a comment

Choose a reason for hiding this comment

ScottTodd Aug 19, 2024

Choose a reason for hiding this comment

github-actions bot commented Jun 13, 2024 •

edited

Loading

nirvedhmeshram commented Jun 20, 2024 •

edited

Loading