[X86][AVX512] rematerialize smaller predicate masks #166178

ahmednoursphinx · 2025-11-03T15:17:43Z

Resolves #165752

llvmbot · 2025-11-03T15:18:16Z

@llvm/pr-subscribers-clang
@llvm/pr-subscribers-backend-powerpc

@llvm/pr-subscribers-backend-x86

Author: Ahmed Nour (ahmednoursphinx)

Changes

Resolves #165752

Full diff: https://github.com/llvm/llvm-project/pull/166178.diff

3 Files Affected:

(modified) llvm/lib/Target/X86/X86InstrAVX512.td (+25)
(modified) llvm/lib/Target/X86/X86InstrInfo.cpp (+6)
(added) llvm/test/CodeGen/X86/avx512-mask-set-opt.ll (+93)

diff --git a/llvm/lib/Target/X86/X86InstrAVX512.td b/llvm/lib/Target/X86/X86InstrAVX512.td
index 1b748b7355716..9fae602974242 100644
--- a/llvm/lib/Target/X86/X86InstrAVX512.td
+++ b/llvm/lib/Target/X86/X86InstrAVX512.td
@@ -3161,6 +3161,12 @@ multiclass avx512_mask_setop_w<SDPatternOperator Val> {
 defm KSET0 : avx512_mask_setop_w<immAllZerosV>;
 defm KSET1 : avx512_mask_setop_w<immAllOnesV>;
 
+// 8-bit mask set operations for AVX512DQ
+let Predicates = [HasDQI] in {
+  defm KSET0B : avx512_mask_setop<VK8, v8i1, immAllZerosV>;
+  defm KSET1B : avx512_mask_setop<VK8, v8i1, immAllOnesV>;
+}
+
 // With AVX-512 only, 8-bit mask is promoted to 16-bit mask.
 let Predicates = [HasAVX512] in {
   def : Pat<(v8i1 immAllZerosV), (COPY_TO_REGCLASS (KSET0W), VK8)>;
@@ -3173,6 +3179,25 @@ let Predicates = [HasAVX512] in {
   def : Pat<(v1i1 immAllOnesV),  (COPY_TO_REGCLASS (KSET1W), VK1)>;
 }
 
+// With AVX512DQ, use 8-bit operations for 8-bit masks to avoid setting upper bits
+let Predicates = [HasDQI] in {
+  def : Pat<(v8i1 immAllZerosV), (KSET0B)>;
+  def : Pat<(v8i1 immAllOnesV),  (KSET1B)>;
+}
+
+// Optimize bitconvert of all-ones constants to use kxnor instructions
+let Predicates = [HasDQI] in {
+  def : Pat<(v8i1 (bitconvert (i8 255))), (KSET1B)>;
+  def : Pat<(v16i1 (bitconvert (i16 255))), (COPY_TO_REGCLASS (KSET1B), VK16)>;
+}
+let Predicates = [HasAVX512] in {
+  def : Pat<(v16i1 (bitconvert (i16 65535))), (KSET1W)>;
+}
+let Predicates = [HasBWI] in {
+  def : Pat<(v32i1 (bitconvert (i32 -1))), (KSET1D)>;
+  def : Pat<(v64i1 (bitconvert (i64 -1))), (KSET1Q)>;
+}
+
 // Patterns for kmask insert_subvector/extract_subvector to/from index=0
 multiclass operation_subvector_mask_lowering<RegisterClass subRC, ValueType subVT,
                                              RegisterClass RC, ValueType VT> {
diff --git a/llvm/lib/Target/X86/X86InstrInfo.cpp b/llvm/lib/Target/X86/X86InstrInfo.cpp
index 6b2a7a4ec3583..3eadac4f827bc 100644
--- a/llvm/lib/Target/X86/X86InstrInfo.cpp
+++ b/llvm/lib/Target/X86/X86InstrInfo.cpp
@@ -789,9 +789,11 @@ bool X86InstrInfo::isReMaterializableImpl(
   case X86::FsFLD0SS:
   case X86::FsFLD0SH:
   case X86::FsFLD0F128:
+  case X86::KSET0B:
   case X86::KSET0D:
   case X86::KSET0Q:
   case X86::KSET0W:
+  case X86::KSET1B:
   case X86::KSET1D:
   case X86::KSET1Q:
   case X86::KSET1W:
@@ -6352,12 +6354,16 @@ bool X86InstrInfo::expandPostRAPseudo(MachineInstr &MI) const {
   // registers, since it is not usable as a write mask.
   // FIXME: A more advanced approach would be to choose the best input mask
   // register based on context.
+  case X86::KSET0B:
+    return Expand2AddrKreg(MIB, get(X86::KXORBkk), X86::K0);
   case X86::KSET0W:
     return Expand2AddrKreg(MIB, get(X86::KXORWkk), X86::K0);
   case X86::KSET0D:
     return Expand2AddrKreg(MIB, get(X86::KXORDkk), X86::K0);
   case X86::KSET0Q:
     return Expand2AddrKreg(MIB, get(X86::KXORQkk), X86::K0);
+  case X86::KSET1B:
+    return Expand2AddrKreg(MIB, get(X86::KXNORBkk), X86::K0);
   case X86::KSET1W:
     return Expand2AddrKreg(MIB, get(X86::KXNORWkk), X86::K0);
   case X86::KSET1D:
diff --git a/llvm/test/CodeGen/X86/avx512-mask-set-opt.ll b/llvm/test/CodeGen/X86/avx512-mask-set-opt.ll
new file mode 100644
index 0000000000000..6a1a0af05d05c
--- /dev/null
+++ b/llvm/test/CodeGen/X86/avx512-mask-set-opt.ll
@@ -0,0 +1,93 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
+; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f | FileCheck %s --check-prefixes=AVX512F
+; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512dq | FileCheck %s --check-prefixes=AVX512DQ
+; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512bw | FileCheck %s --check-prefixes=AVX512BW
+; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512dq,+avx512bw | FileCheck %s --check-prefixes=AVX512DQBW
+
+declare <16 x float> @llvm.masked.gather.v16f32.v16p0(<16 x ptr>, i32, <16 x i1>, <16 x float>)
+
+; Test case 1: v16i1 with all bits set (should use kxnorw on all targets)
+define <16 x float> @gather_all(ptr %base, <16 x i32> %ind, i16 %mask) {
+; AVX512F-LABEL: gather_all:
+; AVX512F:       # %bb.0:
+; AVX512F-NEXT:    kxnorw %k0, %k0, %k1
+; AVX512F-NEXT:    vxorps %xmm1, %xmm1, %xmm1
+; AVX512F-NEXT:    vgatherdps (%rdi,%zmm0,4), %zmm1 {%k1}
+; AVX512F-NEXT:    vmovaps %zmm1, %zmm0
+; AVX512F-NEXT:    retq
+;
+; AVX512DQ-LABEL: gather_all:
+; AVX512DQ:       # %bb.0:
+; AVX512DQ-NEXT:    kxnorw %k0, %k0, %k1
+; AVX512DQ-NEXT:    vxorps %xmm1, %xmm1, %xmm1
+; AVX512DQ-NEXT:    vgatherdps (%rdi,%zmm0,4), %zmm1 {%k1}
+; AVX512DQ-NEXT:    vmovaps %zmm1, %zmm0
+; AVX512DQ-NEXT:    retq
+;
+; AVX512BW-LABEL: gather_all:
+; AVX512BW:       # %bb.0:
+; AVX512BW-NEXT:    kxnorw %k0, %k0, %k1
+; AVX512BW-NEXT:    vxorps %xmm1, %xmm1, %xmm1
+; AVX512BW-NEXT:    vgatherdps (%rdi,%zmm0,4), %zmm1 {%k1}
+; AVX512BW-NEXT:    vmovaps %zmm1, %zmm0
+; AVX512BW-NEXT:    retq
+;
+; AVX512DQBW-LABEL: gather_all:
+; AVX512DQBW:       # %bb.0:
+; AVX512DQBW-NEXT:    kxnorw %k0, %k0, %k1
+; AVX512DQBW-NEXT:    vxorps %xmm1, %xmm1, %xmm1
+; AVX512DQBW-NEXT:    vgatherdps (%rdi,%zmm0,4), %zmm1 {%k1}
+; AVX512DQBW-NEXT:    vmovaps %zmm1, %zmm0
+; AVX512DQBW-NEXT:    retq
+  %broadcast.splatinsert = insertelement <16 x ptr> undef, ptr %base, i32 0
+  %broadcast.splat = shufflevector <16 x ptr> %broadcast.splatinsert, <16 x ptr> undef, <16 x i32> zeroinitializer
+  %sext_ind = sext <16 x i32> %ind to <16 x i64>
+  %gep.random = getelementptr float, <16 x ptr> %broadcast.splat, <16 x i64> %sext_ind
+  %res = call <16 x float> @llvm.masked.gather.v16f32.v16p0(<16 x ptr> %gep.random, i32 4, <16 x i1> <i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true>, <16 x float>undef)
+  ret <16 x float> %res
+}
+
+; Test case 2: v8i1 with lower 8 bits set (should use kxnorb on AVX512DQ targets)
+define <16 x float> @gather_lower(ptr %base, <16 x i32> %ind, i16 %mask) {
+; AVX512F-LABEL: gather_lower:
+; AVX512F:       # %bb.0:
+; AVX512F-NEXT:    vxorps %xmm1, %xmm1, %xmm1
+; AVX512F-NEXT:    movw $255, %ax
+; AVX512F-NEXT:    kmovw %eax, %k1
+; AVX512F-NEXT:    vgatherdps (%rdi,%zmm0,4), %zmm1 {%k1}
+; AVX512F-NEXT:    vmovaps %zmm1, %zmm0
+; AVX512F-NEXT:    retq
+;
+; AVX512DQ-LABEL: gather_lower:
+; AVX512DQ:       # %bb.0:
+; AVX512DQ-NEXT:    vxorps %xmm1, %xmm1, %xmm1
+; AVX512DQ-NEXT:    kxnorb %k0, %k0, %k1
+; AVX512DQ-NEXT:    vgatherdps (%rdi,%zmm0,4), %zmm1 {%k1}
+; AVX512DQ-NEXT:    vmovaps %zmm1, %zmm0
+; AVX512DQ-NEXT:    retq
+;
+; AVX512BW-LABEL: gather_lower:
+; AVX512BW:       # %bb.0:
+; AVX512BW-NEXT:    vxorps %xmm1, %xmm1, %xmm1
+; AVX512BW-NEXT:    movw $255, %ax
+; AVX512BW-NEXT:    kmovd %eax, %k1
+; AVX512BW-NEXT:    vgatherdps (%rdi,%zmm0,4), %zmm1 {%k1}
+; AVX512BW-NEXT:    vmovaps %zmm1, %zmm0
+; AVX512BW-NEXT:    retq
+;
+; AVX512DQBW-LABEL: gather_lower:
+; AVX512DQBW:       # %bb.0:
+; AVX512DQBW-NEXT:    vxorps %xmm1, %xmm1, %xmm1
+; AVX512DQBW-NEXT:    kxnorb %k0, %k0, %k1
+; AVX512DQBW-NEXT:    vgatherdps (%rdi,%zmm0,4), %zmm1 {%k1}
+; AVX512DQBW-NEXT:    vmovaps %zmm1, %zmm0
+; AVX512DQBW-NEXT:    retq
+  %broadcast.splatinsert = insertelement <16 x ptr> undef, ptr %base, i32 0
+  %broadcast.splat = shufflevector <16 x ptr> %broadcast.splatinsert, <16 x ptr> undef, <16 x i32> zeroinitializer
+  %sext_ind = sext <16 x i32> %ind to <16 x i64>
+  %gep.random = getelementptr float, <16 x ptr> %broadcast.splat, <16 x i64> %sext_ind
+  %res = call <16 x float> @llvm.masked.gather.v16f32.v16p0(<16 x ptr> %gep.random, i32 4, <16 x i1> <i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 false, i1 false, i1 false, i1 false, i1 false, i1 false, i1 false, i1 false>, <16 x float>undef)
+  ret <16 x float> %res
+}
+
+

github-actions · 2025-11-03T15:19:23Z

✅ With the latest revision this PR passed the undef deprecator.

…m-project into issue_165752

clang/include/clang/Basic/DiagnosticLexKinds.td

clang/include/clang/Driver/Options.td

llvm/lib/Target/PowerPC/PPCInstrFuture.td

clang/include/clang/Basic/DiagnosticLexKinds.td

clang/include/clang/Driver/Options.td

llvm/lib/Target/PowerPC/PPCInstrFuture.td

llvm/test/CodeGen/X86/avx512-mask-set-opt.ll

llvm/lib/Target/X86/X86InstrAVX512.td

This reverts commit 25a8351.

llvm/lib/Target/X86/X86InstrAVX512.td

RKSimon

still missing v32i1 / v64i1 sub mask test coverage

ahmednoursphinx · 2025-11-04T11:17:21Z

still missing v32i1 / v64i1 sub mask test coverage

Sorry missed that , added in latest commit

ahmednoursphinx · 2025-11-05T09:14:06Z

Hey @RKSimon @phoebewang PR is ready for review again when you have time

RKSimon

These need regenerating with update_llc_test_checks.py:

Failed Tests (5):
  LLVM :: CodeGen/X86/avx512-gather-scatter-intrin-deprecated.ll
  LLVM :: CodeGen/X86/avx512-gather-scatter-intrin.ll
  LLVM :: CodeGen/X86/masked_gather_scatter.ll
  LLVM :: CodeGen/X86/scatter-schedule.ll
  LLVM :: CodeGen/X86/vector-replicaton-i1-mask.ll

ahmednoursphinx · 2025-11-05T11:19:51Z

Hey @RKSimon tests have been updated please check when you have time

llvm/lib/Target/X86/X86InstrAVX512.td

…in v64i1

ahmednoursphinx · 2025-11-06T08:20:15Z

Hey @RKSimon please check again when you have time

ahmednoursphinx · 2025-11-06T18:28:21Z

Hey @RKSimon this PR ready for review again when you have time

llvm/test/CodeGen/X86/avx512-mask-set-opt.ll

ahmednoursphinx · 2025-11-11T09:49:48Z

Hey @RKSimon can you review this again please when you have some time

llvm/test/CodeGen/X86/avx512-mask-set-opt.ll

ahmednoursphinx · 2025-11-11T11:50:39Z

Hey @RKSimon addressed your feedback please check when you have time

RKSimon

LGTM - @phoebewang ?

phoebewang

LGTM.

ahmednoursphinx · 2025-11-11T14:36:07Z

Hey @RKSimon , @phoebewang can you please merge this PR

llvm-ci · 2025-11-11T15:15:54Z

LLVM Buildbot has detected a new failure on builder mlir-nvidia-gcc7 running on mlir-nvidia while building llvm at step 7 "test-build-check-mlir-build-only-check-mlir".

Full details are available at: https://lab.llvm.org/buildbot/#/builders/116/builds/20834

Here is the relevant piece of the build log for the reference

Step 7 (test-build-check-mlir-build-only-check-mlir) failure: test (failure)
******************** TEST 'MLIR :: Integration/GPU/CUDA/async.mlir' FAILED ********************
Exit Code: 1

Command Output (stdout):
--
# RUN: at line 1
/vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/bin/mlir-opt /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.src/mlir/test/Integration/GPU/CUDA/async.mlir  | /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/bin/mlir-opt -gpu-kernel-outlining  | /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/bin/mlir-opt -pass-pipeline='builtin.module(gpu.module(strip-debuginfo,convert-gpu-to-nvvm),nvvm-attach-target)'  | /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/bin/mlir-opt -gpu-async-region -gpu-to-llvm -reconcile-unrealized-casts -gpu-module-to-binary="format=fatbin"  | /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/bin/mlir-opt -async-to-async-runtime -async-runtime-ref-counting  | /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/bin/mlir-opt -convert-async-to-llvm -convert-func-to-llvm -convert-arith-to-llvm -convert-cf-to-llvm -reconcile-unrealized-casts  | /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/bin/mlir-runner    --shared-libs=/vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/lib/libmlir_cuda_runtime.so    --shared-libs=/vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/lib/libmlir_async_runtime.so    --shared-libs=/vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/lib/libmlir_runner_utils.so    --entry-point-result=void -O0  | /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/bin/FileCheck /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.src/mlir/test/Integration/GPU/CUDA/async.mlir
# executed command: /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/bin/mlir-opt /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.src/mlir/test/Integration/GPU/CUDA/async.mlir
# executed command: /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/bin/mlir-opt -gpu-kernel-outlining
# executed command: /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/bin/mlir-opt '-pass-pipeline=builtin.module(gpu.module(strip-debuginfo,convert-gpu-to-nvvm),nvvm-attach-target)'
# executed command: /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/bin/mlir-opt -gpu-async-region -gpu-to-llvm -reconcile-unrealized-casts -gpu-module-to-binary=format=fatbin
# executed command: /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/bin/mlir-opt -async-to-async-runtime -async-runtime-ref-counting
# executed command: /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/bin/mlir-opt -convert-async-to-llvm -convert-func-to-llvm -convert-arith-to-llvm -convert-cf-to-llvm -reconcile-unrealized-casts
# executed command: /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/bin/mlir-runner --shared-libs=/vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/lib/libmlir_cuda_runtime.so --shared-libs=/vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/lib/libmlir_async_runtime.so --shared-libs=/vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/lib/libmlir_runner_utils.so --entry-point-result=void -O0
# .---command stderr------------
# | 'cuStreamWaitEvent(stream, event, 0)' failed with 'CUDA_ERROR_CONTEXT_IS_DESTROYED'
# | 'cuEventDestroy(event)' failed with 'CUDA_ERROR_CONTEXT_IS_DESTROYED'
# | 'cuStreamWaitEvent(stream, event, 0)' failed with 'CUDA_ERROR_CONTEXT_IS_DESTROYED'
# | 'cuEventDestroy(event)' failed with 'CUDA_ERROR_CONTEXT_IS_DESTROYED'
# | 'cuStreamWaitEvent(stream, event, 0)' failed with 'CUDA_ERROR_CONTEXT_IS_DESTROYED'
# | 'cuStreamWaitEvent(stream, event, 0)' failed with 'CUDA_ERROR_CONTEXT_IS_DESTROYED'
# | 'cuEventDestroy(event)' failed with 'CUDA_ERROR_CONTEXT_IS_DESTROYED'
# | 'cuEventDestroy(event)' failed with 'CUDA_ERROR_CONTEXT_IS_DESTROYED'
# | 'cuEventSynchronize(event)' failed with 'CUDA_ERROR_CONTEXT_IS_DESTROYED'
# | 'cuEventDestroy(event)' failed with 'CUDA_ERROR_CONTEXT_IS_DESTROYED'
# `-----------------------------
# executed command: /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.obj/bin/FileCheck /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.src/mlir/test/Integration/GPU/CUDA/async.mlir
# .---command stderr------------
# | /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.src/mlir/test/Integration/GPU/CUDA/async.mlir:68:12: error: CHECK: expected string not found in input
# |  // CHECK: [84, 84]
# |            ^
# | <stdin>:1:1: note: scanning from here
# | Unranked Memref base@ = 0x5752327fe390 rank = 1 offset = 0 sizes = [2] strides = [1] data = 
# | ^
# | <stdin>:2:1: note: possible intended match here
# | [42, 42]
# | ^
# | 
# | Input file: <stdin>
# | Check file: /vol/worker/mlir-nvidia/mlir-nvidia-gcc7/llvm.src/mlir/test/Integration/GPU/CUDA/async.mlir
# | 
# | -dump-input=help explains the following input dump.
# | 
# | Input was:
# | <<<<<<
# |             1: Unranked Memref base@ = 0x5752327fe390 rank = 1 offset = 0 sizes = [2] strides = [1] data =  
# | check:68'0     X~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ error: no match found
# |             2: [42, 42] 
# | check:68'0     ~~~~~~~~~
# | check:68'1     ?         possible intended match
...

fix: rematerialize smaller predicate masks

3cdf74e

llvmbot added the backend:X86 label Nov 3, 2025

ahmednoursphinx added 5 commits November 3, 2025 17:20

chore: update formatting

4d2cfe3

Merge branch 'main' into issue_165752

10bea66

fix: Use poison values for placeholders

b46db32

Merge branch 'issue_165752' of https://github.com/ahmednoursphinx/llv…

88ef285

…m-project into issue_165752

fix: Update formatting

25a8351

llvmbot added clang Clang issues not falling into any other category backend:PowerPC clang:frontend Language frontend issues, e.g. anything involving "Sema" labels Nov 3, 2025

ahmednoursphinx commented Nov 3, 2025

View reviewed changes

clang/include/clang/Basic/DiagnosticLexKinds.td Show resolved Hide resolved

clang/include/clang/Driver/Options.td Show resolved Hide resolved

llvm/lib/Target/PowerPC/PPCInstrFuture.td Show resolved Hide resolved

RKSimon reviewed Nov 3, 2025

View reviewed changes

clang/include/clang/Basic/DiagnosticLexKinds.td Show resolved Hide resolved

clang/include/clang/Driver/Options.td Show resolved Hide resolved

llvm/lib/Target/PowerPC/PPCInstrFuture.td Show resolved Hide resolved

RKSimon requested a review from phoebewang November 3, 2025 15:29

RKSimon reviewed Nov 3, 2025

View reviewed changes

llvm/test/CodeGen/X86/avx512-mask-set-opt.ll Outdated Show resolved Hide resolved

RKSimon reviewed Nov 3, 2025

View reviewed changes

llvm/lib/Target/X86/X86InstrAVX512.td Show resolved Hide resolved

RKSimon reviewed Nov 3, 2025

View reviewed changes

llvm/lib/Target/X86/X86InstrAVX512.td Outdated Show resolved Hide resolved

ahmednoursphinx added 2 commits November 3, 2025 20:31

Revert "fix: Update formatting"

5063a2b

This reverts commit 25a8351.

refactor: PR Feedback

934e4fa

ahmednoursphinx requested a review from RKSimon November 3, 2025 19:33

phoebewang reviewed Nov 4, 2025

View reviewed changes

llvm/lib/Target/X86/X86InstrAVX512.td Show resolved Hide resolved

phoebewang reviewed Nov 4, 2025

View reviewed changes

llvm/lib/Target/X86/X86InstrAVX512.td Show resolved Hide resolved

RKSimon requested changes Nov 4, 2025

View reviewed changes

feat: Add test coverage for v32i1/v64i1 mask initialization patterns

6f11f69

ahmednoursphinx requested review from RKSimon and phoebewang November 4, 2025 11:17

RKSimon requested changes Nov 5, 2025

View reviewed changes

fix: regenerate code using update_llc_test_checks

240d424

ahmednoursphinx requested a review from RKSimon November 5, 2025 11:03

RKSimon requested changes Nov 5, 2025

View reviewed changes

llvm/lib/Target/X86/X86InstrAVX512.td Show resolved Hide resolved

llvm/lib/Target/X86/X86InstrAVX512.td Show resolved Hide resolved

ahmednoursphinx added 2 commits November 5, 2025 22:06

feat: Add missing the submask patterns: i8/i16 in v32i1 + i8/i16/i32 …

e55c19c

…in v64i1

update formatting

0ccd817

ahmednoursphinx requested a review from RKSimon November 5, 2025 20:07

Merge branch 'main' into issue_165752

74e6184

RKSimon reviewed Nov 7, 2025

View reviewed changes

llvm/test/CodeGen/X86/avx512-mask-set-opt.ll Show resolved Hide resolved

fix: prevent constant folding in tests

615ebce

ahmednoursphinx requested a review from RKSimon November 10, 2025 18:20

ahmednoursphinx added 2 commits November 10, 2025 20:21

Merge branch 'main' into issue_165752

5f21b9d

Merge branch 'main' into issue_165752

3997402

RKSimon requested changes Nov 11, 2025

View reviewed changes

llvm/test/CodeGen/X86/avx512-mask-set-opt.ll Outdated Show resolved Hide resolved

llvm/test/CodeGen/X86/avx512-mask-set-opt.ll Outdated Show resolved Hide resolved

llvm/test/CodeGen/X86/avx512-mask-set-opt.ll Outdated Show resolved Hide resolved

ahmednoursphinx added 2 commits November 11, 2025 13:27

Use script to auto update codegen

992b359

Merge branch 'main' into issue_165752

8b4ebdc

ahmednoursphinx requested a review from RKSimon November 11, 2025 11:28

RKSimon approved these changes Nov 11, 2025

View reviewed changes

phoebewang approved these changes Nov 11, 2025

View reviewed changes

Merge branch 'main' into issue_165752

0780ee5

RKSimon enabled auto-merge (squash) November 11, 2025 14:41

RKSimon merged commit 83ef17d into llvm:main Nov 11, 2025
9 of 10 checks passed

[X86][AVX512] rematerialize smaller predicate masks #166178

[X86][AVX512] rematerialize smaller predicate masks #166178

Uh oh!

Conversation

ahmednoursphinx commented Nov 3, 2025

Uh oh!

llvmbot commented Nov 3, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

github-actions bot commented Nov 3, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

RKSimon left a comment

Choose a reason for hiding this comment

Uh oh!

ahmednoursphinx commented Nov 4, 2025

Uh oh!

ahmednoursphinx commented Nov 5, 2025

Uh oh!

RKSimon left a comment

Choose a reason for hiding this comment

Uh oh!

ahmednoursphinx commented Nov 5, 2025

Uh oh!

Uh oh!

Uh oh!

ahmednoursphinx commented Nov 6, 2025

Uh oh!

ahmednoursphinx commented Nov 6, 2025

Uh oh!

Uh oh!

ahmednoursphinx commented Nov 11, 2025

Uh oh!

Uh oh!

Uh oh!

Uh oh!

ahmednoursphinx commented Nov 11, 2025

Uh oh!

RKSimon left a comment

Choose a reason for hiding this comment

Uh oh!

phoebewang left a comment

Choose a reason for hiding this comment

Uh oh!

ahmednoursphinx commented Nov 11, 2025

Uh oh!

Uh oh!

llvm-ci commented Nov 11, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

5 participants

llvmbot commented Nov 3, 2025 •

edited

Loading

github-actions bot commented Nov 3, 2025 •

edited

Loading