[X86][EVEX512] Check hasEVEX512 for canExtendTo512DQ #90390

phoebewang · 2024-04-28T09:46:07Z

Fixes #90356

Fixes llvm#90356

llvmbot · 2024-04-28T09:46:38Z

@llvm/pr-subscribers-backend-x86

Author: Phoebe Wang (phoebewang)

Changes

Fixes #90356

Full diff: https://github.com/llvm/llvm-project/pull/90390.diff

2 Files Affected:

(modified) llvm/lib/Target/X86/X86Subtarget.h (+2-1)
(modified) llvm/test/CodeGen/X86/avx512bwvl-arith.ll (+33-2)

diff --git a/llvm/lib/Target/X86/X86Subtarget.h b/llvm/lib/Target/X86/X86Subtarget.h
index a458b5f9ec8fbb..4d55a084b730e4 100644
--- a/llvm/lib/Target/X86/X86Subtarget.h
+++ b/llvm/lib/Target/X86/X86Subtarget.h
@@ -244,7 +244,8 @@ class X86Subtarget final : public X86GenSubtargetInfo {
   // TODO: Currently we're always allowing widening on CPUs without VLX,
   // because for many cases we don't have a better option.
   bool canExtendTo512DQ() const {
-    return hasAVX512() && (!hasVLX() || getPreferVectorWidth() >= 512);
+    return hasAVX512() && hasEVEX512() &&
+           (!hasVLX() || getPreferVectorWidth() >= 512);
   }
   bool canExtendTo512BW() const  {
     return hasBWI() && canExtendTo512DQ();
diff --git a/llvm/test/CodeGen/X86/avx512bwvl-arith.ll b/llvm/test/CodeGen/X86/avx512bwvl-arith.ll
index 4988fc35b10eef..fdc25f44b156a7 100644
--- a/llvm/test/CodeGen/X86/avx512bwvl-arith.ll
+++ b/llvm/test/CodeGen/X86/avx512bwvl-arith.ll
@@ -1,6 +1,6 @@
 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
-; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw,+avx512vl | FileCheck %s
-; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw,+avx512vl,-evex512 | FileCheck %s
+; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw,+avx512vl | FileCheck %s --check-prefixes=CHECK,EVEX256
+; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw,+avx512vl,-evex512 | FileCheck %s --check-prefixes=CHECK,EVEX512
 
 ; 256-bit
 
@@ -236,3 +236,34 @@ define <8 x i16> @vpmullw128_test(<8 x i16> %i, <8 x i16> %j) {
   ret <8 x i16> %x
 }
 
+define i16 @PR90356(<16 x i1> %a) {
+; EVEX256-LABEL: PR90356:
+; EVEX256:       # %bb.0:
+; EVEX256-NEXT:    vpsllw $7, %xmm0, %xmm0
+; EVEX256-NEXT:    vpmovb2m %xmm0, %k1
+; EVEX256-NEXT:    vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
+; EVEX256-NEXT:    movb $63, %al
+; EVEX256-NEXT:    kmovd %eax, %k1
+; EVEX256-NEXT:    vpexpandq %zmm0, %zmm0 {%k1} {z}
+; EVEX256-NEXT:    vptestmd %zmm0, %zmm0, %k0
+; EVEX256-NEXT:    kmovd %k0, %eax
+; EVEX256-NEXT:    # kill: def $ax killed $ax killed $eax
+; EVEX256-NEXT:    vzeroupper
+; EVEX256-NEXT:    retq
+;
+; EVEX512-LABEL: PR90356:
+; EVEX512:       # %bb.0:
+; EVEX512-NEXT:    vpsllw $7, %xmm0, %xmm0
+; EVEX512-NEXT:    vpmovb2m %xmm0, %k0
+; EVEX512-NEXT:    vpmovm2w %k0, %ymm0
+; EVEX512-NEXT:    vpxor %xmm1, %xmm1, %xmm1
+; EVEX512-NEXT:    vpblendd {{.*#+}} ymm0 = ymm0[0,1,2,3,4,5],ymm1[6,7]
+; EVEX512-NEXT:    vpmovw2m %ymm0, %k0
+; EVEX512-NEXT:    kmovd %k0, %eax
+; EVEX512-NEXT:    # kill: def $ax killed $ax killed $eax
+; EVEX512-NEXT:    vzeroupper
+; EVEX512-NEXT:    retq
+  %1 = shufflevector <16 x i1> %a, <16 x i1> zeroinitializer, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 28, i32 29, i32 30, i32 31>
+  %2 = bitcast <16 x i1> %1 to i16
+  ret i16 %2
+}

topperc

LGTM

RKSimon

LGTM

phoebewang · 2024-04-29T00:41:04Z

/cherry-pick

phoebewang · 2024-04-29T00:42:10Z

/cherry-pick 35b89dd

llvmbot · 2024-04-29T00:46:10Z

Failed to create pull request for issue90390 https://github.com/llvm/llvm-project/actions/runs/8871632198

Fixes llvm#90356 (cherry picked from commit 35b89dd)

llvmbot · 2024-04-29T00:47:29Z

/pull-request #90422

Fixes llvm#90356 (cherry picked from commit 35b89dd)

[X86][EVEX512] Check hasEVEX512 for canExtendTo512DQ

f7c0830

Fixes llvm#90356

phoebewang requested review from RKSimon and topperc April 28, 2024 09:46

llvmbot added the backend:X86 label Apr 28, 2024

topperc approved these changes Apr 28, 2024

View reviewed changes

RKSimon approved these changes Apr 28, 2024

View reviewed changes

phoebewang merged commit 35b89dd into llvm:main Apr 29, 2024
6 checks passed

phoebewang added this to the LLVM 18.X Release milestone Apr 29, 2024

phoebewang deleted the avx10 branch April 29, 2024 00:40

llvmbot pushed a commit to llvmbot/llvm-project that referenced this pull request Apr 29, 2024

[X86][EVEX512] Check hasEVEX512 for canExtendTo512DQ (llvm#90390)

7100664

Fixes llvm#90356 (cherry picked from commit 35b89dd)

tstellar pushed a commit to llvmbot/llvm-project that referenced this pull request Apr 30, 2024

[X86][EVEX512] Check hasEVEX512 for canExtendTo512DQ (llvm#90390)

58648f3

Fixes llvm#90356 (cherry picked from commit 35b89dd)

pointhex mentioned this pull request May 7, 2024

getStyleDiagHandler #91314

Closed

aemerson mentioned this pull request May 9, 2024

release/18.x: [AArc64][GlobalISel] Fix legalizer assert for G_INSERT_VECTOR_ELT - manual merge #91672

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[X86][EVEX512] Check hasEVEX512 for canExtendTo512DQ #90390

[X86][EVEX512] Check hasEVEX512 for canExtendTo512DQ #90390

phoebewang commented Apr 28, 2024

llvmbot commented Apr 28, 2024

topperc left a comment

RKSimon left a comment

phoebewang commented Apr 29, 2024

phoebewang commented Apr 29, 2024

llvmbot commented Apr 29, 2024

llvmbot commented Apr 29, 2024

[X86][EVEX512] Check hasEVEX512 for canExtendTo512DQ #90390

[X86][EVEX512] Check hasEVEX512 for canExtendTo512DQ #90390

Conversation

phoebewang commented Apr 28, 2024

llvmbot commented Apr 28, 2024

topperc left a comment

Choose a reason for hiding this comment

RKSimon left a comment

Choose a reason for hiding this comment

phoebewang commented Apr 29, 2024

phoebewang commented Apr 29, 2024

llvmbot commented Apr 29, 2024

llvmbot commented Apr 29, 2024