[LoongArch] Pre-commit for lowering shuffle as lane permute and shuffle. #141205

tangaac · 2025-05-23T07:26:24Z

No description provided.

llvmbot · 2025-05-23T07:26:57Z

@llvm/pr-subscribers-backend-loongarch

Author: None (tangaac)

Changes

Full diff: https://github.com/llvm/llvm-project/pull/141205.diff

1 Files Affected:

(added) llvm/test/CodeGen/LoongArch/lasx/shuffle-as-permute-and-shuffle.ll (+313)

diff --git a/llvm/test/CodeGen/LoongArch/lasx/shuffle-as-permute-and-shuffle.ll b/llvm/test/CodeGen/LoongArch/lasx/shuffle-as-permute-and-shuffle.ll
new file mode 100644
index 0000000000000..72c28bf8a4046
--- /dev/null
+++ b/llvm/test/CodeGen/LoongArch/lasx/shuffle-as-permute-and-shuffle.ll
@@ -0,0 +1,313 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 5
+; RUN: llc --mtriple=loongarch64 --mattr=+lasx %s -o - | FileCheck %s
+
+define <32 x i8> @shuffle_v32i8(<32 x i8> %a) {
+; CHECK-LABEL: shuffle_v32i8:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    addi.d $sp, $sp, -64
+; CHECK-NEXT:    .cfi_def_cfa_offset 64
+; CHECK-NEXT:    st.d $ra, $sp, 56 # 8-byte Folded Spill
+; CHECK-NEXT:    st.d $fp, $sp, 48 # 8-byte Folded Spill
+; CHECK-NEXT:    .cfi_offset 1, -8
+; CHECK-NEXT:    .cfi_offset 22, -16
+; CHECK-NEXT:    addi.d $fp, $sp, 64
+; CHECK-NEXT:    .cfi_def_cfa 22, 0
+; CHECK-NEXT:    bstrins.d $sp, $zero, 4, 0
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvst $xr0, $sp, 0
+; CHECK-NEXT:    ld.b $a1, $sp, 16
+; CHECK-NEXT:    ld.b $a0, $sp, 17
+; CHECK-NEXT:    vinsgr2vr.b $vr0, $a1, 0
+; CHECK-NEXT:    vinsgr2vr.b $vr0, $a0, 1
+; CHECK-NEXT:    vpickve2gr.b $a2, $vr1, 0
+; CHECK-NEXT:    vinsgr2vr.b $vr0, $a2, 2
+; CHECK-NEXT:    vpickve2gr.b $a2, $vr1, 1
+; CHECK-NEXT:    vinsgr2vr.b $vr0, $a2, 3
+; CHECK-NEXT:    vpickve2gr.b $a2, $vr1, 2
+; CHECK-NEXT:    vinsgr2vr.b $vr0, $a2, 4
+; CHECK-NEXT:    vpickve2gr.b $a2, $vr1, 3
+; CHECK-NEXT:    vinsgr2vr.b $vr0, $a2, 5
+; CHECK-NEXT:    vpickve2gr.b $a2, $vr1, 4
+; CHECK-NEXT:    vinsgr2vr.b $vr0, $a2, 6
+; CHECK-NEXT:    vpickve2gr.b $a2, $vr1, 5
+; CHECK-NEXT:    vinsgr2vr.b $vr0, $a2, 7
+; CHECK-NEXT:    vpickve2gr.b $a2, $vr1, 6
+; CHECK-NEXT:    vinsgr2vr.b $vr0, $a2, 8
+; CHECK-NEXT:    vpickve2gr.b $a2, $vr1, 7
+; CHECK-NEXT:    vinsgr2vr.b $vr0, $a2, 9
+; CHECK-NEXT:    vpickve2gr.b $a2, $vr1, 8
+; CHECK-NEXT:    vinsgr2vr.b $vr0, $a2, 10
+; CHECK-NEXT:    vpickve2gr.b $a2, $vr1, 9
+; CHECK-NEXT:    vinsgr2vr.b $vr0, $a2, 11
+; CHECK-NEXT:    vpickve2gr.b $a2, $vr1, 10
+; CHECK-NEXT:    vinsgr2vr.b $vr0, $a2, 12
+; CHECK-NEXT:    vpickve2gr.b $a2, $vr1, 11
+; CHECK-NEXT:    vinsgr2vr.b $vr0, $a2, 13
+; CHECK-NEXT:    vpickve2gr.b $a2, $vr1, 12
+; CHECK-NEXT:    vinsgr2vr.b $vr0, $a2, 14
+; CHECK-NEXT:    vpickve2gr.b $a2, $vr1, 13
+; CHECK-NEXT:    vinsgr2vr.b $vr0, $a2, 15
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.b $vr1, $a1, 0
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.b $vr1, $a0, 1
+; CHECK-NEXT:    ld.b $a0, $sp, 18
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.b $vr1, $a0, 2
+; CHECK-NEXT:    ld.b $a0, $sp, 19
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.b $vr1, $a0, 3
+; CHECK-NEXT:    ld.b $a0, $sp, 20
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.b $vr1, $a0, 4
+; CHECK-NEXT:    ld.b $a0, $sp, 21
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.b $vr1, $a0, 5
+; CHECK-NEXT:    ld.b $a0, $sp, 22
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.b $vr1, $a0, 6
+; CHECK-NEXT:    ld.b $a0, $sp, 23
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.b $vr1, $a0, 7
+; CHECK-NEXT:    ld.b $a0, $sp, 24
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.b $vr1, $a0, 8
+; CHECK-NEXT:    ld.b $a0, $sp, 25
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.b $vr1, $a0, 9
+; CHECK-NEXT:    ld.b $a0, $sp, 26
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.b $vr1, $a0, 10
+; CHECK-NEXT:    ld.b $a0, $sp, 27
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.b $vr1, $a0, 11
+; CHECK-NEXT:    ld.b $a0, $sp, 28
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.b $vr1, $a0, 12
+; CHECK-NEXT:    ld.b $a0, $sp, 29
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.b $vr1, $a0, 13
+; CHECK-NEXT:    ld.b $a0, $sp, 30
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.b $vr1, $a0, 14
+; CHECK-NEXT:    ld.b $a0, $sp, 31
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.b $vr1, $a0, 15
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    addi.d $sp, $fp, -64
+; CHECK-NEXT:    ld.d $fp, $sp, 48 # 8-byte Folded Reload
+; CHECK-NEXT:    ld.d $ra, $sp, 56 # 8-byte Folded Reload
+; CHECK-NEXT:    addi.d $sp, $sp, 64
+; CHECK-NEXT:    ret
+  %shuffle = shufflevector <32 x i8> %a, <32 x i8> poison, <32 x i32> <i32 16, i32 17, i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13,  i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
+  ret <32 x i8> %shuffle
+}
+
+
+define <16 x i16> @shuffle_v16i16(<16 x i16> %a) {
+; CHECK-LABEL: shuffle_v16i16:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    addi.d $sp, $sp, -64
+; CHECK-NEXT:    .cfi_def_cfa_offset 64
+; CHECK-NEXT:    st.d $ra, $sp, 56 # 8-byte Folded Spill
+; CHECK-NEXT:    st.d $fp, $sp, 48 # 8-byte Folded Spill
+; CHECK-NEXT:    .cfi_offset 1, -8
+; CHECK-NEXT:    .cfi_offset 22, -16
+; CHECK-NEXT:    addi.d $fp, $sp, 64
+; CHECK-NEXT:    .cfi_def_cfa 22, 0
+; CHECK-NEXT:    bstrins.d $sp, $zero, 4, 0
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvst $xr0, $sp, 0
+; CHECK-NEXT:    ld.h $a0, $sp, 16
+; CHECK-NEXT:    ld.h $a1, $sp, 18
+; CHECK-NEXT:    vinsgr2vr.h $vr0, $a0, 0
+; CHECK-NEXT:    vinsgr2vr.h $vr0, $a1, 1
+; CHECK-NEXT:    vpickve2gr.h $a2, $vr1, 0
+; CHECK-NEXT:    vinsgr2vr.h $vr0, $a2, 2
+; CHECK-NEXT:    vpickve2gr.h $a2, $vr1, 1
+; CHECK-NEXT:    vinsgr2vr.h $vr0, $a2, 3
+; CHECK-NEXT:    vpickve2gr.h $a2, $vr1, 2
+; CHECK-NEXT:    vinsgr2vr.h $vr0, $a2, 4
+; CHECK-NEXT:    vpickve2gr.h $a2, $vr1, 3
+; CHECK-NEXT:    vinsgr2vr.h $vr0, $a2, 5
+; CHECK-NEXT:    vpickve2gr.h $a2, $vr1, 4
+; CHECK-NEXT:    vinsgr2vr.h $vr0, $a2, 6
+; CHECK-NEXT:    vpickve2gr.h $a2, $vr1, 5
+; CHECK-NEXT:    vinsgr2vr.h $vr0, $a2, 7
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.h $vr1, $a0, 0
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.h $vr1, $a1, 1
+; CHECK-NEXT:    ld.h $a0, $sp, 20
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.h $vr1, $a0, 2
+; CHECK-NEXT:    ld.h $a0, $sp, 22
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.h $vr1, $a0, 3
+; CHECK-NEXT:    ld.h $a0, $sp, 24
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.h $vr1, $a0, 4
+; CHECK-NEXT:    ld.h $a0, $sp, 26
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.h $vr1, $a0, 5
+; CHECK-NEXT:    ld.h $a0, $sp, 28
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.h $vr1, $a0, 6
+; CHECK-NEXT:    ld.h $a0, $sp, 30
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    xvori.b $xr1, $xr0, 0
+; CHECK-NEXT:    xvpermi.q $xr1, $xr0, 1
+; CHECK-NEXT:    vinsgr2vr.h $vr1, $a0, 7
+; CHECK-NEXT:    xvpermi.q $xr0, $xr1, 2
+; CHECK-NEXT:    addi.d $sp, $fp, -64
+; CHECK-NEXT:    ld.d $fp, $sp, 48 # 8-byte Folded Reload
+; CHECK-NEXT:    ld.d $ra, $sp, 56 # 8-byte Folded Reload
+; CHECK-NEXT:    addi.d $sp, $sp, 64
+; CHECK-NEXT:    ret
+  %shuffle = shufflevector <16 x i16> %a, <16 x i16> poison, <16 x i32> <i32 8, i32 9, i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15>
+  ret <16 x i16> %shuffle
+}
+
+define <8 x i32> @shuffle_v8i32(<8 x i32> %a) {
+; CHECK-LABEL: shuffle_v8i32:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    xvpickve2gr.w $a0, $xr0, 4
+; CHECK-NEXT:    xvinsgr2vr.w $xr1, $a0, 0
+; CHECK-NEXT:    xvpickve2gr.w $a1, $xr0, 5
+; CHECK-NEXT:    xvinsgr2vr.w $xr1, $a1, 1
+; CHECK-NEXT:    xvpickve2gr.w $a2, $xr0, 0
+; CHECK-NEXT:    xvinsgr2vr.w $xr1, $a2, 2
+; CHECK-NEXT:    xvpickve2gr.w $a2, $xr0, 1
+; CHECK-NEXT:    xvinsgr2vr.w $xr1, $a2, 3
+; CHECK-NEXT:    xvinsgr2vr.w $xr1, $a0, 4
+; CHECK-NEXT:    xvinsgr2vr.w $xr1, $a1, 5
+; CHECK-NEXT:    xvpickve2gr.w $a0, $xr0, 6
+; CHECK-NEXT:    xvinsgr2vr.w $xr1, $a0, 6
+; CHECK-NEXT:    xvpickve2gr.w $a0, $xr0, 7
+; CHECK-NEXT:    xvinsgr2vr.w $xr1, $a0, 7
+; CHECK-NEXT:    xvori.b $xr0, $xr1, 0
+; CHECK-NEXT:    ret
+  %shuffle = shufflevector <8 x i32> %a, <8 x i32> poison, <8 x i32> <i32 4, i32 5, i32 0, i32 1, i32 4, i32 5, i32 6, i32 7>
+  ret <8 x i32> %shuffle
+}
+
+define <4 x i64> @shuffle_v4i64(<4 x i64> %a) {
+; CHECK-LABEL: shuffle_v4i64:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    xvpickve2gr.d $a0, $xr0, 3
+; CHECK-NEXT:    xvinsgr2vr.d $xr1, $a0, 0
+; CHECK-NEXT:    xvpickve2gr.d $a0, $xr0, 1
+; CHECK-NEXT:    xvinsgr2vr.d $xr1, $a0, 1
+; CHECK-NEXT:    xvpickve2gr.d $a0, $xr0, 2
+; CHECK-NEXT:    xvinsgr2vr.d $xr1, $a0, 2
+; CHECK-NEXT:    xvpickve2gr.d $a0, $xr0, 0
+; CHECK-NEXT:    xvinsgr2vr.d $xr1, $a0, 3
+; CHECK-NEXT:    xvori.b $xr0, $xr1, 0
+; CHECK-NEXT:    ret
+  %shuffle = shufflevector <4 x i64> %a, <4 x i64> poison, <4 x i32> <i32 3, i32 1, i32 2, i32 0>
+  ret <4 x i64> %shuffle
+}
+
+define <8 x float> @shuffle_v8f32(<8 x float> %a) {
+; CHECK-LABEL: shuffle_v8f32:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    xvpickve2gr.w $a0, $xr0, 4
+; CHECK-NEXT:    movgr2fr.w $fa1, $a0
+; CHECK-NEXT:    xvpickve2gr.w $a0, $xr0, 5
+; CHECK-NEXT:    movgr2fr.w $fa2, $a0
+; CHECK-NEXT:    movfr2gr.s $a0, $fa1
+; CHECK-NEXT:    movfr2gr.s $a1, $fa2
+; CHECK-NEXT:    xvpickve2gr.w $a2, $xr0, 0
+; CHECK-NEXT:    movgr2fr.w $fa1, $a2
+; CHECK-NEXT:    xvpickve2gr.w $a2, $xr0, 1
+; CHECK-NEXT:    movgr2fr.w $fa2, $a2
+; CHECK-NEXT:    movfr2gr.s $a2, $fa1
+; CHECK-NEXT:    xvinsgr2vr.w $xr1, $a0, 0
+; CHECK-NEXT:    xvinsgr2vr.w $xr1, $a1, 1
+; CHECK-NEXT:    xvinsgr2vr.w $xr1, $a2, 2
+; CHECK-NEXT:    movfr2gr.s $a2, $fa2
+; CHECK-NEXT:    xvinsgr2vr.w $xr1, $a2, 3
+; CHECK-NEXT:    xvinsgr2vr.w $xr1, $a0, 4
+; CHECK-NEXT:    xvpickve2gr.w $a0, $xr0, 6
+; CHECK-NEXT:    movgr2fr.w $fa2, $a0
+; CHECK-NEXT:    xvinsgr2vr.w $xr1, $a1, 5
+; CHECK-NEXT:    movfr2gr.s $a0, $fa2
+; CHECK-NEXT:    xvpickve2gr.w $a1, $xr0, 7
+; CHECK-NEXT:    movgr2fr.w $fa0, $a1
+; CHECK-NEXT:    xvinsgr2vr.w $xr1, $a0, 6
+; CHECK-NEXT:    movfr2gr.s $a0, $fa0
+; CHECK-NEXT:    xvinsgr2vr.w $xr1, $a0, 7
+; CHECK-NEXT:    xvori.b $xr0, $xr1, 0
+; CHECK-NEXT:    ret
+  %shuffle = shufflevector <8 x float> %a, <8 x float> poison, <8 x i32> <i32 4, i32 5, i32 0, i32 1, i32 4, i32 5, i32 6, i32 7>
+  ret <8 x float> %shuffle
+}
+
+define <4 x double> @shuffle_v4f64(<4 x double> %a, <4 x double> %b) {
+; CHECK-LABEL: shuffle_v4f64:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    xvpickve2gr.d $a0, $xr0, 3
+; CHECK-NEXT:    movgr2fr.d $fa1, $a0
+; CHECK-NEXT:    xvpickve2gr.d $a0, $xr0, 1
+; CHECK-NEXT:    movgr2fr.d $fa2, $a0
+; CHECK-NEXT:    movfr2gr.d $a0, $fa1
+; CHECK-NEXT:    xvinsgr2vr.d $xr1, $a0, 0
+; CHECK-NEXT:    movfr2gr.d $a0, $fa2
+; CHECK-NEXT:    xvinsgr2vr.d $xr1, $a0, 1
+; CHECK-NEXT:    xvpickve2gr.d $a0, $xr0, 2
+; CHECK-NEXT:    movgr2fr.d $fa2, $a0
+; CHECK-NEXT:    xvpickve2gr.d $a0, $xr0, 0
+; CHECK-NEXT:    movgr2fr.d $fa0, $a0
+; CHECK-NEXT:    movfr2gr.d $a0, $fa2
+; CHECK-NEXT:    xvinsgr2vr.d $xr1, $a0, 2
+; CHECK-NEXT:    movfr2gr.d $a0, $fa0
+; CHECK-NEXT:    xvinsgr2vr.d $xr1, $a0, 3
+; CHECK-NEXT:    xvori.b $xr0, $xr1, 0
+; CHECK-NEXT:    ret
+  %shuffle = shufflevector <4 x double> %a, <4 x double> %b, <4 x i32> <i32 3, i32 1, i32 2, i32 0>
+  ret <4 x double> %shuffle
+}

tangaac · 2025-05-23T07:36:45Z

define <4 x double> @shuffle_v4f64(<4 x double> %a) {
  %shuffle = shufflevector <4 x double> %a, <4 x double> %b, <4 x i32> <i32 3, i32 1, i32 2, i32 0>
  ret <4 x double> %shuffle
}

after optimization

	pcalau12i	$a0, %pc_hi20(.LCPI5_0)
	xvld	$xr2, $a0, %pc_lo12(.LCPI5_0)
	pcalau12i	$a0, %pc_hi20(.LCPI5_1)
	xvld	$xr1, $a0, %pc_lo12(.LCPI5_1)
	xvpermi.d	$xr3, $xr0, 78
	xvshuf.d	$xr2, $xr0, $xr3
	xvshuf.d	$xr1, $xr2, $xr0
	xvori.b	$xr0, $xr1, 0
	ret

…le. (llvm#141205)

tangaac requested a review from heiher May 23, 2025 07:26

llvmbot added the backend:loongarch label May 23, 2025

Pre-commit for lowering shuffle as lane permute and shuffle

6d7d33c

tangaac force-pushed the pre-permute-shuffle branch from 042d503 to 6d7d33c Compare May 23, 2025 07:44

heiher approved these changes May 27, 2025

View reviewed changes

tangaac merged commit 58ee6e6 into llvm:main May 27, 2025
9 of 11 checks passed

sivan-shani pushed a commit to sivan-shani/llvm-project that referenced this pull request Jun 3, 2025

[LoongArch] Pre-commit for lowering shuffle as lane permute and shuff…

1e19b9a

…le. (llvm#141205)

tangaac deleted the pre-permute-shuffle branch June 9, 2025 01:24

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[LoongArch] Pre-commit for lowering shuffle as lane permute and shuffle. #141205

[LoongArch] Pre-commit for lowering shuffle as lane permute and shuffle. #141205

Uh oh!

tangaac commented May 23, 2025

Uh oh!

llvmbot commented May 23, 2025

Uh oh!

tangaac commented May 23, 2025 •

edited

Loading

Uh oh!

Uh oh!

Uh oh!

[LoongArch] Pre-commit for lowering shuffle as lane permute and shuffle. #141205

[LoongArch] Pre-commit for lowering shuffle as lane permute and shuffle. #141205

Uh oh!

Conversation

tangaac commented May 23, 2025

Uh oh!

llvmbot commented May 23, 2025

Uh oh!

tangaac commented May 23, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Uh oh!

Uh oh!

tangaac commented May 23, 2025 •

edited

Loading