[AArch64][GlobalISel] Select llvm.aarch64.neon.ld* intrinsics #65630

dzhidzhoev · 2023-09-07T16:11:58Z

Similar to llvm/lib/Target/AArch64/AArch64ISelDAGToDAG.cpp.

aemerson · 2023-09-08T09:14:21Z

llvm/lib/Target/AArch64/GISel/AArch64InstructionSelector.cpp

@@ -3897,6 +3906,31 @@ MachineInstr *AArch64InstructionSelector::emitScalarToVector(
  }
 }

+MachineInstr *


Please add a comment to document this helper function

aemerson · 2023-09-08T10:11:35Z

llvm/test/CodeGen/AArch64/arm64-ld1.ll

+; CHECK-SD-LABEL: ld2lane_16b:
+; CHECK-SD:       // %bb.0:
+; CHECK-SD-NEXT:    // kill: def $q1 killed $q1 killed $q0_q1 def $q0_q1
+; CHECK-SD-NEXT:    // kill: def $q0 killed $q0 killed $q0_q1 def $q0_q1
+; CHECK-SD-NEXT:    ld2.b { v0, v1 }[1], [x0]
+; CHECK-SD-NEXT:    ret
+;
+; CHECK-GI-LABEL: ld2lane_16b:
+; CHECK-GI:       // %bb.0:
+; CHECK-GI-NEXT:    // kill: def $q0 killed $q0 killed $q0_q1 def $q0_q1
+; CHECK-GI-NEXT:    // kill: def $q1 killed $q1 killed $q0_q1 def $q0_q1
+; CHECK-GI-NEXT:    ld2.b { v0, v1 }[1], [x0]
+; CHECK-GI-NEXT:    ret


Do you happen to know why we print the these kill comments in the opposite order? It's annoying that this difference prevents the checks from merging.

I've noticed this weird difference too. ScheduleDAGRRList puts these COPY instructions in reverse order during REG_SEQUENCE scheduling. In GlobalISel, they get IRTranslate'd as

%0:_(<16 x s8>) = COPY $q0 %1:_(<16 x s8>) = COPY $q1

and afterward, the order doesn't change.

aemerson · 2023-09-13T07:31:29Z

llvm/lib/Target/AArch64/AArch64InstrGISel.td

+def : Pat<(v8i8 (AArch64dup (i8 (load (am_indexed8 GPR64sp:$Rn))))),
+          (LD1Rv8b GPR64sp:$Rn)>;
+def : Pat<(v16i8 (AArch64dup (i8 (load GPR64sp:$Rn)))),
+          (LD1Rv16b GPR64sp:$Rn)>;
+def : Pat<(v4i16 (AArch64dup (i16 (load GPR64sp:$Rn)))),
+          (LD1Rv4h GPR64sp:$Rn)>;
+def : Pat<(v8i16 (AArch64dup (i16 (load GPR64sp:$Rn)))),
+          (LD1Rv8h GPR64sp:$Rn)>;
+def : Pat<(v2i32 (AArch64dup (i32 (load GPR64sp:$Rn)))),
+          (LD1Rv2s GPR64sp:$Rn)>;
+def : Pat<(v4i32 (AArch64dup (i32 (load GPR64sp:$Rn)))),
+          (LD1Rv4s GPR64sp:$Rn)>;
+def : Pat<(v2i64 (AArch64dup (i64 (load GPR64sp:$Rn)))),
+          (LD1Rv2d GPR64sp:$Rn)>;
+def : Pat<(v1i64 (AArch64dup (i64 (load GPR64sp:$Rn)))),
+          (LD1Rv1d GPR64sp:$Rn)>;
+
+class Ld1Lane64PatGISel<SDPatternOperator scalar_load, Operand VecIndex,
+                   ValueType VTy, ValueType STy, Instruction LD1>
+  : Pat<(insertelt (VTy VecListOne64:$Rd),
+           (STy (scalar_load GPR64sp:$Rn)), VecIndex:$idx),
+        (EXTRACT_SUBREG
+            (LD1 (SUBREG_TO_REG (i32 0), VecListOne64:$Rd, dsub),
+                          (UImmS1XForm VecIndex:$idx), GPR64sp:$Rn),
+            dsub)>;
+
+class Ld1Lane128PatGISel<Operand VecIndex, ValueType VTy,
+                         ValueType STy, Instruction LD1>
+  : Pat<(insertelt (VTy VecListOne128:$Rd),
+           (STy (load GPR64sp:$Rn)), VecIndex:$idx),
+        (LD1 VecListOne128:$Rd, (UImmS1XForm VecIndex:$idx), GPR64sp:$Rn)>;
+


Are these necessary support the AArch64 intrinsics? They look like matching generic code to me?

def : Pat<(v8i8 (AArch64dup (i8 (load (am_indexed8 GPR64sp:$Rn))))), (LD1Rv8b GPR64sp:$Rn)>; def : Pat<(v16i8 (AArch64dup (i8 (load GPR64sp:$Rn)))), (LD1Rv16b GPR64sp:$Rn)>; def : Pat<(v4i16 (AArch64dup (i16 (load GPR64sp:$Rn)))), (LD1Rv4h GPR64sp:$Rn)>; def : Pat<(v8i16 (AArch64dup (i16 (load GPR64sp:$Rn)))), (LD1Rv8h GPR64sp:$Rn)>;

These lines are different from what we have in AArch64InstrInfo.td since loads return i32 there, so patterns there contain extloadi8/extloadi16 instead of load, whereas in gMIR G_DUP takes i8 and i16 correspondingly.

def : Pat<(v2i32 (AArch64dup (i32 (load GPR64sp:$Rn)))),

This and the following 3 patterns I've added just to have together full set of patterns to select G_DUP. Should I remove them?

Ld1Lane64PatGISel and Ld1Lane128PatGISel are slightly different from Ld1Lane64Pat/Ld1Lane128Pat, because vector_insert used in latter patterns isn't imported to GlobalISel. If I replace it with insertelt there, the pattern doesn't go off in SelectionDAG.

I was checking if this patch can be split up, since matching intrinsics I would have thought would be separate to matching generic load patterns? Not a big deal either way.

Oh, I see, did that

aemerson

Thanks, it's easier to review when we keep the patches independent.

Similar to llvm/lib/Target/AArch64/AArch64ISelDAGToDAG.cpp.

…5630) Similar to llvm/lib/Target/AArch64/AArch64ISelDAGToDAG.cpp.

Follow-up of llvm#65630.

dzhidzhoev requested a review from a team as a code owner September 7, 2023 16:11

github-actions bot added the backend:AArch64 label Sep 7, 2023

dzhidzhoev requested review from a team, ornata and bjope September 7, 2023 16:20

aemerson reviewed Sep 8, 2023

View reviewed changes

dzhidzhoev force-pushed the ld-only branch from 97dddd4 to f1c4e86 Compare September 11, 2023 12:23

dzhidzhoev requested review from a team September 11, 2023 12:27

aemerson reviewed Sep 13, 2023

View reviewed changes

aemerson approved these changes Sep 15, 2023

View reviewed changes

bjope removed their request for review September 15, 2023 10:36

[AArch64][GlobalISel] Select llvm.aarch64.neon.ld* intrinsics

69e446b

Similar to llvm/lib/Target/AArch64/AArch64ISelDAGToDAG.cpp.

dzhidzhoev force-pushed the ld-only branch from e4d96b9 to 69e446b Compare September 15, 2023 12:03

dzhidzhoev merged commit c464896 into llvm:main Sep 15, 2023

ZijunZhaoCCK pushed a commit to ZijunZhaoCCK/llvm-project that referenced this pull request Sep 19, 2023

[AArch64][GlobalISel] Select llvm.aarch64.neon.ld* intrinsics (llvm#6…

0e7524d

…5630) Similar to llvm/lib/Target/AArch64/AArch64ISelDAGToDAG.cpp.

dzhidzhoev mentioned this pull request Sep 20, 2023

[AArch64][GlobalISel] Adopt dup(load) -> LD1R patterns from SelectionDAG #66914

Merged

dzhidzhoev added a commit to dzhidzhoev/llvm-project that referenced this pull request Sep 20, 2023

[AArch64][GlobalISel] Adopt dup(load) -> LD1R patterns from SelectionDAG

fb8f591

Follow-up of llvm#65630.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[AArch64][GlobalISel] Select llvm.aarch64.neon.ld* intrinsics #65630

[AArch64][GlobalISel] Select llvm.aarch64.neon.ld* intrinsics #65630

dzhidzhoev commented Sep 7, 2023

aemerson Sep 8, 2023

aemerson Sep 8, 2023

dzhidzhoev Sep 8, 2023

aemerson Sep 13, 2023

dzhidzhoev Sep 13, 2023

aemerson Sep 13, 2023

dzhidzhoev Sep 13, 2023

aemerson left a comment

[AArch64][GlobalISel] Select llvm.aarch64.neon.ld* intrinsics #65630

[AArch64][GlobalISel] Select llvm.aarch64.neon.ld* intrinsics #65630

Conversation

dzhidzhoev commented Sep 7, 2023

aemerson Sep 8, 2023

Choose a reason for hiding this comment

aemerson Sep 8, 2023

Choose a reason for hiding this comment

dzhidzhoev Sep 8, 2023

Choose a reason for hiding this comment

aemerson Sep 13, 2023

Choose a reason for hiding this comment

dzhidzhoev Sep 13, 2023

Choose a reason for hiding this comment

aemerson Sep 13, 2023

Choose a reason for hiding this comment

dzhidzhoev Sep 13, 2023

Choose a reason for hiding this comment

aemerson left a comment

Choose a reason for hiding this comment