[InstCombine] Fold (sub (xor X, (sext C)), (sext C)) => (select C (neg X), X) #79417

bzEq · 2024-01-25T07:55:55Z

This is useful when computing absdiff.

Correctness prove: https://alive2.llvm.org/ce/z/eMbxps, https://alive2.llvm.org/ce/z/SNCWJe.

llvmbot · 2024-01-25T07:56:26Z

@llvm/pr-subscribers-backend-aarch64

@llvm/pr-subscribers-backend-x86

Author: Kai Luo (bzEq)

Changes

This is useful when computing absdiff.

Correctness prove: https://alive2.llvm.org/ce/z/eMbxps.

Full diff: https://github.com/llvm/llvm-project/pull/79417.diff

5 Files Affected:

(modified) llvm/lib/Transforms/InstCombine/InstCombineAddSub.cpp (+10)
(added) llvm/test/CodeGen/AArch64/absdiff.ll (+16)
(added) llvm/test/CodeGen/PowerPC/absdiff.ll (+23)
(added) llvm/test/CodeGen/X86/absdiff.ll (+19)
(added) llvm/test/Transforms/InstCombine/sub-xor-cmp.ll (+19)

diff --git a/llvm/lib/Transforms/InstCombine/InstCombineAddSub.cpp b/llvm/lib/Transforms/InstCombine/InstCombineAddSub.cpp
index 8a00b75a1f74042..1a13fa4e2099946 100644
--- a/llvm/lib/Transforms/InstCombine/InstCombineAddSub.cpp
+++ b/llvm/lib/Transforms/InstCombine/InstCombineAddSub.cpp
@@ -2448,6 +2448,16 @@ Instruction *InstCombinerImpl::visitSub(BinaryOperator &I) {
     }
   }
 
+  {
+    // (sub (xor X, (sext C)), (sext C)) => (select C (neg X), X)
+    Value *C0, *C1, *X;
+    if (match(Op0, m_Xor(m_Value(X), m_SExt(m_Value(C0)))) &&
+        (C0->getType()->getScalarSizeInBits() == 1) &&
+        match(Op1, m_SExt(m_Value(C1))) && (C0 == C1)) {
+      return SelectInst::Create(C0, Builder.CreateNeg(X), X);
+    }
+  }
+
   if (Instruction *R = tryFoldInstWithCtpopWithNot(&I))
     return R;
 
diff --git a/llvm/test/CodeGen/AArch64/absdiff.ll b/llvm/test/CodeGen/AArch64/absdiff.ll
new file mode 100644
index 000000000000000..88c6fdad0a2030d
--- /dev/null
+++ b/llvm/test/CodeGen/AArch64/absdiff.ll
@@ -0,0 +1,16 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 4
+; RUN: opt -mtriple=aarch64-linux-gnu -passes=instcombine < %s -o - | llc -mtriple=aarch64-linux-gnu -o - | FileCheck %s
+
+define  i64 @absdiff(i64 %0, i64 %1) {
+; CHECK-LABEL: absdiff:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    subs x8, x0, x1
+; CHECK-NEXT:    cneg x0, x8, lo
+; CHECK-NEXT:    ret
+  %3 = icmp ult i64 %0, %1
+  %4 = sext i1 %3 to i64
+  %5 = sub i64 %0, %1
+  %6 = xor i64 %5, %4
+  %7 = sub i64 %6, %4
+  ret i64 %7
+}
diff --git a/llvm/test/CodeGen/PowerPC/absdiff.ll b/llvm/test/CodeGen/PowerPC/absdiff.ll
new file mode 100644
index 000000000000000..c806da988f0a0bf
--- /dev/null
+++ b/llvm/test/CodeGen/PowerPC/absdiff.ll
@@ -0,0 +1,23 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 4
+; RUN: opt -mtriple=powerpc64-linux-gnu -passes=instcombine < %s -o - | llc -mtriple=powerpc64-linux-gnu -o - | FileCheck %s
+
+define  i64 @absdiff(i64 %0, i64 %1) {
+; CHECK-LABEL: absdiff:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    sub 5, 3, 4
+; CHECK-NEXT:    neg 6, 5
+; CHECK-NEXT:    cmpld 3, 4
+; CHECK-NEXT:    bc 12, 0, .LBB0_2
+; CHECK-NEXT:  # %bb.1:
+; CHECK-NEXT:    ori 3, 5, 0
+; CHECK-NEXT:    blr
+; CHECK-NEXT:  .LBB0_2:
+; CHECK-NEXT:    addi 3, 6, 0
+; CHECK-NEXT:    blr
+  %3 = icmp ult i64 %0, %1
+  %4 = sext i1 %3 to i64
+  %5 = sub i64 %0, %1
+  %6 = xor i64 %5, %4
+  %7 = sub i64 %6, %4
+  ret i64 %7
+}
diff --git a/llvm/test/CodeGen/X86/absdiff.ll b/llvm/test/CodeGen/X86/absdiff.ll
new file mode 100644
index 000000000000000..ce9a00935448131
--- /dev/null
+++ b/llvm/test/CodeGen/X86/absdiff.ll
@@ -0,0 +1,19 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 4
+; RUN: opt -mtriple=x86_64-linux-gnu -passes=instcombine < %s -o - | llc -mtriple=x86_64-linux-gnu -o - | FileCheck %s
+
+define  i64 @absdiff(i64 %0, i64 %1) {
+; CHECK-LABEL: absdiff:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    movq %rdi, %rax
+; CHECK-NEXT:    subq %rsi, %rax
+; CHECK-NEXT:    negq %rax
+; CHECK-NEXT:    subq %rsi, %rdi
+; CHECK-NEXT:    cmovaeq %rdi, %rax
+; CHECK-NEXT:    retq
+  %3 = icmp ult i64 %0, %1
+  %4 = sext i1 %3 to i64
+  %5 = sub i64 %0, %1
+  %6 = xor i64 %5, %4
+  %7 = sub i64 %6, %4
+  ret i64 %7
+}
diff --git a/llvm/test/Transforms/InstCombine/sub-xor-cmp.ll b/llvm/test/Transforms/InstCombine/sub-xor-cmp.ll
new file mode 100644
index 000000000000000..393f2bd45bb8d77
--- /dev/null
+++ b/llvm/test/Transforms/InstCombine/sub-xor-cmp.ll
@@ -0,0 +1,19 @@
+; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --version 4
+; RUN: opt < %s -passes=instcombine -S | FileCheck %s
+
+define  i64 @absdiff(i64 %0, i64 %1) {
+; CHECK-LABEL: define i64 @absdiff(
+; CHECK-SAME: i64 [[TMP0:%.*]], i64 [[TMP1:%.*]]) {
+; CHECK-NEXT:    [[TMP3:%.*]] = icmp ult i64 [[TMP0]], [[TMP1]]
+; CHECK-NEXT:    [[TMP4:%.*]] = sub i64 [[TMP0]], [[TMP1]]
+; CHECK-NEXT:    [[TMP5:%.*]] = sub i64 0, [[TMP4]]
+; CHECK-NEXT:    [[TMP6:%.*]] = select i1 [[TMP3]], i64 [[TMP5]], i64 [[TMP4]]
+; CHECK-NEXT:    ret i64 [[TMP6]]
+;
+  %3 = icmp ult i64 %0, %1
+  %4 = sext i1 %3 to i64
+  %5 = sub i64 %0, %1
+  %6 = xor i64 %5, %4
+  %7 = sub i64 %6, %4
+  ret i64 %7
+}

llvmbot · 2024-01-25T07:56:26Z

@llvm/pr-subscribers-llvm-transforms

Author: Kai Luo (bzEq)

Changes

This is useful when computing absdiff.

Correctness prove: https://alive2.llvm.org/ce/z/eMbxps.

Full diff: https://github.com/llvm/llvm-project/pull/79417.diff

5 Files Affected:

(modified) llvm/lib/Transforms/InstCombine/InstCombineAddSub.cpp (+10)
(added) llvm/test/CodeGen/AArch64/absdiff.ll (+16)
(added) llvm/test/CodeGen/PowerPC/absdiff.ll (+23)
(added) llvm/test/CodeGen/X86/absdiff.ll (+19)
(added) llvm/test/Transforms/InstCombine/sub-xor-cmp.ll (+19)

diff --git a/llvm/lib/Transforms/InstCombine/InstCombineAddSub.cpp b/llvm/lib/Transforms/InstCombine/InstCombineAddSub.cpp
index 8a00b75a1f74042..1a13fa4e2099946 100644
--- a/llvm/lib/Transforms/InstCombine/InstCombineAddSub.cpp
+++ b/llvm/lib/Transforms/InstCombine/InstCombineAddSub.cpp
@@ -2448,6 +2448,16 @@ Instruction *InstCombinerImpl::visitSub(BinaryOperator &I) {
     }
   }
 
+  {
+    // (sub (xor X, (sext C)), (sext C)) => (select C (neg X), X)
+    Value *C0, *C1, *X;
+    if (match(Op0, m_Xor(m_Value(X), m_SExt(m_Value(C0)))) &&
+        (C0->getType()->getScalarSizeInBits() == 1) &&
+        match(Op1, m_SExt(m_Value(C1))) && (C0 == C1)) {
+      return SelectInst::Create(C0, Builder.CreateNeg(X), X);
+    }
+  }
+
   if (Instruction *R = tryFoldInstWithCtpopWithNot(&I))
     return R;
 
diff --git a/llvm/test/CodeGen/AArch64/absdiff.ll b/llvm/test/CodeGen/AArch64/absdiff.ll
new file mode 100644
index 000000000000000..88c6fdad0a2030d
--- /dev/null
+++ b/llvm/test/CodeGen/AArch64/absdiff.ll
@@ -0,0 +1,16 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 4
+; RUN: opt -mtriple=aarch64-linux-gnu -passes=instcombine < %s -o - | llc -mtriple=aarch64-linux-gnu -o - | FileCheck %s
+
+define  i64 @absdiff(i64 %0, i64 %1) {
+; CHECK-LABEL: absdiff:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    subs x8, x0, x1
+; CHECK-NEXT:    cneg x0, x8, lo
+; CHECK-NEXT:    ret
+  %3 = icmp ult i64 %0, %1
+  %4 = sext i1 %3 to i64
+  %5 = sub i64 %0, %1
+  %6 = xor i64 %5, %4
+  %7 = sub i64 %6, %4
+  ret i64 %7
+}
diff --git a/llvm/test/CodeGen/PowerPC/absdiff.ll b/llvm/test/CodeGen/PowerPC/absdiff.ll
new file mode 100644
index 000000000000000..c806da988f0a0bf
--- /dev/null
+++ b/llvm/test/CodeGen/PowerPC/absdiff.ll
@@ -0,0 +1,23 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 4
+; RUN: opt -mtriple=powerpc64-linux-gnu -passes=instcombine < %s -o - | llc -mtriple=powerpc64-linux-gnu -o - | FileCheck %s
+
+define  i64 @absdiff(i64 %0, i64 %1) {
+; CHECK-LABEL: absdiff:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    sub 5, 3, 4
+; CHECK-NEXT:    neg 6, 5
+; CHECK-NEXT:    cmpld 3, 4
+; CHECK-NEXT:    bc 12, 0, .LBB0_2
+; CHECK-NEXT:  # %bb.1:
+; CHECK-NEXT:    ori 3, 5, 0
+; CHECK-NEXT:    blr
+; CHECK-NEXT:  .LBB0_2:
+; CHECK-NEXT:    addi 3, 6, 0
+; CHECK-NEXT:    blr
+  %3 = icmp ult i64 %0, %1
+  %4 = sext i1 %3 to i64
+  %5 = sub i64 %0, %1
+  %6 = xor i64 %5, %4
+  %7 = sub i64 %6, %4
+  ret i64 %7
+}
diff --git a/llvm/test/CodeGen/X86/absdiff.ll b/llvm/test/CodeGen/X86/absdiff.ll
new file mode 100644
index 000000000000000..ce9a00935448131
--- /dev/null
+++ b/llvm/test/CodeGen/X86/absdiff.ll
@@ -0,0 +1,19 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 4
+; RUN: opt -mtriple=x86_64-linux-gnu -passes=instcombine < %s -o - | llc -mtriple=x86_64-linux-gnu -o - | FileCheck %s
+
+define  i64 @absdiff(i64 %0, i64 %1) {
+; CHECK-LABEL: absdiff:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    movq %rdi, %rax
+; CHECK-NEXT:    subq %rsi, %rax
+; CHECK-NEXT:    negq %rax
+; CHECK-NEXT:    subq %rsi, %rdi
+; CHECK-NEXT:    cmovaeq %rdi, %rax
+; CHECK-NEXT:    retq
+  %3 = icmp ult i64 %0, %1
+  %4 = sext i1 %3 to i64
+  %5 = sub i64 %0, %1
+  %6 = xor i64 %5, %4
+  %7 = sub i64 %6, %4
+  ret i64 %7
+}
diff --git a/llvm/test/Transforms/InstCombine/sub-xor-cmp.ll b/llvm/test/Transforms/InstCombine/sub-xor-cmp.ll
new file mode 100644
index 000000000000000..393f2bd45bb8d77
--- /dev/null
+++ b/llvm/test/Transforms/InstCombine/sub-xor-cmp.ll
@@ -0,0 +1,19 @@
+; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --version 4
+; RUN: opt < %s -passes=instcombine -S | FileCheck %s
+
+define  i64 @absdiff(i64 %0, i64 %1) {
+; CHECK-LABEL: define i64 @absdiff(
+; CHECK-SAME: i64 [[TMP0:%.*]], i64 [[TMP1:%.*]]) {
+; CHECK-NEXT:    [[TMP3:%.*]] = icmp ult i64 [[TMP0]], [[TMP1]]
+; CHECK-NEXT:    [[TMP4:%.*]] = sub i64 [[TMP0]], [[TMP1]]
+; CHECK-NEXT:    [[TMP5:%.*]] = sub i64 0, [[TMP4]]
+; CHECK-NEXT:    [[TMP6:%.*]] = select i1 [[TMP3]], i64 [[TMP5]], i64 [[TMP4]]
+; CHECK-NEXT:    ret i64 [[TMP6]]
+;
+  %3 = icmp ult i64 %0, %1
+  %4 = sext i1 %3 to i64
+  %5 = sub i64 %0, %1
+  %6 = xor i64 %5, %4
+  %7 = sub i64 %6, %4
+  ret i64 %7
+}

PR Link: llvm/llvm-project#79417

llvm/lib/Transforms/InstCombine/InstCombineAddSub.cpp

llvm/test/CodeGen/AArch64/absdiff.ll

dtcxzyw · 2024-01-26T05:55:25Z

llvm/test/Transforms/InstCombine/sub-xor-cmp.ll

+; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --version 4
+; RUN: opt < %s -passes=instcombine -S | FileCheck %s
+
+define  i64 @absdiff(i64 %0, i64 %1) {


What is the motivation of this patch? Does this pattern exist in some real-world applications?

Does this pattern exist in some real-world applications?

Yes. We have observed this pattern in our internal workload.

Similar to https://www.oreilly.com/library/view/hackers-delight/0201914654/0201914654_ch02lev1sec4.html.

Co-authored-by: Yingwei Zheng <dtcxzyw@qq.com>

llvm/test/Transforms/InstCombine/sub-xor-cmp.ll

RKSimon · 2024-01-26T15:57:48Z

llvm/lib/Transforms/InstCombine/InstCombineAddSub.cpp

+    // (sub (sext C), (xor X, (sext C))) => (select C, X, (neg X))
+    Value *C, *X;
+    auto m_SubXorCmp = [&C, &X](Value *LHS, Value *RHS) {
+      return match(LHS, m_c_Xor(m_Value(X), m_SExt(m_OneUse(m_Value(C))))) &&


What is the purpose of the m_OneUse?

Could the patterns be better matched as?

return match(LHS, m_c_Xor(m_Value(X), m_Specific(RHS))) && match(RHS, m_SExt(m_Specific(C)) && (C->getType()->getScalarSizeInBits() == 1);

What is the purpose of the m_OneUse?

Looks no need to check m_OneUse of the i1 value, since we are still using it in the result.
What concerns me is usage of (sext i1), if it's still using by other instructions other than this (sub (sext C), (xor X, (sext C))), not sure if the transformation is still profitable. I'll add test cases to demonstrate as suggested by @dtcxzyw .

llvm/test/Transforms/InstCombine/sub-xor-cmp.ll

dtcxzyw

LGTM. Please wait for additional approval from other reviewers.

llvm/lib/Transforms/InstCombine/InstCombineAddSub.cpp

RKSimon

LGTM - cheers

llvm/test/Transforms/InstCombine/sub-xor-cmp.ll

bzEq added 3 commits January 25, 2024 07:48

Add test

85360d6

(sub (xor X, (sext C)), (sext C)) => (select C (neg X), X)

9073811

Update test

6ef2471

bzEq requested a review from RKSimon January 25, 2024 07:55

bzEq self-assigned this Jan 25, 2024

bzEq requested a review from nikic as a code owner January 25, 2024 07:55

llvmbot added backend:AArch64 backend:X86 llvm:transforms labels Jan 25, 2024

bzEq requested review from stefanp-ibm, chenzheng1030 and ecnelises January 25, 2024 07:59

Add codegen comparison

cb8c375

bzEq mentioned this pull request Jan 26, 2024

[InstCombine] Precommit test for #79417. NFC. #79418

Closed

Fix test

80ef5c9

dtcxzyw requested a review from goldsteinn January 26, 2024 05:33

dtcxzyw added a commit to dtcxzyw/llvm-opt-benchmark that referenced this pull request Jan 26, 2024

pre-commit: test PR79417

d18ae8a

PR Link: llvm/llvm-project#79417

dtcxzyw mentioned this pull request Jan 26, 2024

pre-commit: test PR79417 dtcxzyw/llvm-opt-benchmark#150

Open

dtcxzyw requested changes Jan 26, 2024

View reviewed changes

bzEq and others added 3 commits January 26, 2024 14:39

Removed codegen tests

d0c3f9f

Update llvm/lib/Transforms/InstCombine/InstCombineAddSub.cpp

0c71172

Co-authored-by: Yingwei Zheng <dtcxzyw@qq.com>

Up

8a5f5d7

bzEq commented Jan 26, 2024

View reviewed changes

llvm/test/Transforms/InstCombine/sub-xor-cmp.ll Show resolved Hide resolved

Up

2af8703

bzEq requested a review from dtcxzyw January 26, 2024 07:59

bzEq added 2 commits January 26, 2024 16:06

Rename

d7ee2a3

Rename

386a2f5

dtcxzyw reviewed Jan 26, 2024

View reviewed changes

llvm/test/Transforms/InstCombine/sub-xor-cmp.ll Show resolved Hide resolved

RKSimon reviewed Jan 26, 2024

View reviewed changes

bzEq added 2 commits January 27, 2024 11:11

Update

50a2c1b

Add nagative cases

994e6b5

bzEq requested review from dtcxzyw and RKSimon January 29, 2024 05:27

bzEq commented Jan 29, 2024

View reviewed changes

llvm/test/Transforms/InstCombine/sub-xor-cmp.ll Outdated Show resolved Hide resolved

Check one use of (xor X, (sext C)) to avoid regression

8a3e3b3

dtcxzyw approved these changes Jan 30, 2024

View reviewed changes

RKSimon reviewed Jan 30, 2024

View reviewed changes

llvm/lib/Transforms/InstCombine/InstCombineAddSub.cpp Outdated Show resolved Hide resolved

bzEq requested a review from RKSimon January 31, 2024 02:34

Minor change

7cce8a2

RKSimon approved these changes Jan 31, 2024

View reviewed changes

nikic reviewed Jan 31, 2024

View reviewed changes

llvm/test/Transforms/InstCombine/sub-xor-cmp.ll Outdated Show resolved Hide resolved

llvm/test/Transforms/InstCombine/sub-xor-cmp.ll Outdated Show resolved Hide resolved

llvm/test/Transforms/InstCombine/sub-xor-cmp.ll Show resolved Hide resolved

bzEq requested a review from nikic February 1, 2024 02:48

Address comments

baa48e9

bzEq merged commit 0f02431 into llvm:main Feb 26, 2024
4 checks passed

bzEq deleted the comb-cond-2scomp branch March 29, 2024 06:45

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[InstCombine] Fold (sub (xor X, (sext C)), (sext C)) => (select C (neg X), X) #79417

[InstCombine] Fold (sub (xor X, (sext C)), (sext C)) => (select C (neg X), X) #79417

bzEq commented Jan 25, 2024 •

edited

llvmbot commented Jan 25, 2024 •

edited

llvmbot commented Jan 25, 2024

dtcxzyw Jan 26, 2024

bzEq Jan 26, 2024

bzEq Jan 26, 2024

RKSimon Jan 26, 2024

bzEq Jan 27, 2024 •

edited

dtcxzyw left a comment

RKSimon left a comment

[InstCombine] Fold (sub (xor X, (sext C)), (sext C)) => (select C (neg X), X) #79417

[InstCombine] Fold (sub (xor X, (sext C)), (sext C)) => (select C (neg X), X) #79417

Conversation

bzEq commented Jan 25, 2024 • edited

llvmbot commented Jan 25, 2024 • edited

llvmbot commented Jan 25, 2024

dtcxzyw Jan 26, 2024

Choose a reason for hiding this comment

bzEq Jan 26, 2024

Choose a reason for hiding this comment

bzEq Jan 26, 2024

Choose a reason for hiding this comment

RKSimon Jan 26, 2024

Choose a reason for hiding this comment

bzEq Jan 27, 2024 • edited

Choose a reason for hiding this comment

dtcxzyw left a comment

Choose a reason for hiding this comment

RKSimon left a comment

Choose a reason for hiding this comment

bzEq commented Jan 25, 2024 •

edited

llvmbot commented Jan 25, 2024 •

edited

bzEq Jan 27, 2024 •

edited