llvm-project/llvm/test/CodeGen/X86/combine-ptest.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx | FileCheck %s

;
; testz(~X,Y) -> testc(X,Y)
;

define i32 @ptestz_128_invert(<2 x i64> %c, <2 x i64> %d, i32 %a, i32 %b) {
; CHECK-LABEL: ptestz_128_invert:
; CHECK:       # %bb.0:
; CHECK-NEXT:    movl %edi, %eax
; CHECK-NEXT:    vpcmpeqd %xmm2, %xmm2, %xmm2
; CHECK-NEXT:    vpxor %xmm2, %xmm0, %xmm0
; CHECK-NEXT:    vptest %xmm1, %xmm0
; CHECK-NEXT:    cmovnel %esi, %eax
; CHECK-NEXT:    retq
  %t1 = xor <2 x i64> %c, <i64 -1, i64 -1>
  %t2 = call i32 @llvm.x86.sse41.ptestz(<2 x i64> %t1, <2 x i64> %d)
  %t3 = icmp ne i32 %t2, 0
  %t4 = select i1 %t3, i32 %a, i32 %b
  ret i32 %t4
}

define i32 @ptestz_256_invert(<4 x i64> %c, <4 x i64> %d, i32 %a, i32 %b) {
; CHECK-LABEL: ptestz_256_invert:
; CHECK:       # %bb.0:
; CHECK-NEXT:    movl %edi, %eax
; CHECK-NEXT:    vxorps %xmm2, %xmm2, %xmm2
; CHECK-NEXT:    vcmptrueps %ymm2, %ymm2, %ymm2
; CHECK-NEXT:    vxorps %ymm2, %ymm0, %ymm0
; CHECK-NEXT:    vptest %ymm1, %ymm0
; CHECK-NEXT:    cmovnel %esi, %eax
; CHECK-NEXT:    vzeroupper
; CHECK-NEXT:    retq
  %t1 = xor <4 x i64> %c, <i64 -1, i64 -1, i64 -1, i64 -1>
  %t2 = call i32 @llvm.x86.avx.ptestz.256(<4 x i64> %t1, <4 x i64> %d)
  %t3 = icmp ne i32 %t2, 0
  %t4 = select i1 %t3, i32 %a, i32 %b
  ret i32 %t4
}

;
; testc(~X,Y) -> testz(X,Y)
;

define i32 @ptestc_128_invert(<2 x i64> %c, <2 x i64> %d, i32 %a, i32 %b) {
; CHECK-LABEL: ptestc_128_invert:
; CHECK:       # %bb.0:
; CHECK-NEXT:    movl %edi, %eax
; CHECK-NEXT:    vpcmpeqd %xmm2, %xmm2, %xmm2
; CHECK-NEXT:    vpxor %xmm2, %xmm0, %xmm0
; CHECK-NEXT:    vptest %xmm1, %xmm0
; CHECK-NEXT:    cmovael %esi, %eax
; CHECK-NEXT:    retq
  %t1 = xor <2 x i64> %c, <i64 -1, i64 -1>
  %t2 = call i32 @llvm.x86.sse41.ptestc(<2 x i64> %t1, <2 x i64> %d)
  %t3 = icmp ne i32 %t2, 0
  %t4 = select i1 %t3, i32 %a, i32 %b
  ret i32 %t4
}

define i32 @ptestc_256_invert(<4 x i64> %c, <4 x i64> %d, i32 %a, i32 %b) {
; CHECK-LABEL: ptestc_256_invert:
; CHECK:       # %bb.0:
; CHECK-NEXT:    movl %edi, %eax
; CHECK-NEXT:    vxorps %xmm2, %xmm2, %xmm2
; CHECK-NEXT:    vcmptrueps %ymm2, %ymm2, %ymm2
; CHECK-NEXT:    vxorps %ymm2, %ymm0, %ymm0
; CHECK-NEXT:    vptest %ymm1, %ymm0
; CHECK-NEXT:    cmovael %esi, %eax
; CHECK-NEXT:    vzeroupper
; CHECK-NEXT:    retq
  %t1 = xor <4 x i64> %c, <i64 -1, i64 -1, i64 -1, i64 -1>
  %t2 = call i32 @llvm.x86.avx.ptestc.256(<4 x i64> %t1, <4 x i64> %d)
  %t3 = icmp ne i32 %t2, 0
  %t4 = select i1 %t3, i32 %a, i32 %b
  ret i32 %t4
}

;
; testnzc(~X,Y) -> testnzc(X,Y)
;

define i32 @ptestnzc_128_invert(<2 x i64> %c, <2 x i64> %d, i32 %a, i32 %b) {
; CHECK-LABEL: ptestnzc_128_invert:
; CHECK:       # %bb.0:
; CHECK-NEXT:    movl %edi, %eax
; CHECK-NEXT:    vpcmpeqd %xmm2, %xmm2, %xmm2
; CHECK-NEXT:    vpxor %xmm2, %xmm0, %xmm0
; CHECK-NEXT:    vptest %xmm1, %xmm0
; CHECK-NEXT:    cmovael %esi, %eax
; CHECK-NEXT:    retq
  %t1 = xor <2 x i64> %c, <i64 -1, i64 -1>
  %t2 = call i32 @llvm.x86.sse41.ptestc(<2 x i64> %t1, <2 x i64> %d)
  %t3 = icmp ne i32 %t2, 0
  %t4 = select i1 %t3, i32 %a, i32 %b
  ret i32 %t4
}

define i32 @ptestnzc_256_invert(<4 x i64> %c, <4 x i64> %d, i32 %a, i32 %b) {
; CHECK-LABEL: ptestnzc_256_invert:
; CHECK:       # %bb.0:
; CHECK-NEXT:    movl %edi, %eax
; CHECK-NEXT:    vxorps %xmm2, %xmm2, %xmm2
; CHECK-NEXT:    vcmptrueps %ymm2, %ymm2, %ymm2
; CHECK-NEXT:    vxorps %ymm2, %ymm0, %ymm0
; CHECK-NEXT:    vptest %ymm1, %ymm0
; CHECK-NEXT:    cmovbel %esi, %eax
; CHECK-NEXT:    vzeroupper
; CHECK-NEXT:    retq
  %t1 = xor <4 x i64> %c, <i64 -1, i64 -1, i64 -1, i64 -1>
  %t2 = call i32 @llvm.x86.avx.ptestnzc.256(<4 x i64> %t1, <4 x i64> %d)
  %t3 = icmp ne i32 %t2, 0
  %t4 = select i1 %t3, i32 %a, i32 %b
  ret i32 %t4
}

define zeroext i1 @PR38522(<16 x i8>* %x, <16 x i8>* %y) {
; CHECK-LABEL: PR38522:
; CHECK:       # %bb.0: # %start
; CHECK-NEXT:    vmovdqa (%rdi), %xmm0
; CHECK-NEXT:    vpcmpgtb (%rsi), %xmm0, %xmm0
; CHECK-NEXT:    vpcmpeqd %xmm1, %xmm1, %xmm1
; CHECK-NEXT:    vpxor %xmm1, %xmm0, %xmm0
; CHECK-NEXT:    vptest %xmm1, %xmm0
; CHECK-NEXT:    setb %al
; CHECK-NEXT:    retq
start:
  %0 = load <16 x i8>, <16 x i8>* %x, align 16
  %1 = load <16 x i8>, <16 x i8>* %y, align 16
  %2 = icmp sle <16 x i8> %0, %1
  %3 = sext <16 x i1> %2 to <16 x i8>
  %4 = bitcast <16 x i8> %3 to <2 x i64>
  %5 = tail call i32 @llvm.x86.sse41.ptestc(<2 x i64> %4, <2 x i64> <i64 -1, i64 -1>)
  %6 = icmp eq i32 %5, 1
  ret i1 %6
}

declare i32 @llvm.x86.sse41.ptestz(<2 x i64>, <2 x i64>) nounwind readnone
declare i32 @llvm.x86.sse41.ptestc(<2 x i64>, <2 x i64>) nounwind readnone
declare i32 @llvm.x86.sse41.ptestnzc(<2 x i64>, <2 x i64>) nounwind readnone

declare i32 @llvm.x86.avx.ptestz.256(<4 x i64>, <4 x i64>)
declare i32 @llvm.x86.avx.ptestc.256(<4 x i64>, <4 x i64>)
declare i32 @llvm.x86.avx.ptestnzc.256(<4 x i64>, <4 x i64>)
[X86][SSE] Add combine tests for PTEST/TESTPS/TESTPD instructions Including some test coverage for PR38522 2020-03-28 05:52:51 +08:00			`; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py`
			`; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s`

[X86][SSE] Add testnzc(~X,Y) -> testnzc(X,Y) test cases 2020-03-28 18:56:34 +08:00			`;`
[X86][SSE] Simplify PTEST/TESTP tests for D76984 We don't need to use an allones for the second operand - test the general case. 2020-03-31 22:17:11 +08:00			`; testz(~X,Y) -> testc(X,Y)`
[X86][SSE] Add testnzc(~X,Y) -> testnzc(X,Y) test cases 2020-03-28 18:56:34 +08:00			`;`

[X86][SSE] Simplify PTEST/TESTP tests for D76984 We don't need to use an allones for the second operand - test the general case. 2020-03-31 22:17:11 +08:00			`define i32 @ptestz_128_invert(<2 x i64> %c, <2 x i64> %d, i32 %a, i32 %b) {`
[X86][SSE] Add combine tests for PTEST/TESTPS/TESTPD instructions Including some test coverage for PR38522 2020-03-28 05:52:51 +08:00			`; CHECK-LABEL: ptestz_128_invert:`
			`; CHECK: # %bb.0:`
			`; CHECK-NEXT: movl %edi, %eax`
[X86][SSE] Simplify PTEST/TESTP tests for D76984 We don't need to use an allones for the second operand - test the general case. 2020-03-31 22:17:11 +08:00			`; CHECK-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2`
			`; CHECK-NEXT: vpxor %xmm2, %xmm0, %xmm0`
[X86][SSE] Add combine tests for PTEST/TESTPS/TESTPD instructions Including some test coverage for PR38522 2020-03-28 05:52:51 +08:00			`; CHECK-NEXT: vptest %xmm1, %xmm0`
			`; CHECK-NEXT: cmovnel %esi, %eax`
			`; CHECK-NEXT: retq`
			`%t1 = xor <2 x i64> %c, <i64 -1, i64 -1>`
[X86][SSE] Simplify PTEST/TESTP tests for D76984 We don't need to use an allones for the second operand - test the general case. 2020-03-31 22:17:11 +08:00			`%t2 = call i32 @llvm.x86.sse41.ptestz(<2 x i64> %t1, <2 x i64> %d)`
[X86][SSE] Add combine tests for PTEST/TESTPS/TESTPD instructions Including some test coverage for PR38522 2020-03-28 05:52:51 +08:00			`%t3 = icmp ne i32 %t2, 0`
			`%t4 = select i1 %t3, i32 %a, i32 %b`
			`ret i32 %t4`
			`}`

[X86][SSE] Simplify PTEST/TESTP tests for D76984 We don't need to use an allones for the second operand - test the general case. 2020-03-31 22:17:11 +08:00			`define i32 @ptestz_256_invert(<4 x i64> %c, <4 x i64> %d, i32 %a, i32 %b) {`
[X86][SSE] Add combine tests for PTEST/TESTPS/TESTPD instructions Including some test coverage for PR38522 2020-03-28 05:52:51 +08:00			`; CHECK-LABEL: ptestz_256_invert:`
			`; CHECK: # %bb.0:`
			`; CHECK-NEXT: movl %edi, %eax`
[X86][SSE] Simplify PTEST/TESTP tests for D76984 We don't need to use an allones for the second operand - test the general case. 2020-03-31 22:17:11 +08:00			`; CHECK-NEXT: vxorps %xmm2, %xmm2, %xmm2`
			`; CHECK-NEXT: vcmptrueps %ymm2, %ymm2, %ymm2`
			`; CHECK-NEXT: vxorps %ymm2, %ymm0, %ymm0`
[X86][SSE] Add combine tests for PTEST/TESTPS/TESTPD instructions Including some test coverage for PR38522 2020-03-28 05:52:51 +08:00			`; CHECK-NEXT: vptest %ymm1, %ymm0`
			`; CHECK-NEXT: cmovnel %esi, %eax`
			`; CHECK-NEXT: vzeroupper`
			`; CHECK-NEXT: retq`
			`%t1 = xor <4 x i64> %c, <i64 -1, i64 -1, i64 -1, i64 -1>`
[X86][SSE] Simplify PTEST/TESTP tests for D76984 We don't need to use an allones for the second operand - test the general case. 2020-03-31 22:17:11 +08:00			`%t2 = call i32 @llvm.x86.avx.ptestz.256(<4 x i64> %t1, <4 x i64> %d)`
[X86][SSE] Add combine tests for PTEST/TESTPS/TESTPD instructions Including some test coverage for PR38522 2020-03-28 05:52:51 +08:00			`%t3 = icmp ne i32 %t2, 0`
			`%t4 = select i1 %t3, i32 %a, i32 %b`
			`ret i32 %t4`
			`}`

[X86][SSE] Add testnzc(~X,Y) -> testnzc(X,Y) test cases 2020-03-28 18:56:34 +08:00			`;`
[X86][SSE] Simplify PTEST/TESTP tests for D76984 We don't need to use an allones for the second operand - test the general case. 2020-03-31 22:17:11 +08:00			`; testc(~X,Y) -> testz(X,Y)`
[X86][SSE] Add testnzc(~X,Y) -> testnzc(X,Y) test cases 2020-03-28 18:56:34 +08:00			`;`

[X86][SSE] Simplify PTEST/TESTP tests for D76984 We don't need to use an allones for the second operand - test the general case. 2020-03-31 22:17:11 +08:00			`define i32 @ptestc_128_invert(<2 x i64> %c, <2 x i64> %d, i32 %a, i32 %b) {`
[X86][SSE] Add combine tests for PTEST/TESTPS/TESTPD instructions Including some test coverage for PR38522 2020-03-28 05:52:51 +08:00			`; CHECK-LABEL: ptestc_128_invert:`
			`; CHECK: # %bb.0:`
			`; CHECK-NEXT: movl %edi, %eax`
[X86][SSE] Simplify PTEST/TESTP tests for D76984 We don't need to use an allones for the second operand - test the general case. 2020-03-31 22:17:11 +08:00			`; CHECK-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2`
			`; CHECK-NEXT: vpxor %xmm2, %xmm0, %xmm0`
[X86][SSE] Add combine tests for PTEST/TESTPS/TESTPD instructions Including some test coverage for PR38522 2020-03-28 05:52:51 +08:00			`; CHECK-NEXT: vptest %xmm1, %xmm0`
			`; CHECK-NEXT: cmovael %esi, %eax`
			`; CHECK-NEXT: retq`
			`%t1 = xor <2 x i64> %c, <i64 -1, i64 -1>`
[X86][SSE] Simplify PTEST/TESTP tests for D76984 We don't need to use an allones for the second operand - test the general case. 2020-03-31 22:17:11 +08:00			`%t2 = call i32 @llvm.x86.sse41.ptestc(<2 x i64> %t1, <2 x i64> %d)`
[X86][SSE] Add combine tests for PTEST/TESTPS/TESTPD instructions Including some test coverage for PR38522 2020-03-28 05:52:51 +08:00			`%t3 = icmp ne i32 %t2, 0`
			`%t4 = select i1 %t3, i32 %a, i32 %b`
			`ret i32 %t4`
			`}`

[X86][SSE] Simplify PTEST/TESTP tests for D76984 We don't need to use an allones for the second operand - test the general case. 2020-03-31 22:17:11 +08:00			`define i32 @ptestc_256_invert(<4 x i64> %c, <4 x i64> %d, i32 %a, i32 %b) {`
[X86][SSE] Add combine tests for PTEST/TESTPS/TESTPD instructions Including some test coverage for PR38522 2020-03-28 05:52:51 +08:00			`; CHECK-LABEL: ptestc_256_invert:`
			`; CHECK: # %bb.0:`
			`; CHECK-NEXT: movl %edi, %eax`
[X86][SSE] Simplify PTEST/TESTP tests for D76984 We don't need to use an allones for the second operand - test the general case. 2020-03-31 22:17:11 +08:00			`; CHECK-NEXT: vxorps %xmm2, %xmm2, %xmm2`
			`; CHECK-NEXT: vcmptrueps %ymm2, %ymm2, %ymm2`
			`; CHECK-NEXT: vxorps %ymm2, %ymm0, %ymm0`
[X86][SSE] Add combine tests for PTEST/TESTPS/TESTPD instructions Including some test coverage for PR38522 2020-03-28 05:52:51 +08:00			`; CHECK-NEXT: vptest %ymm1, %ymm0`
			`; CHECK-NEXT: cmovael %esi, %eax`
			`; CHECK-NEXT: vzeroupper`
			`; CHECK-NEXT: retq`
			`%t1 = xor <4 x i64> %c, <i64 -1, i64 -1, i64 -1, i64 -1>`
[X86][SSE] Simplify PTEST/TESTP tests for D76984 We don't need to use an allones for the second operand - test the general case. 2020-03-31 22:17:11 +08:00			`%t2 = call i32 @llvm.x86.avx.ptestc.256(<4 x i64> %t1, <4 x i64> %d)`
[X86][SSE] Add combine tests for PTEST/TESTPS/TESTPD instructions Including some test coverage for PR38522 2020-03-28 05:52:51 +08:00			`%t3 = icmp ne i32 %t2, 0`
			`%t4 = select i1 %t3, i32 %a, i32 %b`
			`ret i32 %t4`
			`}`

[X86][SSE] Add testnzc(~X,Y) -> testnzc(X,Y) test cases 2020-03-28 18:56:34 +08:00			`;`
			`; testnzc(~X,Y) -> testnzc(X,Y)`
			`;`

[X86][SSE] Simplify PTEST/TESTP tests for D76984 We don't need to use an allones for the second operand - test the general case. 2020-03-31 22:17:11 +08:00			`define i32 @ptestnzc_128_invert(<2 x i64> %c, <2 x i64> %d, i32 %a, i32 %b) {`
			`; CHECK-LABEL: ptestnzc_128_invert:`
[X86][SSE] Add testnzc(~X,Y) -> testnzc(X,Y) test cases 2020-03-28 18:56:34 +08:00			`; CHECK: # %bb.0:`
			`; CHECK-NEXT: movl %edi, %eax`
			`; CHECK-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2`
			`; CHECK-NEXT: vpxor %xmm2, %xmm0, %xmm0`
			`; CHECK-NEXT: vptest %xmm1, %xmm0`
			`; CHECK-NEXT: cmovael %esi, %eax`
			`; CHECK-NEXT: retq`
			`%t1 = xor <2 x i64> %c, <i64 -1, i64 -1>`
			`%t2 = call i32 @llvm.x86.sse41.ptestc(<2 x i64> %t1, <2 x i64> %d)`
			`%t3 = icmp ne i32 %t2, 0`
			`%t4 = select i1 %t3, i32 %a, i32 %b`
			`ret i32 %t4`
			`}`

[X86][SSE] Simplify PTEST/TESTP tests for D76984 We don't need to use an allones for the second operand - test the general case. 2020-03-31 22:17:11 +08:00			`define i32 @ptestnzc_256_invert(<4 x i64> %c, <4 x i64> %d, i32 %a, i32 %b) {`
			`; CHECK-LABEL: ptestnzc_256_invert:`
[X86][SSE] Add testnzc(~X,Y) -> testnzc(X,Y) test cases 2020-03-28 18:56:34 +08:00			`; CHECK: # %bb.0:`
			`; CHECK-NEXT: movl %edi, %eax`
			`; CHECK-NEXT: vxorps %xmm2, %xmm2, %xmm2`
			`; CHECK-NEXT: vcmptrueps %ymm2, %ymm2, %ymm2`
			`; CHECK-NEXT: vxorps %ymm2, %ymm0, %ymm0`
			`; CHECK-NEXT: vptest %ymm1, %ymm0`
			`; CHECK-NEXT: cmovbel %esi, %eax`
			`; CHECK-NEXT: vzeroupper`
			`; CHECK-NEXT: retq`
			`%t1 = xor <4 x i64> %c, <i64 -1, i64 -1, i64 -1, i64 -1>`
			`%t2 = call i32 @llvm.x86.avx.ptestnzc.256(<4 x i64> %t1, <4 x i64> %d)`
			`%t3 = icmp ne i32 %t2, 0`
			`%t4 = select i1 %t3, i32 %a, i32 %b`
			`ret i32 %t4`
			`}`

[X86][SSE] Add original PR38522 test case 2020-03-28 06:42:58 +08:00			`define zeroext i1 @PR38522(<16 x i8>* %x, <16 x i8>* %y) {`
			`; CHECK-LABEL: PR38522:`
			`; CHECK: # %bb.0: # %start`
			`; CHECK-NEXT: vmovdqa (%rdi), %xmm0`
			`; CHECK-NEXT: vpcmpgtb (%rsi), %xmm0, %xmm0`
			`; CHECK-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1`
			`; CHECK-NEXT: vpxor %xmm1, %xmm0, %xmm0`
			`; CHECK-NEXT: vptest %xmm1, %xmm0`
			`; CHECK-NEXT: setb %al`
			`; CHECK-NEXT: retq`
			`start:`
			`%0 = load <16 x i8>, <16 x i8>* %x, align 16`
			`%1 = load <16 x i8>, <16 x i8>* %y, align 16`
			`%2 = icmp sle <16 x i8> %0, %1`
			`%3 = sext <16 x i1> %2 to <16 x i8>`
			`%4 = bitcast <16 x i8> %3 to <2 x i64>`
			`%5 = tail call i32 @llvm.x86.sse41.ptestc(<2 x i64> %4, <2 x i64> <i64 -1, i64 -1>)`
			`%6 = icmp eq i32 %5, 1`
			`ret i1 %6`
			`}`

[X86][SSE] Add combine tests for PTEST/TESTPS/TESTPD instructions Including some test coverage for PR38522 2020-03-28 05:52:51 +08:00			`declare i32 @llvm.x86.sse41.ptestz(<2 x i64>, <2 x i64>) nounwind readnone`
			`declare i32 @llvm.x86.sse41.ptestc(<2 x i64>, <2 x i64>) nounwind readnone`
			`declare i32 @llvm.x86.sse41.ptestnzc(<2 x i64>, <2 x i64>) nounwind readnone`

			`declare i32 @llvm.x86.avx.ptestz.256(<4 x i64>, <4 x i64>)`
			`declare i32 @llvm.x86.avx.ptestc.256(<4 x i64>, <4 x i64>)`
			`declare i32 @llvm.x86.avx.ptestnzc.256(<4 x i64>, <4 x i64>)`