llvm-project/llvm/test/CodeGen/SystemZ/knownbits-intrinsics-unpack.ll

; Test that DAGCombiner gets helped by computeKnownBitsForTargetNode() with
; vector intrinsics.
;
; RUN: llc -mtriple=s390x-linux-gnu -mcpu=z13 < %s  | FileCheck %s

declare <8 x i16> @llvm.s390.vuphb(<16 x i8>)
declare <8 x i16> @llvm.s390.vuplhb(<16 x i8>)

; VUPHB (used operand elements are 0)
define <8 x i16> @f0() {
; CHECK-LABEL: f0:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  vgbm %v24, 0
; CHECK-NEXT:  br %r14
  %unp = call <8 x i16> @llvm.s390.vuphb(<16 x i8>
                                         <i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0,
                                          i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>)
  %and = and <8 x i16> %unp, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>
  ret <8 x i16> %and
}

; VUPHB (used operand elements are 1)
; NOTE: The AND is optimized away, but instead of replicating '1' into <8 x
; i16>, the original vector constant is put in the constant pool and then
; unpacked (repeated in more test cases below).
define <8 x i16> @f1() {
; CHECK-LABEL: f1:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  larl %r1, .LCPI
; CHECK-NEXT:  vl %v0, 0(%r1)
; CHECK-NEXT:  vuphb %v24, %v0
; CHECK-NEXT:  br %r14
  %unp = call <8 x i16> @llvm.s390.vuphb(<16 x i8>
                                         <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1,
                                          i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0>)
  %and = and <8 x i16> %unp, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>
  ret <8 x i16> %and
}

; VUPLHB (used operand elements are 0)
define <8 x i16> @f2() {
; CHECK-LABEL: f2:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  vgbm %v24, 0
; CHECK-NEXT:  br %r14
  %unp = call <8 x i16> @llvm.s390.vuplhb(<16 x i8>
                                          <i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0,
                                           i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>)
  %and = and <8 x i16> %unp, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>
  ret <8 x i16> %and
}

; VUPLHB (used operand elements are 1)
define <8 x i16> @f3() {
; CHECK-LABEL: f3:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  larl %r1, .LCPI
; CHECK-NEXT:  vl %v0, 0(%r1)
; CHECK-NEXT:  vuplhb %v24, %v0
; CHECK-NEXT:  br %r14
  %unp = call <8 x i16> @llvm.s390.vuplhb(<16 x i8>
                                          <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1,
                                           i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0>)
  %and = and <8 x i16> %unp, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>
  ret <8 x i16> %and
}

declare <4 x i32> @llvm.s390.vuphh(<8 x i16>)
declare <4 x i32> @llvm.s390.vuplhh(<8 x i16>)

; VUPHH (used operand elements are 0)
define <4 x i32> @f4() {
; CHECK-LABEL: f4:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  vgbm %v24, 0
; CHECK-NEXT:  br %r14
  %unp = call <4 x i32> @llvm.s390.vuphh(<8 x i16>
                                         <i16 0, i16 0, i16 0, i16 0,
                                          i16 1, i16 1, i16 1, i16 1>)
  %and = and <4 x i32> %unp, <i32 1, i32 1, i32 1, i32 1>
  ret <4 x i32> %and
}

; VUPHH (used operand elements are 1)
define <4 x i32> @f5() {
; CHECK-LABEL: f5:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  larl %r1, .LCPI
; CHECK-NEXT:  vl %v0, 0(%r1)
; CHECK-NEXT:  vuphh %v24, %v0
; CHECK-NEXT:  br %r14
  %unp = call <4 x i32> @llvm.s390.vuphh(<8 x i16>
                                         <i16 1, i16 1, i16 1, i16 1,
                                          i16 0, i16 0, i16 0, i16 0>)
  %and = and <4 x i32> %unp, <i32 1, i32 1, i32 1, i32 1>
  ret <4 x i32> %and
}

; VUPLHH (used operand elements are 0)
define <4 x i32> @f6() {
; CHECK-LABEL: f6:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  vgbm %v24, 0
; CHECK-NEXT:  br %r14
  %unp = call <4 x i32> @llvm.s390.vuplhh(<8 x i16>
                                          <i16 0, i16 0, i16 0, i16 0,
                                           i16 1, i16 1, i16 1, i16 1>)
  %and = and <4 x i32> %unp, <i32 1, i32 1, i32 1, i32 1>
  ret <4 x i32> %and
}

; VUPLHH (used operand elements are 1)
define <4 x i32> @f7() {
; CHECK-LABEL: f7:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  larl %r1, .LCPI
; CHECK-NEXT:  vl %v0, 0(%r1)
; CHECK-NEXT:  vuplhh %v24, %v0
; CHECK-NEXT:  br %r14
  %unp = call <4 x i32> @llvm.s390.vuplhh(<8 x i16>
                                          <i16 1, i16 1, i16 1, i16 1,
                                           i16 0, i16 0, i16 0, i16 0>)
  %and = and <4 x i32> %unp, <i32 1, i32 1, i32 1, i32 1>
  ret <4 x i32> %and
}

declare <2 x i64> @llvm.s390.vuphf(<4 x i32>)
declare <2 x i64> @llvm.s390.vuplhf(<4 x i32>)

; VUPHF (used operand elements are 0)
define <2 x i64> @f8() {
; CHECK-LABEL: f8:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  vgbm %v24, 0
; CHECK-NEXT:  br %r14
  %unp = call <2 x i64> @llvm.s390.vuphf(<4 x i32> <i32 0, i32 0, i32 1, i32 1>)
  %and = and <2 x i64> %unp, <i64 1, i64 1>
  ret <2 x i64> %and
}

; VUPHF (used operand elements are 1)
define <2 x i64> @f9() {
; CHECK-LABEL: f9:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  larl %r1, .LCPI
; CHECK-NEXT:  vl %v0, 0(%r1)
; CHECK-NEXT:  vuphf %v24, %v0
; CHECK-NEXT:  br %r14
  %unp = call <2 x i64> @llvm.s390.vuphf(<4 x i32> <i32 1, i32 1, i32 0, i32 0>)
  %and = and <2 x i64> %unp, <i64 1, i64 1>
  ret <2 x i64> %and
}

; VUPLHF (used operand elements are 0)
define <2 x i64> @f10() {
; CHECK-LABEL: f10:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  vgbm %v24, 0
; CHECK-NEXT:  br %r14
  %unp = call <2 x i64> @llvm.s390.vuplhf(<4 x i32> <i32 0, i32 0, i32 1, i32 1>)
  %and = and <2 x i64> %unp, <i64 1, i64 1>
  ret <2 x i64> %and
}

; VUPLHF (used operand elements are 1)
define <2 x i64> @f11() {
; CHECK-LABEL: f11:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  larl %r1, .LCPI
; CHECK-NEXT:  vl %v0, 0(%r1)
; CHECK-NEXT:  vuplhf %v24, %v0
; CHECK-NEXT:  br %r14
  %unp = call <2 x i64> @llvm.s390.vuplhf(<4 x i32> <i32 1, i32 1, i32 0, i32 0>)
  %and = and <2 x i64> %unp, <i64 1, i64 1>
  ret <2 x i64> %and
}

declare <8 x i16> @llvm.s390.vuplb(<16 x i8>)
declare <8 x i16> @llvm.s390.vupllb(<16 x i8>)

; VUPLB (used operand elements are 0)
define <8 x i16> @f12() {
; CHECK-LABEL: f12:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  vgbm %v24, 0
; CHECK-NEXT:  br %r14
  %unp = call <8 x i16> @llvm.s390.vuplb(<16 x i8>
                                         <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1,
                                          i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0>)

  %and = and <8 x i16> %unp, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>
  ret <8 x i16> %and
}

; VUPLB (used operand elements are 1)
define <8 x i16> @f13() {
; CHECK-LABEL: f13:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  larl %r1, .LCPI
; CHECK-NEXT:  vl %v0, 0(%r1)
; CHECK-NEXT:  vuplb %v24, %v0
; CHECK-NEXT:  br %r14
  %unp = call <8 x i16> @llvm.s390.vuplb(<16 x i8>
                                         <i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0,
                                          i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>)
  %and = and <8 x i16> %unp, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>
  ret <8 x i16> %and
}

; VUPLLB (used operand elements are 0)
define <8 x i16> @f14() {
; CHECK-LABEL: f14:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  vgbm %v24, 0
; CHECK-NEXT:  br %r14
  %unp = call <8 x i16> @llvm.s390.vupllb(<16 x i8>
                                         <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1,
                                          i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0>)
  %and = and <8 x i16> %unp, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>
  ret <8 x i16> %and
}

; VUPLLB (used operand elements are 1)
define <8 x i16> @f15() {
; CHECK-LABEL: f15:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  larl %r1, .LCPI
; CHECK-NEXT:  vl %v0, 0(%r1)
; CHECK-NEXT:  vupllb %v24, %v0
; CHECK-NEXT:  br %r14
  %unp = call <8 x i16> @llvm.s390.vupllb(<16 x i8>
                                         <i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0,
                                          i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>)
  %and = and <8 x i16> %unp, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>
  ret <8 x i16> %and
}

declare <4 x i32> @llvm.s390.vuplhw(<8 x i16>)
declare <4 x i32> @llvm.s390.vupllh(<8 x i16>)

; VUPLHW (used operand elements are 0)
define <4 x i32> @f16() {
; CHECK-LABEL: f16:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  vgbm %v24, 0
; CHECK-NEXT:  br %r14
  %unp = call <4 x i32> @llvm.s390.vuplhw(<8 x i16>
                                          <i16 1, i16 1, i16 1, i16 1,
                                           i16 0, i16 0, i16 0, i16 0>)

  %and = and <4 x i32> %unp, <i32 1, i32 1, i32 1, i32 1>
  ret <4 x i32> %and
}

; VUPLHW (used operand elements are 1)
define <4 x i32> @f17() {
; CHECK-LABEL: f17:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  larl %r1, .LCPI
; CHECK-NEXT:  vl %v0, 0(%r1)
; CHECK-NEXT:  vuplhw %v24, %v0
; CHECK-NEXT:  br %r14
  %unp = call <4 x i32> @llvm.s390.vuplhw(<8 x i16>
                                          <i16 0, i16 0, i16 0, i16 0,
                                           i16 1, i16 1, i16 1, i16 1>)
  %and = and <4 x i32> %unp, <i32 1, i32 1, i32 1, i32 1>
  ret <4 x i32> %and
}

; VUPLLH (used operand elements are 0)
define <4 x i32> @f18() {
; CHECK-LABEL: f18:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  vgbm %v24, 0
; CHECK-NEXT:  br %r14
  %unp = call <4 x i32> @llvm.s390.vupllh(<8 x i16>
                                          <i16 1, i16 1, i16 1, i16 1,
                                           i16 0, i16 0, i16 0, i16 0>)
  %and = and <4 x i32> %unp, <i32 1, i32 1, i32 1, i32 1>
  ret <4 x i32> %and
}

; VUPLLH (used operand elements are 1)
define <4 x i32> @f19() {
; CHECK-LABEL: f19:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  larl %r1, .LCPI
; CHECK-NEXT:  vl %v0, 0(%r1)
; CHECK-NEXT:  vupllh %v24, %v0
; CHECK-NEXT:  br %r14
  %unp = call <4 x i32> @llvm.s390.vupllh(<8 x i16>
                                          <i16 0, i16 0, i16 0, i16 0,
                                           i16 1, i16 1, i16 1, i16 1>)
  %and = and <4 x i32> %unp, <i32 1, i32 1, i32 1, i32 1>
  ret <4 x i32> %and
}

declare <2 x i64> @llvm.s390.vuplf(<4 x i32>)
declare <2 x i64> @llvm.s390.vupllf(<4 x i32>)

; VUPLF (used operand elements are 0)
define <2 x i64> @f20() {
; CHECK-LABEL: f20:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  vgbm %v24, 0
; CHECK-NEXT:  br %r14
  %unp = call <2 x i64> @llvm.s390.vuplf(<4 x i32> <i32 1, i32 1, i32 0, i32 0>)
  %and = and <2 x i64> %unp, <i64 1, i64 1>
  ret <2 x i64> %and
}

; VUPLF (used operand elements are 1)
define <2 x i64> @f21() {
; CHECK-LABEL: f21:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  larl %r1, .LCPI
; CHECK-NEXT:  vl %v0, 0(%r1)
; CHECK-NEXT:  vuplf %v24, %v0
; CHECK-NEXT:  br %r14
  %unp = call <2 x i64> @llvm.s390.vuplf(<4 x i32> <i32 0, i32 0, i32 1, i32 1>)
  %and = and <2 x i64> %unp, <i64 1, i64 1>
  ret <2 x i64> %and
}

; VUPLLF (used operand elements are 0)
define <2 x i64> @f22() {
; CHECK-LABEL: f22:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  vgbm %v24, 0
; CHECK-NEXT:  br %r14
  %unp = call <2 x i64> @llvm.s390.vupllf(<4 x i32> <i32 1, i32 1, i32 0, i32 0>)
  %and = and <2 x i64> %unp, <i64 1, i64 1>
  ret <2 x i64> %and
}

; VUPLLF (used operand elements are 1)
define <2 x i64> @f23() {
; CHECK-LABEL: f23:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  larl %r1, .LCPI
; CHECK-NEXT:  vl %v0, 0(%r1)
; CHECK-NEXT:  vupllf %v24, %v0
; CHECK-NEXT:  br %r14
  %unp = call <2 x i64> @llvm.s390.vupllf(<4 x i32> <i32 0, i32 0, i32 1, i32 1>)
  %and = and <2 x i64> %unp, <i64 1, i64 1>
  ret <2 x i64> %and
}

; Test that signed unpacking of positive elements gives known zeros in high part.
define <2 x i64> @f24() {
; CHECK-LABEL: f24:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  vgbm %v24, 0
; CHECK-NEXT:  br %r14
  %unp = call <2 x i64> @llvm.s390.vuphf(<4 x i32> <i32 1, i32 1, i32 0, i32 0>)
  %and = and <2 x i64> %unp, <i64 -4294967296, ; = 0xffffffff00000000
                              i64 -4294967296>
  ret <2 x i64> %and
}

; Test that signed unpacking of negative elements gives known ones in high part.
define <2 x i64> @f25() {
; CHECK-LABEL: f25:
; CHECK-LABEL: # %bb.0:
;                         61680 = 0xf0f0
; CHECK-NEXT:  vgbm %v24, 61680
; CHECK-NEXT:  br %r14
  %unp = call <2 x i64> @llvm.s390.vuphf(<4 x i32> <i32 -1, i32 -1, i32 0, i32 0>)
  %and = and <2 x i64> %unp, <i64 -4294967296, ; = 0xffffffff00000000
                              i64 -4294967296>
  ret <2 x i64> %and
}

; Test that logical unpacking of negative elements gives known zeros in high part.
define <2 x i64> @f26() {
; CHECK-LABEL: f26:
; CHECK-LABEL: # %bb.0:
; CHECK-NEXT:  vgbm %v24, 0
; CHECK-NEXT:  br %r14
  %unp = call <2 x i64> @llvm.s390.vuplhf(<4 x i32> <i32 -1, i32 -1, i32 0, i32 0>)
  %and = and <2 x i64> %unp, <i64 -4294967296, ; = 0xffffffff00000000
                              i64 -4294967296>
  ret <2 x i64> %and
}
[SystemZ] computeKnownBitsForTargetNode() / ComputeNumSignBitsForTargetNode() Improve/implement these methods to improve DAG combining. This mainly concerns intrinsics. Some constant operands to SystemZISD nodes have been marked Opaque to avoid transforming back and forth between generic and target nodes infinitely. Review: Ulrich Weigand llvm-svn: 327765 2018-03-17 16:32:12 +08:00			`; Test that DAGCombiner gets helped by computeKnownBitsForTargetNode() with`
			`; vector intrinsics.`
			`;`
			`; RUN: llc -mtriple=s390x-linux-gnu -mcpu=z13 < %s \| FileCheck %s`

			`declare <8 x i16> @llvm.s390.vuphb(<16 x i8>)`
			`declare <8 x i16> @llvm.s390.vuplhb(<16 x i8>)`

			`; VUPHB (used operand elements are 0)`
			`define <8 x i16> @f0() {`
			`; CHECK-LABEL: f0:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: vgbm %v24, 0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <8 x i16> @llvm.s390.vuphb(<16 x i8>`
			`<i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0,`
			`i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>)`
			`%and = and <8 x i16> %unp, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>`
			`ret <8 x i16> %and`
			`}`

			`; VUPHB (used operand elements are 1)`
			`; NOTE: The AND is optimized away, but instead of replicating '1' into <8 x`
			`; i16>, the original vector constant is put in the constant pool and then`
			`; unpacked (repeated in more test cases below).`
			`define <8 x i16> @f1() {`
			`; CHECK-LABEL: f1:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: larl %r1, .LCPI`
			`; CHECK-NEXT: vl %v0, 0(%r1)`
			`; CHECK-NEXT: vuphb %v24, %v0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <8 x i16> @llvm.s390.vuphb(<16 x i8>`
			`<i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1,`
			`i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0>)`
			`%and = and <8 x i16> %unp, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>`
			`ret <8 x i16> %and`
			`}`

			`; VUPLHB (used operand elements are 0)`
			`define <8 x i16> @f2() {`
			`; CHECK-LABEL: f2:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: vgbm %v24, 0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <8 x i16> @llvm.s390.vuplhb(<16 x i8>`
			`<i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0,`
			`i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>)`
			`%and = and <8 x i16> %unp, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>`
			`ret <8 x i16> %and`
			`}`

			`; VUPLHB (used operand elements are 1)`
			`define <8 x i16> @f3() {`
			`; CHECK-LABEL: f3:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: larl %r1, .LCPI`
			`; CHECK-NEXT: vl %v0, 0(%r1)`
			`; CHECK-NEXT: vuplhb %v24, %v0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <8 x i16> @llvm.s390.vuplhb(<16 x i8>`
			`<i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1,`
			`i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0>)`
			`%and = and <8 x i16> %unp, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>`
			`ret <8 x i16> %and`
			`}`

			`declare <4 x i32> @llvm.s390.vuphh(<8 x i16>)`
			`declare <4 x i32> @llvm.s390.vuplhh(<8 x i16>)`

			`; VUPHH (used operand elements are 0)`
			`define <4 x i32> @f4() {`
			`; CHECK-LABEL: f4:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: vgbm %v24, 0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <4 x i32> @llvm.s390.vuphh(<8 x i16>`
			`<i16 0, i16 0, i16 0, i16 0,`
			`i16 1, i16 1, i16 1, i16 1>)`
			`%and = and <4 x i32> %unp, <i32 1, i32 1, i32 1, i32 1>`
			`ret <4 x i32> %and`
			`}`

			`; VUPHH (used operand elements are 1)`
			`define <4 x i32> @f5() {`
			`; CHECK-LABEL: f5:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: larl %r1, .LCPI`
			`; CHECK-NEXT: vl %v0, 0(%r1)`
			`; CHECK-NEXT: vuphh %v24, %v0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <4 x i32> @llvm.s390.vuphh(<8 x i16>`
			`<i16 1, i16 1, i16 1, i16 1,`
			`i16 0, i16 0, i16 0, i16 0>)`
			`%and = and <4 x i32> %unp, <i32 1, i32 1, i32 1, i32 1>`
			`ret <4 x i32> %and`
			`}`

			`; VUPLHH (used operand elements are 0)`
			`define <4 x i32> @f6() {`
			`; CHECK-LABEL: f6:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: vgbm %v24, 0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <4 x i32> @llvm.s390.vuplhh(<8 x i16>`
			`<i16 0, i16 0, i16 0, i16 0,`
			`i16 1, i16 1, i16 1, i16 1>)`
			`%and = and <4 x i32> %unp, <i32 1, i32 1, i32 1, i32 1>`
			`ret <4 x i32> %and`
			`}`

			`; VUPLHH (used operand elements are 1)`
			`define <4 x i32> @f7() {`
			`; CHECK-LABEL: f7:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: larl %r1, .LCPI`
			`; CHECK-NEXT: vl %v0, 0(%r1)`
			`; CHECK-NEXT: vuplhh %v24, %v0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <4 x i32> @llvm.s390.vuplhh(<8 x i16>`
			`<i16 1, i16 1, i16 1, i16 1,`
			`i16 0, i16 0, i16 0, i16 0>)`
			`%and = and <4 x i32> %unp, <i32 1, i32 1, i32 1, i32 1>`
			`ret <4 x i32> %and`
			`}`

			`declare <2 x i64> @llvm.s390.vuphf(<4 x i32>)`
			`declare <2 x i64> @llvm.s390.vuplhf(<4 x i32>)`

			`; VUPHF (used operand elements are 0)`
			`define <2 x i64> @f8() {`
			`; CHECK-LABEL: f8:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: vgbm %v24, 0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <2 x i64> @llvm.s390.vuphf(<4 x i32> <i32 0, i32 0, i32 1, i32 1>)`
			`%and = and <2 x i64> %unp, <i64 1, i64 1>`
			`ret <2 x i64> %and`
			`}`

			`; VUPHF (used operand elements are 1)`
			`define <2 x i64> @f9() {`
			`; CHECK-LABEL: f9:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: larl %r1, .LCPI`
			`; CHECK-NEXT: vl %v0, 0(%r1)`
			`; CHECK-NEXT: vuphf %v24, %v0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <2 x i64> @llvm.s390.vuphf(<4 x i32> <i32 1, i32 1, i32 0, i32 0>)`
			`%and = and <2 x i64> %unp, <i64 1, i64 1>`
			`ret <2 x i64> %and`
			`}`

			`; VUPLHF (used operand elements are 0)`
			`define <2 x i64> @f10() {`
			`; CHECK-LABEL: f10:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: vgbm %v24, 0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <2 x i64> @llvm.s390.vuplhf(<4 x i32> <i32 0, i32 0, i32 1, i32 1>)`
			`%and = and <2 x i64> %unp, <i64 1, i64 1>`
			`ret <2 x i64> %and`
			`}`

			`; VUPLHF (used operand elements are 1)`
			`define <2 x i64> @f11() {`
			`; CHECK-LABEL: f11:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: larl %r1, .LCPI`
			`; CHECK-NEXT: vl %v0, 0(%r1)`
			`; CHECK-NEXT: vuplhf %v24, %v0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <2 x i64> @llvm.s390.vuplhf(<4 x i32> <i32 1, i32 1, i32 0, i32 0>)`
			`%and = and <2 x i64> %unp, <i64 1, i64 1>`
			`ret <2 x i64> %and`
			`}`

			`declare <8 x i16> @llvm.s390.vuplb(<16 x i8>)`
			`declare <8 x i16> @llvm.s390.vupllb(<16 x i8>)`

			`; VUPLB (used operand elements are 0)`
			`define <8 x i16> @f12() {`
			`; CHECK-LABEL: f12:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: vgbm %v24, 0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <8 x i16> @llvm.s390.vuplb(<16 x i8>`
			`<i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1,`
			`i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0>)`

			`%and = and <8 x i16> %unp, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>`
			`ret <8 x i16> %and`
			`}`

			`; VUPLB (used operand elements are 1)`
			`define <8 x i16> @f13() {`
			`; CHECK-LABEL: f13:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: larl %r1, .LCPI`
			`; CHECK-NEXT: vl %v0, 0(%r1)`
			`; CHECK-NEXT: vuplb %v24, %v0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <8 x i16> @llvm.s390.vuplb(<16 x i8>`
			`<i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0,`
			`i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>)`
			`%and = and <8 x i16> %unp, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>`
			`ret <8 x i16> %and`
			`}`

			`; VUPLLB (used operand elements are 0)`
			`define <8 x i16> @f14() {`
			`; CHECK-LABEL: f14:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: vgbm %v24, 0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <8 x i16> @llvm.s390.vupllb(<16 x i8>`
			`<i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1,`
			`i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0>)`
			`%and = and <8 x i16> %unp, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>`
			`ret <8 x i16> %and`
			`}`

			`; VUPLLB (used operand elements are 1)`
			`define <8 x i16> @f15() {`
			`; CHECK-LABEL: f15:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: larl %r1, .LCPI`
			`; CHECK-NEXT: vl %v0, 0(%r1)`
			`; CHECK-NEXT: vupllb %v24, %v0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <8 x i16> @llvm.s390.vupllb(<16 x i8>`
			`<i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0,`
			`i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>)`
			`%and = and <8 x i16> %unp, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>`
			`ret <8 x i16> %and`
			`}`

			`declare <4 x i32> @llvm.s390.vuplhw(<8 x i16>)`
			`declare <4 x i32> @llvm.s390.vupllh(<8 x i16>)`

			`; VUPLHW (used operand elements are 0)`
			`define <4 x i32> @f16() {`
			`; CHECK-LABEL: f16:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: vgbm %v24, 0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <4 x i32> @llvm.s390.vuplhw(<8 x i16>`
			`<i16 1, i16 1, i16 1, i16 1,`
			`i16 0, i16 0, i16 0, i16 0>)`

			`%and = and <4 x i32> %unp, <i32 1, i32 1, i32 1, i32 1>`
			`ret <4 x i32> %and`
			`}`

			`; VUPLHW (used operand elements are 1)`
			`define <4 x i32> @f17() {`
			`; CHECK-LABEL: f17:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: larl %r1, .LCPI`
			`; CHECK-NEXT: vl %v0, 0(%r1)`
			`; CHECK-NEXT: vuplhw %v24, %v0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <4 x i32> @llvm.s390.vuplhw(<8 x i16>`
			`<i16 0, i16 0, i16 0, i16 0,`
			`i16 1, i16 1, i16 1, i16 1>)`
			`%and = and <4 x i32> %unp, <i32 1, i32 1, i32 1, i32 1>`
			`ret <4 x i32> %and`
			`}`

			`; VUPLLH (used operand elements are 0)`
			`define <4 x i32> @f18() {`
			`; CHECK-LABEL: f18:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: vgbm %v24, 0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <4 x i32> @llvm.s390.vupllh(<8 x i16>`
			`<i16 1, i16 1, i16 1, i16 1,`
			`i16 0, i16 0, i16 0, i16 0>)`
			`%and = and <4 x i32> %unp, <i32 1, i32 1, i32 1, i32 1>`
			`ret <4 x i32> %and`
			`}`

			`; VUPLLH (used operand elements are 1)`
			`define <4 x i32> @f19() {`
			`; CHECK-LABEL: f19:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: larl %r1, .LCPI`
			`; CHECK-NEXT: vl %v0, 0(%r1)`
			`; CHECK-NEXT: vupllh %v24, %v0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <4 x i32> @llvm.s390.vupllh(<8 x i16>`
			`<i16 0, i16 0, i16 0, i16 0,`
			`i16 1, i16 1, i16 1, i16 1>)`
			`%and = and <4 x i32> %unp, <i32 1, i32 1, i32 1, i32 1>`
			`ret <4 x i32> %and`
			`}`

			`declare <2 x i64> @llvm.s390.vuplf(<4 x i32>)`
			`declare <2 x i64> @llvm.s390.vupllf(<4 x i32>)`

			`; VUPLF (used operand elements are 0)`
			`define <2 x i64> @f20() {`
			`; CHECK-LABEL: f20:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: vgbm %v24, 0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <2 x i64> @llvm.s390.vuplf(<4 x i32> <i32 1, i32 1, i32 0, i32 0>)`
			`%and = and <2 x i64> %unp, <i64 1, i64 1>`
			`ret <2 x i64> %and`
			`}`

			`; VUPLF (used operand elements are 1)`
			`define <2 x i64> @f21() {`
			`; CHECK-LABEL: f21:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: larl %r1, .LCPI`
			`; CHECK-NEXT: vl %v0, 0(%r1)`
			`; CHECK-NEXT: vuplf %v24, %v0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <2 x i64> @llvm.s390.vuplf(<4 x i32> <i32 0, i32 0, i32 1, i32 1>)`
			`%and = and <2 x i64> %unp, <i64 1, i64 1>`
			`ret <2 x i64> %and`
			`}`

			`; VUPLLF (used operand elements are 0)`
			`define <2 x i64> @f22() {`
			`; CHECK-LABEL: f22:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: vgbm %v24, 0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <2 x i64> @llvm.s390.vupllf(<4 x i32> <i32 1, i32 1, i32 0, i32 0>)`
			`%and = and <2 x i64> %unp, <i64 1, i64 1>`
			`ret <2 x i64> %and`
			`}`

			`; VUPLLF (used operand elements are 1)`
			`define <2 x i64> @f23() {`
			`; CHECK-LABEL: f23:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: larl %r1, .LCPI`
			`; CHECK-NEXT: vl %v0, 0(%r1)`
			`; CHECK-NEXT: vupllf %v24, %v0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <2 x i64> @llvm.s390.vupllf(<4 x i32> <i32 0, i32 0, i32 1, i32 1>)`
			`%and = and <2 x i64> %unp, <i64 1, i64 1>`
			`ret <2 x i64> %and`
			`}`

			`; Test that signed unpacking of positive elements gives known zeros in high part.`
			`define <2 x i64> @f24() {`
			`; CHECK-LABEL: f24:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: vgbm %v24, 0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <2 x i64> @llvm.s390.vuphf(<4 x i32> <i32 1, i32 1, i32 0, i32 0>)`
			`%and = and <2 x i64> %unp, <i64 -4294967296, ; = 0xffffffff00000000`
			`i64 -4294967296>`
			`ret <2 x i64> %and`
			`}`

			`; Test that signed unpacking of negative elements gives known ones in high part.`
			`define <2 x i64> @f25() {`
			`; CHECK-LABEL: f25:`
			`; CHECK-LABEL: # %bb.0:`
			`; 61680 = 0xf0f0`
			`; CHECK-NEXT: vgbm %v24, 61680`
			`; CHECK-NEXT: br %r14`
			`%unp = call <2 x i64> @llvm.s390.vuphf(<4 x i32> <i32 -1, i32 -1, i32 0, i32 0>)`
			`%and = and <2 x i64> %unp, <i64 -4294967296, ; = 0xffffffff00000000`
			`i64 -4294967296>`
			`ret <2 x i64> %and`
			`}`

			`; Test that logical unpacking of negative elements gives known zeros in high part.`
			`define <2 x i64> @f26() {`
			`; CHECK-LABEL: f26:`
			`; CHECK-LABEL: # %bb.0:`
			`; CHECK-NEXT: vgbm %v24, 0`
			`; CHECK-NEXT: br %r14`
			`%unp = call <2 x i64> @llvm.s390.vuplhf(<4 x i32> <i32 -1, i32 -1, i32 0, i32 0>)`
			`%and = and <2 x i64> %unp, <i64 -4294967296, ; = 0xffffffff00000000`
			`i64 -4294967296>`
			`ret <2 x i64> %and`
			`}`