llvm-project/llvm/test/CodeGen/X86/avx512-arith.ll

; RUN: llc < %s -mtriple=x86_64-apple-darwin -mcpu=knl --show-mc-encoding| FileCheck %s

; CHECK-LABEL: addpd512
; CHECK: vaddpd
; CHECK: ret
define <8 x double> @addpd512(<8 x double> %y, <8 x double> %x) {
entry:
  %add.i = fadd <8 x double> %x, %y
  ret <8 x double> %add.i
}

; CHECK-LABEL: addpd512fold
; CHECK: vaddpd LCP{{.*}}(%rip)
; CHECK: ret
define <8 x double> @addpd512fold(<8 x double> %y) {
entry:
  %add.i = fadd <8 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00, double 4.500000e+00, double 3.800000e+00, double 2.300000e+00, double 1.200000e+00>
  ret <8 x double> %add.i
}

; CHECK-LABEL: addps512
; CHECK: vaddps
; CHECK: ret
define <16 x float> @addps512(<16 x float> %y, <16 x float> %x) {
entry:
  %add.i = fadd <16 x float> %x, %y
  ret <16 x float> %add.i
}

; CHECK-LABEL: addps512fold
; CHECK: vaddps LCP{{.*}}(%rip)
; CHECK: ret
define <16 x float> @addps512fold(<16 x float> %y) {
entry:
  %add.i = fadd <16 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 4.500000e+00, float 4.500000e+00, float 0x400B333340000000,  float 0x4002666660000000, float 0x3FF3333340000000>
  ret <16 x float> %add.i
}

; CHECK-LABEL: subpd512
; CHECK: vsubpd
; CHECK: ret
define <8 x double> @subpd512(<8 x double> %y, <8 x double> %x) {
entry:
  %sub.i = fsub <8 x double> %x, %y
  ret <8 x double> %sub.i
}

; CHECK-LABEL: @subpd512fold
; CHECK: vsubpd (%
; CHECK: ret
define <8 x double> @subpd512fold(<8 x double> %y, <8 x double>* %x) {
entry:
  %tmp2 = load <8 x double>* %x, align 8
  %sub.i = fsub <8 x double> %y, %tmp2
  ret <8 x double> %sub.i
}

; CHECK-LABEL: @subps512
; CHECK: vsubps
; CHECK: ret
define <16 x float> @subps512(<16 x float> %y, <16 x float> %x) {
entry:
  %sub.i = fsub <16 x float> %x, %y
  ret <16 x float> %sub.i
}

; CHECK-LABEL: subps512fold
; CHECK: vsubps (%
; CHECK: ret
define <16 x float> @subps512fold(<16 x float> %y, <16 x float>* %x) {
entry:
  %tmp2 = load <16 x float>* %x, align 4
  %sub.i = fsub <16 x float> %y, %tmp2
  ret <16 x float> %sub.i
}

; CHECK-LABEL: imulq512
; CHECK: vpmuludq
; CHECK: vpmuludq
; CHECK: ret
define <8 x i64> @imulq512(<8 x i64> %y, <8 x i64> %x) {
  %z = mul <8 x i64>%x, %y
  ret <8 x i64>%z
}

; CHECK-LABEL: mulpd512
; CHECK: vmulpd
; CHECK: ret
define <8 x double> @mulpd512(<8 x double> %y, <8 x double> %x) {
entry:
  %mul.i = fmul <8 x double> %x, %y
  ret <8 x double> %mul.i
}

; CHECK-LABEL: mulpd512fold
; CHECK: vmulpd LCP{{.*}}(%rip)
; CHECK: ret
define <8 x double> @mulpd512fold(<8 x double> %y) {
entry:
  %mul.i = fmul <8 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00, double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00>
  ret <8 x double> %mul.i
}

; CHECK-LABEL: mulps512
; CHECK: vmulps
; CHECK: ret
define <16 x float> @mulps512(<16 x float> %y, <16 x float> %x) {
entry:
  %mul.i = fmul <16 x float> %x, %y
  ret <16 x float> %mul.i
}

; CHECK-LABEL: mulps512fold
; CHECK: vmulps LCP{{.*}}(%rip)
; CHECK: ret
define <16 x float> @mulps512fold(<16 x float> %y) {
entry:
  %mul.i = fmul <16 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000>
  ret <16 x float> %mul.i
}

; CHECK-LABEL: divpd512
; CHECK: vdivpd
; CHECK: ret
define <8 x double> @divpd512(<8 x double> %y, <8 x double> %x) {
entry:
  %div.i = fdiv <8 x double> %x, %y
  ret <8 x double> %div.i
}

; CHECK-LABEL: divpd512fold
; CHECK: vdivpd LCP{{.*}}(%rip)
; CHECK: ret
define <8 x double> @divpd512fold(<8 x double> %y) {
entry:
  %div.i = fdiv <8 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00, double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00>
  ret <8 x double> %div.i
}

; CHECK-LABEL: divps512
; CHECK: vdivps
; CHECK: ret
define <16 x float> @divps512(<16 x float> %y, <16 x float> %x) {
entry:
  %div.i = fdiv <16 x float> %x, %y
  ret <16 x float> %div.i
}

; CHECK-LABEL: divps512fold
; CHECK: vdivps LCP{{.*}}(%rip)
; CHECK: ret
define <16 x float> @divps512fold(<16 x float> %y) {
entry:
  %div.i = fdiv <16 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 4.500000e+00, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 4.500000e+00, float 0x4002666660000000, float 0x3FF3333340000000>
  ret <16 x float> %div.i
}

; CHECK-LABEL: vpaddq_test
; CHECK: vpaddq %zmm
; CHECK: ret
define <8 x i64> @vpaddq_test(<8 x i64> %i, <8 x i64> %j) nounwind readnone {
  %x = add <8 x i64> %i, %j
  ret <8 x i64> %x
}

; CHECK-LABEL: vpaddq_fold_test
; CHECK: vpaddq (%
; CHECK: ret
define <8 x i64> @vpaddq_fold_test(<8 x i64> %i, <8 x i64>* %j) nounwind {
  %tmp = load <8 x i64>* %j, align 4
  %x = add <8 x i64> %i, %tmp
  ret <8 x i64> %x
}

; CHECK-LABEL: vpaddq_broadcast_test
; CHECK: vpaddq LCP{{.*}}(%rip){1to8}
; CHECK: ret
define <8 x i64> @vpaddq_broadcast_test(<8 x i64> %i) nounwind {
  %x = add <8 x i64> %i, <i64 1, i64 1, i64 1, i64 1, i64 1, i64 1, i64 1, i64 1>
  ret <8 x i64> %x
}

; CHECK-LABEL: vpaddq_broadcast2_test
; CHECK: vpaddq (%rdi){1to8}
; CHECK: ret
define <8 x i64> @vpaddq_broadcast2_test(<8 x i64> %i, i64* %j) nounwind {
  %tmp = load i64* %j
  %j.0 = insertelement <8 x i64> undef, i64 %tmp, i32 0
  %j.1 = insertelement <8 x i64> %j.0, i64 %tmp, i32 1
  %j.2 = insertelement <8 x i64> %j.1, i64 %tmp, i32 2
  %j.3 = insertelement <8 x i64> %j.2, i64 %tmp, i32 3
  %j.4 = insertelement <8 x i64> %j.3, i64 %tmp, i32 4
  %j.5 = insertelement <8 x i64> %j.4, i64 %tmp, i32 5
  %j.6 = insertelement <8 x i64> %j.5, i64 %tmp, i32 6
  %j.7 = insertelement <8 x i64> %j.6, i64 %tmp, i32 7
  %x = add <8 x i64> %i, %j.7
  ret <8 x i64> %x
}

; CHECK-LABEL: vpaddd_test
; CHECK: vpaddd %zmm
; CHECK: ret
define <16 x i32> @vpaddd_test(<16 x i32> %i, <16 x i32> %j) nounwind readnone {
  %x = add <16 x i32> %i, %j
  ret <16 x i32> %x
}

; CHECK-LABEL: vpaddd_fold_test
; CHECK: vpaddd (%
; CHECK: ret
define <16 x i32> @vpaddd_fold_test(<16 x i32> %i, <16 x i32>* %j) nounwind {
  %tmp = load <16 x i32>* %j, align 4
  %x = add <16 x i32> %i, %tmp
  ret <16 x i32> %x
}

; CHECK-LABEL: vpaddd_broadcast_test
; CHECK: vpaddd LCP{{.*}}(%rip){1to16}
; CHECK: ret
define <16 x i32> @vpaddd_broadcast_test(<16 x i32> %i) nounwind {
  %x = add <16 x i32> %i, <i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1>
  ret <16 x i32> %x
}

; CHECK-LABEL: vpaddd_mask_test
; CHECK: vpaddd {{%zmm[0-9]{1,2}, %zmm[0-9]{1,2}, %zmm[0-9]{1,2} {%k[1-7]} }}
; CHECK: ret
define <16 x i32> @vpaddd_mask_test(<16 x i32> %i, <16 x i32> %j, <16 x i32> %mask1) nounwind readnone {
  %mask = icmp ne <16 x i32> %mask1, zeroinitializer
  %x = add <16 x i32> %i, %j
  %r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> %i
  ret <16 x i32> %r
}

; CHECK-LABEL: vpaddd_maskz_test
; CHECK: vpaddd {{%zmm[0-9]{1,2}, %zmm[0-9]{1,2}, %zmm[0-9]{1,2} {%k[1-7]} {z} }}
; CHECK: ret
define <16 x i32> @vpaddd_maskz_test(<16 x i32> %i, <16 x i32> %j, <16 x i32> %mask1) nounwind readnone {
  %mask = icmp ne <16 x i32> %mask1, zeroinitializer
  %x = add <16 x i32> %i, %j
  %r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> zeroinitializer
  ret <16 x i32> %r
}

; CHECK-LABEL: vpaddd_mask_fold_test
; CHECK: vpaddd (%rdi), {{%zmm[0-9]{1,2}, %zmm[0-9]{1,2} {%k[1-7]} }}
; CHECK: ret
define <16 x i32> @vpaddd_mask_fold_test(<16 x i32> %i, <16 x i32>* %j.ptr, <16 x i32> %mask1) nounwind readnone {
  %mask = icmp ne <16 x i32> %mask1, zeroinitializer
  %j = load <16 x i32>* %j.ptr
  %x = add <16 x i32> %i, %j
  %r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> %i
  ret <16 x i32> %r
}

; CHECK-LABEL: vpaddd_mask_broadcast_test
; CHECK: vpaddd LCP{{.*}}(%rip){1to16}, {{%zmm[0-9]{1,2}, %zmm[0-9]{1,2} {%k[1-7]} }}
; CHECK: ret
define <16 x i32> @vpaddd_mask_broadcast_test(<16 x i32> %i, <16 x i32> %mask1) nounwind readnone {
  %mask = icmp ne <16 x i32> %mask1, zeroinitializer
  %x = add <16 x i32> %i, <i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1>
  %r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> %i
  ret <16 x i32> %r
}

; CHECK-LABEL: vpaddd_maskz_fold_test
; CHECK: vpaddd (%rdi), {{%zmm[0-9]{1,2}, %zmm[0-9]{1,2} {%k[1-7]}}} {z}
; CHECK: ret
define <16 x i32> @vpaddd_maskz_fold_test(<16 x i32> %i, <16 x i32>* %j.ptr, <16 x i32> %mask1) nounwind readnone {
  %mask = icmp ne <16 x i32> %mask1, zeroinitializer
  %j = load <16 x i32>* %j.ptr
  %x = add <16 x i32> %i, %j
  %r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> zeroinitializer
  ret <16 x i32> %r
}

; CHECK-LABEL: vpaddd_maskz_broadcast_test
; CHECK: vpaddd LCP{{.*}}(%rip){1to16}, {{%zmm[0-9]{1,2}, %zmm[0-9]{1,2} {%k[1-7]}}} {z}
; CHECK: ret
define <16 x i32> @vpaddd_maskz_broadcast_test(<16 x i32> %i, <16 x i32> %mask1) nounwind readnone {
  %mask = icmp ne <16 x i32> %mask1, zeroinitializer
  %x = add <16 x i32> %i, <i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1>
  %r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> zeroinitializer
  ret <16 x i32> %r
}

; CHECK-LABEL: vpsubq_test
; CHECK: vpsubq %zmm
; CHECK: ret
define <8 x i64> @vpsubq_test(<8 x i64> %i, <8 x i64> %j) nounwind readnone {
  %x = sub <8 x i64> %i, %j
  ret <8 x i64> %x
}

; CHECK-LABEL: vpsubd_test
; CHECK: vpsubd
; CHECK: ret
define <16 x i32> @vpsubd_test(<16 x i32> %i, <16 x i32> %j) nounwind readnone {
  %x = sub <16 x i32> %i, %j
  ret <16 x i32> %x
}

; CHECK-LABEL: vpmulld_test
; CHECK: vpmulld %zmm
; CHECK: ret
define <16 x i32> @vpmulld_test(<16 x i32> %i, <16 x i32> %j) {
  %x = mul <16 x i32> %i, %j
  ret <16 x i32> %x
}

; CHECK-LABEL: sqrtA
; CHECK: vsqrtss {{.*}} encoding: [0x62
; CHECK: ret
declare float @sqrtf(float) readnone
define float @sqrtA(float %a) nounwind uwtable readnone ssp {
entry:
  %conv1 = tail call float @sqrtf(float %a) nounwind readnone
  ret float %conv1
}

; CHECK-LABEL: sqrtB
; CHECK: vsqrtsd {{.*}}## encoding: [0x62
; CHECK: ret
declare double @sqrt(double) readnone
define double @sqrtB(double %a) nounwind uwtable readnone ssp {
entry:
  %call = tail call double @sqrt(double %a) nounwind readnone
  ret double %call
}

; CHECK-LABEL: sqrtC
; CHECK: vsqrtss {{.*}}## encoding: [0x62
; CHECK: ret
declare float @llvm.sqrt.f32(float)
define float @sqrtC(float %a) nounwind {
  %b = call float @llvm.sqrt.f32(float %a)
  ret float %b
}

; CHECK-LABEL: sqrtD
; CHECK: vsqrtps {{.*}}
; CHECK: ret
declare <16 x float> @llvm.sqrt.v16f32(<16 x float>)
define <16 x float> @sqrtD(<16 x float> %a) nounwind {
  %b = call <16 x float> @llvm.sqrt.v16f32(<16 x float> %a)
  ret <16 x float> %b
}

; CHECK-LABEL: sqrtE
; CHECK: vsqrtpd {{.*}}
; CHECK: ret
declare <8 x double> @llvm.sqrt.v8f64(<8 x double>)
define <8 x double> @sqrtE(<8 x double> %a) nounwind {
  %b = call <8 x double> @llvm.sqrt.v8f64(<8 x double> %a)
  ret <8 x double> %b
}

; CHECK-LABEL: fadd_broadcast
; CHECK: LCP{{.*}}(%rip){1to16}, %zmm0, %zmm0
; CHECK: ret
define <16 x float> @fadd_broadcast(<16 x float> %a) nounwind {
  %b = fadd <16 x float> %a, <float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000>
  ret <16 x float> %b
}

; CHECK-LABEL: addq_broadcast
; CHECK: vpaddq LCP{{.*}}(%rip){1to8}, %zmm0, %zmm0
; CHECK: ret
define <8 x i64> @addq_broadcast(<8 x i64> %a) nounwind {
  %b = add <8 x i64> %a, <i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2>
  ret <8 x i64> %b
}

; CHECK-LABEL: orq_broadcast
; CHECK: vporq LCP{{.*}}(%rip){1to8}, %zmm0, %zmm0
; CHECK: ret
define <8 x i64> @orq_broadcast(<8 x i64> %a) nounwind {
  %b = or <8 x i64> %a, <i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2>
  ret <8 x i64> %b
}

; CHECK-LABEL: andd512fold
; CHECK: vpandd (%
; CHECK: ret
define <16 x i32> @andd512fold(<16 x i32> %y, <16 x i32>* %x) {
entry:
  %a = load <16 x i32>* %x, align 4
  %b = and <16 x i32> %y, %a
  ret <16 x i32> %b
}

; CHECK-LABEL: andqbrst
; CHECK: vpandq  (%rdi){1to8}, %zmm
; CHECK: ret
define <8 x i64> @andqbrst(<8 x i64> %p1, i64* %ap) {
entry:
  %a = load i64* %ap, align 8
  %b = insertelement <8 x i64> undef, i64 %a, i32 0
  %c = shufflevector <8 x i64> %b, <8 x i64> undef, <8 x i32> zeroinitializer
  %d = and <8 x i64> %p1, %c
  ret <8 x i64>%d
}
AVX-512: Removed "z" suffix from AVX-512 instructions, since it is incompatible with GCC. I moved a test from avx512-vbroadcast-crash.ll to avx512-vbroadcast.ll I defined HasAVX512 predicate as AssemblerPredicate. It means that you should invoke llvm-mc with "-mcpu=knl" to get encoding for AVX-512 instructions. I need this to let AsmMatcher to set different encoding for AVX and AVX-512 instructions that have the same mnemonic and operands (all scalar instructions). llvm-svn: 197041 2013-12-11 22:31:04 +08:00			`; RUN: llc < %s -mtriple=x86_64-apple-darwin -mcpu=knl --show-mc-encoding\| FileCheck %s`
AVX-512: added arithmetic and logical operations. ADD, SUB, MUL integer and FP types. OR, AND, XOR. Added embeded broadcast form for these instructions. llvm-svn: 188673 2013-08-19 21:26:14 +08:00
			`; CHECK-LABEL: addpd512`
			`; CHECK: vaddpd`
			`; CHECK: ret`
			`define <8 x double> @addpd512(<8 x double> %y, <8 x double> %x) {`
			`entry:`
			`%add.i = fadd <8 x double> %x, %y`
			`ret <8 x double> %add.i`
			`}`

			`; CHECK-LABEL: addpd512fold`
			`; CHECK: vaddpd LCP{{.*}}(%rip)`
			`; CHECK: ret`
			`define <8 x double> @addpd512fold(<8 x double> %y) {`
			`entry:`
			`%add.i = fadd <8 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00, double 4.500000e+00, double 3.800000e+00, double 2.300000e+00, double 1.200000e+00>`
			`ret <8 x double> %add.i`
			`}`

			`; CHECK-LABEL: addps512`
			`; CHECK: vaddps`
			`; CHECK: ret`
			`define <16 x float> @addps512(<16 x float> %y, <16 x float> %x) {`
			`entry:`
			`%add.i = fadd <16 x float> %x, %y`
			`ret <16 x float> %add.i`
			`}`

			`; CHECK-LABEL: addps512fold`
			`; CHECK: vaddps LCP{{.*}}(%rip)`
			`; CHECK: ret`
			`define <16 x float> @addps512fold(<16 x float> %y) {`
			`entry:`
			`%add.i = fadd <16 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 4.500000e+00, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000>`
			`ret <16 x float> %add.i`
			`}`

			`; CHECK-LABEL: subpd512`
			`; CHECK: vsubpd`
			`; CHECK: ret`
			`define <8 x double> @subpd512(<8 x double> %y, <8 x double> %x) {`
			`entry:`
			`%sub.i = fsub <8 x double> %x, %y`
			`ret <8 x double> %sub.i`
			`}`

			`; CHECK-LABEL: @subpd512fold`
			`; CHECK: vsubpd (%`
			`; CHECK: ret`
			`define <8 x double> @subpd512fold(<8 x double> %y, <8 x double>* %x) {`
			`entry:`
			`%tmp2 = load <8 x double>* %x, align 8`
			`%sub.i = fsub <8 x double> %y, %tmp2`
			`ret <8 x double> %sub.i`
			`}`

			`; CHECK-LABEL: @subps512`
			`; CHECK: vsubps`
			`; CHECK: ret`
			`define <16 x float> @subps512(<16 x float> %y, <16 x float> %x) {`
			`entry:`
			`%sub.i = fsub <16 x float> %x, %y`
			`ret <16 x float> %sub.i`
			`}`

			`; CHECK-LABEL: subps512fold`
			`; CHECK: vsubps (%`
			`; CHECK: ret`
			`define <16 x float> @subps512fold(<16 x float> %y, <16 x float>* %x) {`
			`entry:`
			`%tmp2 = load <16 x float>* %x, align 4`
			`%sub.i = fsub <16 x float> %y, %tmp2`
			`ret <16 x float> %sub.i`
			`}`

AVX-512: MUL operation lowering for v8i64 llvm-svn: 193083 2013-10-21 21:27:34 +08:00			`; CHECK-LABEL: imulq512`
			`; CHECK: vpmuludq`
			`; CHECK: vpmuludq`
			`; CHECK: ret`
			`define <8 x i64> @imulq512(<8 x i64> %y, <8 x i64> %x) {`
			`%z = mul <8 x i64>%x, %y`
			`ret <8 x i64>%z`
			`}`

AVX-512: added arithmetic and logical operations. ADD, SUB, MUL integer and FP types. OR, AND, XOR. Added embeded broadcast form for these instructions. llvm-svn: 188673 2013-08-19 21:26:14 +08:00			`; CHECK-LABEL: mulpd512`
			`; CHECK: vmulpd`
			`; CHECK: ret`
			`define <8 x double> @mulpd512(<8 x double> %y, <8 x double> %x) {`
			`entry:`
			`%mul.i = fmul <8 x double> %x, %y`
			`ret <8 x double> %mul.i`
			`}`

			`; CHECK-LABEL: mulpd512fold`
			`; CHECK: vmulpd LCP{{.*}}(%rip)`
			`; CHECK: ret`
			`define <8 x double> @mulpd512fold(<8 x double> %y) {`
			`entry:`
			`%mul.i = fmul <8 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00, double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00>`
			`ret <8 x double> %mul.i`
			`}`

			`; CHECK-LABEL: mulps512`
			`; CHECK: vmulps`
			`; CHECK: ret`
			`define <16 x float> @mulps512(<16 x float> %y, <16 x float> %x) {`
			`entry:`
			`%mul.i = fmul <16 x float> %x, %y`
			`ret <16 x float> %mul.i`
			`}`

			`; CHECK-LABEL: mulps512fold`
			`; CHECK: vmulps LCP{{.*}}(%rip)`
			`; CHECK: ret`
			`define <16 x float> @mulps512fold(<16 x float> %y) {`
			`entry:`
			`%mul.i = fmul <16 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000>`
			`ret <16 x float> %mul.i`
			`}`

			`; CHECK-LABEL: divpd512`
			`; CHECK: vdivpd`
			`; CHECK: ret`
			`define <8 x double> @divpd512(<8 x double> %y, <8 x double> %x) {`
			`entry:`
			`%div.i = fdiv <8 x double> %x, %y`
			`ret <8 x double> %div.i`
			`}`

			`; CHECK-LABEL: divpd512fold`
			`; CHECK: vdivpd LCP{{.*}}(%rip)`
			`; CHECK: ret`
			`define <8 x double> @divpd512fold(<8 x double> %y) {`
			`entry:`
			`%div.i = fdiv <8 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00, double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00>`
			`ret <8 x double> %div.i`
			`}`

			`; CHECK-LABEL: divps512`
			`; CHECK: vdivps`
			`; CHECK: ret`
			`define <16 x float> @divps512(<16 x float> %y, <16 x float> %x) {`
			`entry:`
			`%div.i = fdiv <16 x float> %x, %y`
			`ret <16 x float> %div.i`
			`}`

			`; CHECK-LABEL: divps512fold`
			`; CHECK: vdivps LCP{{.*}}(%rip)`
			`; CHECK: ret`
			`define <16 x float> @divps512fold(<16 x float> %y) {`
			`entry:`
			`%div.i = fdiv <16 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 4.500000e+00, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 4.500000e+00, float 0x4002666660000000, float 0x3FF3333340000000>`
			`ret <16 x float> %div.i`
			`}`

			`; CHECK-LABEL: vpaddq_test`
			`; CHECK: vpaddq %zmm`
			`; CHECK: ret`
			`define <8 x i64> @vpaddq_test(<8 x i64> %i, <8 x i64> %j) nounwind readnone {`
			`%x = add <8 x i64> %i, %j`
			`ret <8 x i64> %x`
			`}`

AVX-512: Implemented masking for integer arithmetic & logic instructions. By Robert Khasanov rob.khasanov@gmail.com llvm-svn: 204906 2014-03-27 17:45:08 +08:00			`; CHECK-LABEL: vpaddq_fold_test`
			`; CHECK: vpaddq (%`
			`; CHECK: ret`
			`define <8 x i64> @vpaddq_fold_test(<8 x i64> %i, <8 x i64>* %j) nounwind {`
			`%tmp = load <8 x i64>* %j, align 4`
			`%x = add <8 x i64> %i, %tmp`
			`ret <8 x i64> %x`
			`}`

			`; CHECK-LABEL: vpaddq_broadcast_test`
			`; CHECK: vpaddq LCP{{.*}}(%rip){1to8}`
			`; CHECK: ret`
			`define <8 x i64> @vpaddq_broadcast_test(<8 x i64> %i) nounwind {`
			`%x = add <8 x i64> %i, <i64 1, i64 1, i64 1, i64 1, i64 1, i64 1, i64 1, i64 1>`
			`ret <8 x i64> %x`
			`}`

			`; CHECK-LABEL: vpaddq_broadcast2_test`
			`; CHECK: vpaddq (%rdi){1to8}`
			`; CHECK: ret`
			`define <8 x i64> @vpaddq_broadcast2_test(<8 x i64> %i, i64* %j) nounwind {`
			`%tmp = load i64* %j`
			`%j.0 = insertelement <8 x i64> undef, i64 %tmp, i32 0`
			`%j.1 = insertelement <8 x i64> %j.0, i64 %tmp, i32 1`
			`%j.2 = insertelement <8 x i64> %j.1, i64 %tmp, i32 2`
			`%j.3 = insertelement <8 x i64> %j.2, i64 %tmp, i32 3`
			`%j.4 = insertelement <8 x i64> %j.3, i64 %tmp, i32 4`
			`%j.5 = insertelement <8 x i64> %j.4, i64 %tmp, i32 5`
			`%j.6 = insertelement <8 x i64> %j.5, i64 %tmp, i32 6`
			`%j.7 = insertelement <8 x i64> %j.6, i64 %tmp, i32 7`
			`%x = add <8 x i64> %i, %j.7`
			`ret <8 x i64> %x`
			`}`

AVX-512: added arithmetic and logical operations. ADD, SUB, MUL integer and FP types. OR, AND, XOR. Added embeded broadcast form for these instructions. llvm-svn: 188673 2013-08-19 21:26:14 +08:00			`; CHECK-LABEL: vpaddd_test`
			`; CHECK: vpaddd %zmm`
			`; CHECK: ret`
			`define <16 x i32> @vpaddd_test(<16 x i32> %i, <16 x i32> %j) nounwind readnone {`
			`%x = add <16 x i32> %i, %j`
			`ret <16 x i32> %x`
			`}`

AVX-512: Implemented masking for integer arithmetic & logic instructions. By Robert Khasanov rob.khasanov@gmail.com llvm-svn: 204906 2014-03-27 17:45:08 +08:00			`; CHECK-LABEL: vpaddd_fold_test`
			`; CHECK: vpaddd (%`
			`; CHECK: ret`
			`define <16 x i32> @vpaddd_fold_test(<16 x i32> %i, <16 x i32>* %j) nounwind {`
			`%tmp = load <16 x i32>* %j, align 4`
			`%x = add <16 x i32> %i, %tmp`
			`ret <16 x i32> %x`
			`}`

			`; CHECK-LABEL: vpaddd_broadcast_test`
			`; CHECK: vpaddd LCP{{.*}}(%rip){1to16}`
			`; CHECK: ret`
			`define <16 x i32> @vpaddd_broadcast_test(<16 x i32> %i) nounwind {`
			`%x = add <16 x i32> %i, <i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1>`
			`ret <16 x i32> %x`
			`}`

			`; CHECK-LABEL: vpaddd_mask_test`
			`; CHECK: vpaddd {{%zmm[0-9]{1,2}, %zmm[0-9]{1,2}, %zmm[0-9]{1,2} {%k[1-7]} }}`
			`; CHECK: ret`
			`define <16 x i32> @vpaddd_mask_test(<16 x i32> %i, <16 x i32> %j, <16 x i32> %mask1) nounwind readnone {`
			`%mask = icmp ne <16 x i32> %mask1, zeroinitializer`
			`%x = add <16 x i32> %i, %j`
			`%r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> %i`
			`ret <16 x i32> %r`
			`}`

			`; CHECK-LABEL: vpaddd_maskz_test`
			`; CHECK: vpaddd {{%zmm[0-9]{1,2}, %zmm[0-9]{1,2}, %zmm[0-9]{1,2} {%k[1-7]} {z} }}`
			`; CHECK: ret`
			`define <16 x i32> @vpaddd_maskz_test(<16 x i32> %i, <16 x i32> %j, <16 x i32> %mask1) nounwind readnone {`
			`%mask = icmp ne <16 x i32> %mask1, zeroinitializer`
			`%x = add <16 x i32> %i, %j`
			`%r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> zeroinitializer`
			`ret <16 x i32> %r`
			`}`

			`; CHECK-LABEL: vpaddd_mask_fold_test`
			`; CHECK: vpaddd (%rdi), {{%zmm[0-9]{1,2}, %zmm[0-9]{1,2} {%k[1-7]} }}`
			`; CHECK: ret`
			`define <16 x i32> @vpaddd_mask_fold_test(<16 x i32> %i, <16 x i32>* %j.ptr, <16 x i32> %mask1) nounwind readnone {`
			`%mask = icmp ne <16 x i32> %mask1, zeroinitializer`
			`%j = load <16 x i32>* %j.ptr`
			`%x = add <16 x i32> %i, %j`
			`%r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> %i`
			`ret <16 x i32> %r`
			`}`

			`; CHECK-LABEL: vpaddd_mask_broadcast_test`
			`; CHECK: vpaddd LCP{{.*}}(%rip){1to16}, {{%zmm[0-9]{1,2}, %zmm[0-9]{1,2} {%k[1-7]} }}`
			`; CHECK: ret`
			`define <16 x i32> @vpaddd_mask_broadcast_test(<16 x i32> %i, <16 x i32> %mask1) nounwind readnone {`
			`%mask = icmp ne <16 x i32> %mask1, zeroinitializer`
			`%x = add <16 x i32> %i, <i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1>`
			`%r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> %i`
			`ret <16 x i32> %r`
			`}`

			`; CHECK-LABEL: vpaddd_maskz_fold_test`
			`; CHECK: vpaddd (%rdi), {{%zmm[0-9]{1,2}, %zmm[0-9]{1,2} {%k[1-7]}}} {z}`
			`; CHECK: ret`
			`define <16 x i32> @vpaddd_maskz_fold_test(<16 x i32> %i, <16 x i32>* %j.ptr, <16 x i32> %mask1) nounwind readnone {`
			`%mask = icmp ne <16 x i32> %mask1, zeroinitializer`
			`%j = load <16 x i32>* %j.ptr`
			`%x = add <16 x i32> %i, %j`
			`%r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> zeroinitializer`
			`ret <16 x i32> %r`
			`}`

			`; CHECK-LABEL: vpaddd_maskz_broadcast_test`
			`; CHECK: vpaddd LCP{{.*}}(%rip){1to16}, {{%zmm[0-9]{1,2}, %zmm[0-9]{1,2} {%k[1-7]}}} {z}`
			`; CHECK: ret`
			`define <16 x i32> @vpaddd_maskz_broadcast_test(<16 x i32> %i, <16 x i32> %mask1) nounwind readnone {`
			`%mask = icmp ne <16 x i32> %mask1, zeroinitializer`
			`%x = add <16 x i32> %i, <i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1>`
			`%r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> zeroinitializer`
			`ret <16 x i32> %r`
			`}`

AVX-512: added arithmetic and logical operations. ADD, SUB, MUL integer and FP types. OR, AND, XOR. Added embeded broadcast form for these instructions. llvm-svn: 188673 2013-08-19 21:26:14 +08:00			`; CHECK-LABEL: vpsubq_test`
			`; CHECK: vpsubq %zmm`
			`; CHECK: ret`
			`define <8 x i64> @vpsubq_test(<8 x i64> %i, <8 x i64> %j) nounwind readnone {`
			`%x = sub <8 x i64> %i, %j`
			`ret <8 x i64> %x`
			`}`

			`; CHECK-LABEL: vpsubd_test`
			`; CHECK: vpsubd`
			`; CHECK: ret`
			`define <16 x i32> @vpsubd_test(<16 x i32> %i, <16 x i32> %j) nounwind readnone {`
			`%x = sub <16 x i32> %i, %j`
			`ret <16 x i32> %x`
			`}`

			`; CHECK-LABEL: vpmulld_test`
			`; CHECK: vpmulld %zmm`
			`; CHECK: ret`
			`define <16 x i32> @vpmulld_test(<16 x i32> %i, <16 x i32> %j) {`
			`%x = mul <16 x i32> %i, %j`
			`ret <16 x i32> %x`
			`}`

AVX-512: added SQRT, VRSQRT14, VCOMISS, VUCOMISS, VRCP14, VPABS llvm-svn: 189472 2013-08-28 19:21:58 +08:00			`; CHECK-LABEL: sqrtA`
AVX-512: Removed "z" suffix from AVX-512 instructions, since it is incompatible with GCC. I moved a test from avx512-vbroadcast-crash.ll to avx512-vbroadcast.ll I defined HasAVX512 predicate as AssemblerPredicate. It means that you should invoke llvm-mc with "-mcpu=knl" to get encoding for AVX-512 instructions. I need this to let AsmMatcher to set different encoding for AVX and AVX-512 instructions that have the same mnemonic and operands (all scalar instructions). llvm-svn: 197041 2013-12-11 22:31:04 +08:00			`; CHECK: vsqrtss {{.*}} encoding: [0x62`
AVX-512: added SQRT, VRSQRT14, VCOMISS, VUCOMISS, VRCP14, VPABS llvm-svn: 189472 2013-08-28 19:21:58 +08:00			`; CHECK: ret`
			`declare float @sqrtf(float) readnone`
			`define float @sqrtA(float %a) nounwind uwtable readnone ssp {`
			`entry:`
			`%conv1 = tail call float @sqrtf(float %a) nounwind readnone`
			`ret float %conv1`
			`}`

			`; CHECK-LABEL: sqrtB`
AVX-512: Removed "z" suffix from AVX-512 instructions, since it is incompatible with GCC. I moved a test from avx512-vbroadcast-crash.ll to avx512-vbroadcast.ll I defined HasAVX512 predicate as AssemblerPredicate. It means that you should invoke llvm-mc with "-mcpu=knl" to get encoding for AVX-512 instructions. I need this to let AsmMatcher to set different encoding for AVX and AVX-512 instructions that have the same mnemonic and operands (all scalar instructions). llvm-svn: 197041 2013-12-11 22:31:04 +08:00			`; CHECK: vsqrtsd {{.*}}## encoding: [0x62`
AVX-512: added SQRT, VRSQRT14, VCOMISS, VUCOMISS, VRCP14, VPABS llvm-svn: 189472 2013-08-28 19:21:58 +08:00			`; CHECK: ret`
			`declare double @sqrt(double) readnone`
			`define double @sqrtB(double %a) nounwind uwtable readnone ssp {`
			`entry:`
			`%call = tail call double @sqrt(double %a) nounwind readnone`
			`ret double %call`
			`}`

			`; CHECK-LABEL: sqrtC`
AVX-512: Removed "z" suffix from AVX-512 instructions, since it is incompatible with GCC. I moved a test from avx512-vbroadcast-crash.ll to avx512-vbroadcast.ll I defined HasAVX512 predicate as AssemblerPredicate. It means that you should invoke llvm-mc with "-mcpu=knl" to get encoding for AVX-512 instructions. I need this to let AsmMatcher to set different encoding for AVX and AVX-512 instructions that have the same mnemonic and operands (all scalar instructions). llvm-svn: 197041 2013-12-11 22:31:04 +08:00			`; CHECK: vsqrtss {{.*}}## encoding: [0x62`
AVX-512: added SQRT, VRSQRT14, VCOMISS, VUCOMISS, VRCP14, VPABS llvm-svn: 189472 2013-08-28 19:21:58 +08:00			`; CHECK: ret`
			`declare float @llvm.sqrt.f32(float)`
			`define float @sqrtC(float %a) nounwind {`
			`%b = call float @llvm.sqrt.f32(float %a)`
			`ret float %b`
			`}`

Fix AVX512 vector sqrt assembly strings. llvm-svn: 201681 2014-02-19 23:16:09 +08:00			`; CHECK-LABEL: sqrtD`
			`; CHECK: vsqrtps {{.*}}`
			`; CHECK: ret`
			`declare <16 x float> @llvm.sqrt.v16f32(<16 x float>)`
			`define <16 x float> @sqrtD(<16 x float> %a) nounwind {`
			`%b = call <16 x float> @llvm.sqrt.v16f32(<16 x float> %a)`
			`ret <16 x float> %b`
			`}`

			`; CHECK-LABEL: sqrtE`
			`; CHECK: vsqrtpd {{.*}}`
			`; CHECK: ret`
			`declare <8 x double> @llvm.sqrt.v8f64(<8 x double>)`
			`define <8 x double> @sqrtE(<8 x double> %a) nounwind {`
			`%b = call <8 x double> @llvm.sqrt.v8f64(<8 x double> %a)`
			`ret <8 x double> %b`
			`}`

AVX-512: added SQRT, VRSQRT14, VCOMISS, VUCOMISS, VRCP14, VPABS llvm-svn: 189472 2013-08-28 19:21:58 +08:00			`; CHECK-LABEL: fadd_broadcast`
			`; CHECK: LCP{{.*}}(%rip){1to16}, %zmm0, %zmm0`
			`; CHECK: ret`
			`define <16 x float> @fadd_broadcast(<16 x float> %a) nounwind {`
			`%b = fadd <16 x float> %a, <float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000>`
			`ret <16 x float> %b`
			`}`

AVX-512: added arithmetic and logical operations. ADD, SUB, MUL integer and FP types. OR, AND, XOR. Added embeded broadcast form for these instructions. llvm-svn: 188673 2013-08-19 21:26:14 +08:00			`; CHECK-LABEL: addq_broadcast`
			`; CHECK: vpaddq LCP{{.*}}(%rip){1to8}, %zmm0, %zmm0`
			`; CHECK: ret`
			`define <8 x i64> @addq_broadcast(<8 x i64> %a) nounwind {`
			`%b = add <8 x i64> %a, <i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2>`
			`ret <8 x i64> %b`
			`}`

			`; CHECK-LABEL: orq_broadcast`
			`; CHECK: vporq LCP{{.*}}(%rip){1to8}, %zmm0, %zmm0`
			`; CHECK: ret`
			`define <8 x i64> @orq_broadcast(<8 x i64> %a) nounwind {`
			`%b = or <8 x i64> %a, <i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2>`
			`ret <8 x i64> %b`
			`}`

			`; CHECK-LABEL: andd512fold`
			`; CHECK: vpandd (%`
			`; CHECK: ret`
			`define <16 x i32> @andd512fold(<16 x i32> %y, <16 x i32>* %x) {`
			`entry:`
			`%a = load <16 x i32>* %x, align 4`
			`%b = and <16 x i32> %y, %a`
			`ret <16 x i32> %b`
			`}`

			`; CHECK-LABEL: andqbrst`
			`; CHECK: vpandq (%rdi){1to8}, %zmm`
			`; CHECK: ret`
			`define <8 x i64> @andqbrst(<8 x i64> %p1, i64* %ap) {`
			`entry:`
			`%a = load i64* %ap, align 8`
			`%b = insertelement <8 x i64> undef, i64 %a, i32 0`
			`%c = shufflevector <8 x i64> %b, <8 x i64> undef, <8 x i32> zeroinitializer`
			`%d = and <8 x i64> %p1, %c`
			`ret <8 x i64>%d`
AVX-512: MUL operation lowering for v8i64 llvm-svn: 193083 2013-10-21 21:27:34 +08:00			`}`