llvm-project/llvm/test/CodeGen/AArch64/fp16-v8-instructions.ll

; RUN: llc < %s -asm-verbose=false -mtriple=aarch64-none-eabi | FileCheck %s

define <8 x half> @add_h(<8 x half> %a, <8 x half> %b) {
entry:
; CHECK-LABEL: add_h:
; CHECK: fcvt
; CHECK: fcvt
; CHECK-DAG: fadd
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fadd
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fadd
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fadd
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fadd
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fadd
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fadd
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fadd
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK: fcvt
  %0 = fadd <8 x half> %a, %b
  ret <8 x half> %0
}


define <8 x half> @sub_h(<8 x half> %a, <8 x half> %b) {
entry:
; CHECK-LABEL: sub_h:
; CHECK: fcvt
; CHECK: fcvt
; CHECK-DAG: fsub
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fsub
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fsub
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fsub
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fsub
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fsub
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fsub
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fsub
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK: fcvt
  %0 = fsub <8 x half> %a, %b
  ret <8 x half> %0
}


define <8 x half> @mul_h(<8 x half> %a, <8 x half> %b) {
entry:
; CHECK-LABEL: mul_h:
; CHECK: fcvt
; CHECK: fcvt
; CHECK-DAG: fmul
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fmul
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fmul
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fmul
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fmul
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fmul
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fmul
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fmul
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK: fcvt
  %0 = fmul <8 x half> %a, %b
  ret <8 x half> %0
}


define <8 x half> @div_h(<8 x half> %a, <8 x half> %b) {
entry:
; CHECK-LABEL: div_h:
; CHECK: fcvt
; CHECK: fcvt
; CHECK-DAG: fdiv
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fdiv
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fdiv
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fdiv
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fdiv
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fdiv
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fdiv
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fdiv
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK-DAG: fcvt
; CHECK: fcvt
  %0 = fdiv <8 x half> %a, %b
  ret <8 x half> %0
}


define <8 x half> @load_h(<8 x half>* %a) {
entry:
; CHECK-LABEL: load_h:
; CHECK: ldr q0, [x0]
  %0 = load <8 x half>, <8 x half>* %a, align 4
  ret <8 x half> %0
}


define void @store_h(<8 x half>* %a, <8 x half> %b) {
entry:
; CHECK-LABEL: store_h:
; CHECK: str q0, [x0]
  store <8 x half> %b, <8 x half>* %a, align 4
  ret void
}

define <8 x half> @s_to_h(<8 x float> %a) {
; CHECK-LABEL: s_to_h:
; CHECK-DAG: fcvtn v0.4h, v0.4s
; CHECK-DAG: fcvtn [[REG:v[0-9+]]].4h, v1.4s
; CHECK: ins v0.d[1], [[REG]].d[0]
  %1 = fptrunc <8 x float> %a to <8 x half>
  ret <8 x half> %1
}

define <8 x half> @d_to_h(<8 x double> %a) {
; CHECK-LABEL: d_to_h:
; CHECK-DAG: mov d{{[0-9]+}}, v{{[0-9]+}}.d[1]
; CHECK-DAG: mov d{{[0-9]+}}, v{{[0-9]+}}.d[1]
; CHECK-DAG: mov d{{[0-9]+}}, v{{[0-9]+}}.d[1]
; CHECK-DAG: mov d{{[0-9]+}}, v{{[0-9]+}}.d[1]
; CHECK-DAG: fcvt h
; CHECK-DAG: fcvt h
; CHECK-DAG: fcvt h
; CHECK-DAG: fcvt h
; CHECK-DAG: fcvt h
; CHECK-DAG: fcvt h
; CHECK-DAG: fcvt h
; CHECK-DAG: fcvt h
; CHECK-DAG: ins v{{[0-9]+}}.h
; CHECK-DAG: ins v{{[0-9]+}}.h
; CHECK-DAG: ins v{{[0-9]+}}.h
; CHECK-DAG: ins v{{[0-9]+}}.h
; CHECK-DAG: ins v{{[0-9]+}}.h
; CHECK-DAG: ins v{{[0-9]+}}.h
; CHECK-DAG: ins v{{[0-9]+}}.h
; CHECK-DAG: ins v{{[0-9]+}}.h
  %1 = fptrunc <8 x double> %a to <8 x half>
  ret <8 x half> %1
}

define <8 x float> @h_to_s(<8 x half> %a) {
; CHECK-LABEL: h_to_s:
; CHECK: fcvtl2 v1.4s, v0.8h
; CHECK: fcvtl v0.4s, v0.4h
  %1 = fpext <8 x half> %a to <8 x float>
  ret <8 x float> %1
}

define <8 x double> @h_to_d(<8 x half> %a) {
; CHECK-LABEL: h_to_d:
; CHECK-DAG: fcvt d
; CHECK-DAG: fcvt d
; CHECK-DAG: fcvt d
; CHECK-DAG: fcvt d
; CHECK-DAG: fcvt d
; CHECK-DAG: fcvt d
; CHECK-DAG: fcvt d
; CHECK-DAG: fcvt d
; CHECK-DAG: ins
; CHECK-DAG: ins
; CHECK-DAG: ins
; CHECK-DAG: ins
  %1 = fpext <8 x half> %a to <8 x double>
  ret <8 x double> %1
}


define <8 x half> @bitcast_i_to_h(float, <8 x i16> %a) {
; CHECK-LABEL: bitcast_i_to_h:
; CHECK: mov v0.16b, v1.16b
  %2 = bitcast <8 x i16> %a to <8 x half>
  ret <8 x half> %2
}

define <8 x i16> @bitcast_h_to_i(float, <8 x half> %a) {
; CHECK-LABEL: bitcast_h_to_i:
; CHECK: mov v0.16b, v1.16b
  %2 = bitcast <8 x half> %a to <8 x i16>
  ret <8 x i16> %2
}


define <8 x half> @sitofp_i8(<8 x i8> %a) #0 {
; CHECK-LABEL: sitofp_i8:
; CHECK-NEXT: sshll v[[REG1:[0-9]+]].8h, v0.8b, #0
; CHECK-NEXT: sshll2 [[LO:v[0-9]+\.4s]], v[[REG1]].8h, #0
; CHECK-NEXT: sshll  [[HI:v[0-9]+\.4s]], v[[REG1]].4h, #0
; CHECK-DAG: scvtf [[HIF:v[0-9]+\.4s]], [[HI]]
; CHECK-DAG: scvtf [[LOF:v[0-9]+\.4s]], [[LO]]
; CHECK-DAG: fcvtn v[[LOREG:[0-9]+]].4h, [[LOF]]
; CHECK-DAG: fcvtn v0.4h, [[HIF]]
; CHECK: ins v0.d[1], v[[LOREG]].d[0]
  %1 = sitofp <8 x i8> %a to <8 x half>
  ret <8 x half> %1
}


define <8 x half> @sitofp_i16(<8 x i16> %a) #0 {
; CHECK-LABEL: sitofp_i16:
; CHECK-NEXT: sshll2 [[LO:v[0-9]+\.4s]], v0.8h, #0
; CHECK-NEXT: sshll  [[HI:v[0-9]+\.4s]], v0.4h, #0
; CHECK-DAG: scvtf [[HIF:v[0-9]+\.4s]], [[HI]]
; CHECK-DAG: scvtf [[LOF:v[0-9]+\.4s]], [[LO]]
; CHECK-DAG: fcvtn v[[LOREG:[0-9]+]].4h, [[LOF]]
; CHECK-DAG: fcvtn v0.4h, [[HIF]]
; CHECK: ins v0.d[1], v[[LOREG]].d[0]
  %1 = sitofp <8 x i16> %a to <8 x half>
  ret <8 x half> %1
}


define <8 x half> @sitofp_i32(<8 x i32> %a) #0 {
; CHECK-LABEL: sitofp_i32:
; CHECK-DAG: scvtf [[OP1:v[0-9]+\.4s]], v0.4s
; CHECK-DAG: scvtf [[OP2:v[0-9]+\.4s]], v1.4s
; CHECK-DAG: fcvtn v[[REG:[0-9]+]].4h, [[OP2]]
; CHECK-DAG: fcvtn v0.4h, [[OP1]]
; CHECK: ins v0.d[1], v[[REG]].d[0]
  %1 = sitofp <8 x i32> %a to <8 x half>
  ret <8 x half> %1
}


define <8 x half> @sitofp_i64(<8 x i64> %a) #0 {
; CHECK-LABEL: sitofp_i64:
; CHECK-DAG: scvtf [[OP1:v[0-9]+\.2d]], v0.2d
; CHECK-DAG: scvtf [[OP2:v[0-9]+\.2d]], v1.2d
; CHECK-DAG: fcvtn [[OP3:v[0-9]+]].2s, [[OP1]]
; CHECK-DAG: fcvtn2 [[OP3]].4s, [[OP2]]
; CHECK: fcvtn v0.4h, [[OP3]].4s
  %1 = sitofp <8 x i64> %a to <8 x half>
  ret <8 x half> %1
}

define <8 x half> @uitofp_i8(<8 x i8> %a) #0 {
; CHECK-LABEL: uitofp_i8:
; CHECK-NEXT: ushll v[[REG1:[0-9]+]].8h, v0.8b, #0
; CHECK-NEXT: ushll2 [[LO:v[0-9]+\.4s]], v[[REG1]].8h, #0
; CHECK-NEXT: ushll  [[HI:v[0-9]+\.4s]], v[[REG1]].4h, #0
; CHECK-DAG: ucvtf [[HIF:v[0-9]+\.4s]], [[HI]]
; CHECK-DAG: ucvtf [[LOF:v[0-9]+\.4s]], [[LO]]
; CHECK-DAG: fcvtn v[[LOREG:[0-9]+]].4h, [[LOF]]
; CHECK-DAG: fcvtn v0.4h, [[HIF]]
; CHECK: ins v0.d[1], v[[LOREG]].d[0]
  %1 = uitofp <8 x i8> %a to <8 x half>
  ret <8 x half> %1
}


define <8 x half> @uitofp_i16(<8 x i16> %a) #0 {
; CHECK-LABEL: uitofp_i16:
; CHECK-NEXT: ushll2 [[LO:v[0-9]+\.4s]], v0.8h, #0
; CHECK-NEXT: ushll  [[HI:v[0-9]+\.4s]], v0.4h, #0
; CHECK-DAG: ucvtf [[HIF:v[0-9]+\.4s]], [[HI]]
; CHECK-DAG: ucvtf [[LOF:v[0-9]+\.4s]], [[LO]]
; CHECK-DAG: fcvtn v[[LOREG:[0-9]+]].4h, [[LOF]]
; CHECK-DAG: fcvtn v0.4h, [[HIF]]
; CHECK: ins v0.d[1], v[[LOREG]].d[0]
  %1 = uitofp <8 x i16> %a to <8 x half>
  ret <8 x half> %1
}


define <8 x half> @uitofp_i32(<8 x i32> %a) #0 {
; CHECK-LABEL: uitofp_i32:
; CHECK-DAG: ucvtf [[OP1:v[0-9]+\.4s]], v0.4s
; CHECK-DAG: ucvtf [[OP2:v[0-9]+\.4s]], v1.4s
; CHECK-DAG: fcvtn v[[REG:[0-9]+]].4h, [[OP2]]
; CHECK-DAG: fcvtn v0.4h, [[OP1]]
; CHECK: ins v0.d[1], v[[REG]].d[0]
  %1 = uitofp <8 x i32> %a to <8 x half>
  ret <8 x half> %1
}


define <8 x half> @uitofp_i64(<8 x i64> %a) #0 {
; CHECK-LABEL: uitofp_i64:
; CHECK-DAG: ucvtf [[OP1:v[0-9]+\.2d]], v0.2d
; CHECK-DAG: ucvtf [[OP2:v[0-9]+\.2d]], v1.2d
; CHECK-DAG: fcvtn [[OP3:v[0-9]+]].2s, [[OP1]]
; CHECK-DAG: fcvtn2 [[OP3]].4s, [[OP2]]
; CHECK: fcvtn v0.4h, [[OP3]].4s
  %1 = uitofp <8 x i64> %a to <8 x half>
  ret <8 x half> %1
}

define void @test_insert_at_zero(half %a, <8 x half>* %b) #0 {
; CHECK-LABEL: test_insert_at_zero:
; CHECK-NEXT: str q0, [x0]
; CHECK-NEXT: ret
  %1 = insertelement <8 x half> undef, half %a, i64 0
  store <8 x half> %1, <8 x half>* %b, align 4
  ret void
}

define <8 x i8> @fptosi_i8(<8 x half> %a) #0 {
; CHECK-LABEL: fptosi_i8:
; CHECK-DAG: fcvtl   [[LO:v[0-9]+\.4s]], v0.4h
; CHECK-DAG: fcvtl2  [[HI:v[0-9]+\.4s]], v0.8h
; CHECK-DAG: fcvtzs  [[LOF32:v[0-9]+\.4s]], [[LO]]
; CHECK-DAG: xtn     [[I16:v[0-9]+]].4h, [[LOF32]]
; CHECK-DAG: fcvtzs  [[HIF32:v[0-9]+\.4s]], [[HI]]
; CHECK-DAG: xtn2    [[I16]].8h, [[HIF32]]
; CHECK-NEXT: xtn     v0.8b, [[I16]].8h
; CHECK-NEXT: ret
  %1 = fptosi<8 x half> %a to <8 x i8>
  ret <8 x i8> %1
}

define <8 x i16> @fptosi_i16(<8 x half> %a) #0 {
; CHECK-LABEL: fptosi_i16:
; CHECK-DAG: fcvtl   [[LO:v[0-9]+\.4s]], v0.4h
; CHECK-DAG: fcvtl2  [[HI:v[0-9]+\.4s]], v0.8h
; CHECK-DAG: fcvtzs  [[LOF32:v[0-9]+\.4s]], [[LO]]
; CHECK-DAG: xtn     [[I16:v[0-9]+]].4h, [[LOF32]]
; CHECK-DAG: fcvtzs  [[HIF32:v[0-9]+\.4s]], [[HI]]
; CHECK-NEXT: xtn2    [[I16]].8h, [[HIF32]]
; CHECK-NEXT: ret
  %1 = fptosi<8 x half> %a to <8 x i16>
  ret <8 x i16> %1
}

define <8 x i8> @fptoui_i8(<8 x half> %a) #0 {
; CHECK-LABEL: fptoui_i8:
; CHECK-DAG: fcvtl   [[LO:v[0-9]+\.4s]], v0.4h
; CHECK-DAG: fcvtl2  [[HI:v[0-9]+\.4s]], v0.8h
; CHECK-DAG: fcvtzu  [[LOF32:v[0-9]+\.4s]], [[LO]]
; CHECK-DAG: xtn     [[I16:v[0-9]+]].4h, [[LOF32]]
; CHECK-DAG: fcvtzu  [[HIF32:v[0-9]+\.4s]], [[HI]]
; CHECK-DAG: xtn2    [[I16]].8h, [[HIF32]]
; CHECK-NEXT: xtn     v0.8b, [[I16]].8h
; CHECK-NEXT: ret
  %1 = fptoui<8 x half> %a to <8 x i8>
  ret <8 x i8> %1
}

define <8 x i16> @fptoui_i16(<8 x half> %a) #0 {
; CHECK-LABEL: fptoui_i16:
; CHECK-DAG: fcvtl   [[LO:v[0-9]+\.4s]], v0.4h
; CHECK-DAG: fcvtl2  [[HI:v[0-9]+\.4s]], v0.8h
; CHECK-DAG: fcvtzu  [[LOF32:v[0-9]+\.4s]], [[LO]]
; CHECK-DAG: xtn     [[I16:v[0-9]+]].4h, [[LOF32]]
; CHECK-DAG: fcvtzu  [[HIF32:v[0-9]+\.4s]], [[HI]]
; CHECK-NEXT: xtn2    [[I16]].8h, [[HIF32]]
; CHECK-NEXT: ret
  %1 = fptoui<8 x half> %a to <8 x i16>
  ret <8 x i16> %1
}

; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests.  Skipped.
define <8 x i1> @test_fcmp_une(<8 x half> %a, <8 x half> %b) #0 {
  %1 = fcmp une <8 x half> %a, %b
  ret <8 x i1> %1
}

; FileCheck checks are unwieldy with 16 fcvt and 16 csel tests.  Skipped.
define <8 x i1> @test_fcmp_ueq(<8 x half> %a, <8 x half> %b) #0 {
  %1 = fcmp ueq <8 x half> %a, %b
  ret <8 x i1> %1
}

; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests.  Skipped.
define <8 x i1> @test_fcmp_ugt(<8 x half> %a, <8 x half> %b) #0 {
  %1 = fcmp ugt <8 x half> %a, %b
  ret <8 x i1> %1
}

; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests.  Skipped.
define <8 x i1> @test_fcmp_uge(<8 x half> %a, <8 x half> %b) #0 {
  %1 = fcmp uge <8 x half> %a, %b
  ret <8 x i1> %1
}

; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests.  Skipped.
define <8 x i1> @test_fcmp_ult(<8 x half> %a, <8 x half> %b) #0 {
  %1 = fcmp ult <8 x half> %a, %b
  ret <8 x i1> %1
}

; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests.  Skipped.
define <8 x i1> @test_fcmp_ule(<8 x half> %a, <8 x half> %b) #0 {
  %1 = fcmp ule <8 x half> %a, %b
  ret <8 x i1> %1
}

; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests.  Skipped.
define <8 x i1> @test_fcmp_uno(<8 x half> %a, <8 x half> %b) #0 {
  %1 = fcmp uno <8 x half> %a, %b
  ret <8 x i1> %1
}

; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests.  Skipped.
define <8 x i1> @test_fcmp_one(<8 x half> %a, <8 x half> %b) #0 {
  %1 = fcmp one <8 x half> %a, %b
  ret <8 x i1> %1
}

; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests.  Skipped.
define <8 x i1> @test_fcmp_oeq(<8 x half> %a, <8 x half> %b) #0 {
  %1 = fcmp oeq <8 x half> %a, %b
  ret <8 x i1> %1
}

; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests.  Skipped.
define <8 x i1> @test_fcmp_ogt(<8 x half> %a, <8 x half> %b) #0 {
  %1 = fcmp ogt <8 x half> %a, %b
  ret <8 x i1> %1
}

; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests.  Skipped.
define <8 x i1> @test_fcmp_oge(<8 x half> %a, <8 x half> %b) #0 {
  %1 = fcmp oge <8 x half> %a, %b
  ret <8 x i1> %1
}

; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests.  Skipped.
define <8 x i1> @test_fcmp_olt(<8 x half> %a, <8 x half> %b) #0 {
  %1 = fcmp olt <8 x half> %a, %b
  ret <8 x i1> %1
}

; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests.  Skipped.
define <8 x i1> @test_fcmp_ole(<8 x half> %a, <8 x half> %b) #0 {
  %1 = fcmp ole <8 x half> %a, %b
  ret <8 x i1> %1
}

; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests.  Skipped.
define <8 x i1> @test_fcmp_ord(<8 x half> %a, <8 x half> %b) #0 {
  %1 = fcmp ord <8 x half> %a, %b
  ret <8 x i1> %1
}

attributes #0 = { nounwind }
[AArch64] Handle vec4, vec8, vec16 *itofp for half Summary: Set operation action for SINT_TO_FP and UINT_TO_FP nodes with v4i32, v8i8, v8i16 inputs to allow promotion of v4f16 results. Add tests for sitofp and uitofp for vec4, vec8, vec16, and i8, i16, i32, and i64 vectors. Only missing tests are for v16i8 and v16i16 as the shift operations are too complicated to write a proper check sequence. The conversions from v4i64 to v4f16 do not depend on this patch - v4i64 is split and the conversion gets handled while lowering v2i64. I am adding a test here for completeness. Reviewers: aemerson, rengolin, ab, jmolloy, srhines Subscribers: rengolin, aemerson, llvm-commits Differential Revision: http://reviews.llvm.org/D9166 llvm-svn: 235609 2015-04-24 01:16:27 +08:00			`; RUN: llc < %s -asm-verbose=false -mtriple=aarch64-none-eabi \| FileCheck %s`
Teach the AArch64 backend about v4f16 and v8f16 This teaches the AArch64 backend to deal with the operations required to deal with the operations on v4f16 and v8f16 which are exposed by NEON intrinsics, plus the add, sub, mul and div operations. llvm-svn: 216555 2014-08-28 00:16:04 +08:00
			`define <8 x half> @add_h(<8 x half> %a, <8 x half> %b) {`
			`entry:`
			`; CHECK-LABEL: add_h:`
			`; CHECK: fcvt`
			`; CHECK: fcvt`
			`; CHECK-DAG: fadd`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fadd`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fadd`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fadd`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fadd`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fadd`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fadd`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fadd`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK: fcvt`
			`%0 = fadd <8 x half> %a, %b`
			`ret <8 x half> %0`
			`}`


			`define <8 x half> @sub_h(<8 x half> %a, <8 x half> %b) {`
			`entry:`
			`; CHECK-LABEL: sub_h:`
			`; CHECK: fcvt`
			`; CHECK: fcvt`
			`; CHECK-DAG: fsub`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fsub`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fsub`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fsub`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fsub`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fsub`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fsub`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fsub`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK: fcvt`
			`%0 = fsub <8 x half> %a, %b`
			`ret <8 x half> %0`
			`}`


			`define <8 x half> @mul_h(<8 x half> %a, <8 x half> %b) {`
			`entry:`
			`; CHECK-LABEL: mul_h:`
			`; CHECK: fcvt`
			`; CHECK: fcvt`
			`; CHECK-DAG: fmul`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fmul`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fmul`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fmul`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fmul`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fmul`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fmul`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fmul`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK: fcvt`
			`%0 = fmul <8 x half> %a, %b`
			`ret <8 x half> %0`
			`}`


			`define <8 x half> @div_h(<8 x half> %a, <8 x half> %b) {`
			`entry:`
			`; CHECK-LABEL: div_h:`
			`; CHECK: fcvt`
			`; CHECK: fcvt`
			`; CHECK-DAG: fdiv`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fdiv`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fdiv`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fdiv`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fdiv`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fdiv`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fdiv`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fdiv`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK-DAG: fcvt`
			`; CHECK: fcvt`
			`%0 = fdiv <8 x half> %a, %b`
			`ret <8 x half> %0`
			`}`


			`define <8 x half> @load_h(<8 x half>* %a) {`
			`entry:`
			`; CHECK-LABEL: load_h:`
			`; CHECK: ldr q0, [x0]`
[opaque pointer type] Add textual IR support for explicit type parameter to load instruction Essentially the same as the GEP change in r230786. A similar migration script can be used to update test cases, though a few more test case improvements/changes were required this time around: (r229269-r229278) import fileinput import sys import re pat = re.compile(r"((?:=\|:\|^)\sload (?:atomic )?(?:volatile )?(.?))(\| addrspace\(\d+\) )\($\| (?:%\|@\|null\|undef\|blockaddress\|getelementptr\|addrspacecast\|bitcast\|inttoptr\|\[\[[a-zA-Z]\|\{\{).$)") for line in sys.stdin: sys.stdout.write(re.sub(pat, r"\1, \2\3*\4", line)) Reviewers: rafael, dexonsmith, grosser Differential Revision: http://reviews.llvm.org/D7649 llvm-svn: 230794 2015-02-28 05:17:42 +08:00			`%0 = load <8 x half>, <8 x half>* %a, align 4`
Teach the AArch64 backend about v4f16 and v8f16 This teaches the AArch64 backend to deal with the operations required to deal with the operations on v4f16 and v8f16 which are exposed by NEON intrinsics, plus the add, sub, mul and div operations. llvm-svn: 216555 2014-08-28 00:16:04 +08:00			`ret <8 x half> %0`
			`}`


			`define void @store_h(<8 x half>* %a, <8 x half> %b) {`
			`entry:`
			`; CHECK-LABEL: store_h:`
			`; CHECK: str q0, [x0]`
			`store <8 x half> %b, <8 x half>* %a, align 4`
			`ret void`
			`}`

			`define <8 x half> @s_to_h(<8 x float> %a) {`
			`; CHECK-LABEL: s_to_h:`
			`; CHECK-DAG: fcvtn v0.4h, v0.4s`
			`; CHECK-DAG: fcvtn [[REG:v[0-9+]]].4h, v1.4s`
			`; CHECK: ins v0.d[1], [[REG]].d[0]`
			`%1 = fptrunc <8 x float> %a to <8 x half>`
			`ret <8 x half> %1`
			`}`

			`define <8 x half> @d_to_h(<8 x double> %a) {`
			`; CHECK-LABEL: d_to_h:`
[AArch64] Prefer DUP/MOV ("CPY") to INS for vector_extract. This avoids a partial false dependency on the previous content of the upper lanes of the destination vector register. Differential Revision: http://reviews.llvm.org/D7307 llvm-svn: 227820 2015-02-03 01:55:57 +08:00			`; CHECK-DAG: mov d{{[0-9]+}}, v{{[0-9]+}}.d[1]`
			`; CHECK-DAG: mov d{{[0-9]+}}, v{{[0-9]+}}.d[1]`
			`; CHECK-DAG: mov d{{[0-9]+}}, v{{[0-9]+}}.d[1]`
			`; CHECK-DAG: mov d{{[0-9]+}}, v{{[0-9]+}}.d[1]`
Teach the AArch64 backend about v4f16 and v8f16 This teaches the AArch64 backend to deal with the operations required to deal with the operations on v4f16 and v8f16 which are exposed by NEON intrinsics, plus the add, sub, mul and div operations. llvm-svn: 216555 2014-08-28 00:16:04 +08:00			`; CHECK-DAG: fcvt h`
			`; CHECK-DAG: fcvt h`
			`; CHECK-DAG: fcvt h`
			`; CHECK-DAG: fcvt h`
			`; CHECK-DAG: fcvt h`
			`; CHECK-DAG: fcvt h`
			`; CHECK-DAG: fcvt h`
			`; CHECK-DAG: fcvt h`
			`; CHECK-DAG: ins v{{[0-9]+}}.h`
			`; CHECK-DAG: ins v{{[0-9]+}}.h`
			`; CHECK-DAG: ins v{{[0-9]+}}.h`
			`; CHECK-DAG: ins v{{[0-9]+}}.h`
			`; CHECK-DAG: ins v{{[0-9]+}}.h`
			`; CHECK-DAG: ins v{{[0-9]+}}.h`
			`; CHECK-DAG: ins v{{[0-9]+}}.h`
			`; CHECK-DAG: ins v{{[0-9]+}}.h`
			`%1 = fptrunc <8 x double> %a to <8 x half>`
			`ret <8 x half> %1`
			`}`

			`define <8 x float> @h_to_s(<8 x half> %a) {`
			`; CHECK-LABEL: h_to_s:`
			`; CHECK: fcvtl2 v1.4s, v0.8h`
			`; CHECK: fcvtl v0.4s, v0.4h`
			`%1 = fpext <8 x half> %a to <8 x float>`
			`ret <8 x float> %1`
			`}`

			`define <8 x double> @h_to_d(<8 x half> %a) {`
			`; CHECK-LABEL: h_to_d:`
			`; CHECK-DAG: fcvt d`
			`; CHECK-DAG: fcvt d`
			`; CHECK-DAG: fcvt d`
			`; CHECK-DAG: fcvt d`
			`; CHECK-DAG: fcvt d`
			`; CHECK-DAG: fcvt d`
			`; CHECK-DAG: fcvt d`
			`; CHECK-DAG: fcvt d`
			`; CHECK-DAG: ins`
			`; CHECK-DAG: ins`
			`; CHECK-DAG: ins`
			`; CHECK-DAG: ins`
			`%1 = fpext <8 x half> %a to <8 x double>`
			`ret <8 x double> %1`
			`}`


			`define <8 x half> @bitcast_i_to_h(float, <8 x i16> %a) {`
			`; CHECK-LABEL: bitcast_i_to_h:`
			`; CHECK: mov v0.16b, v1.16b`
			`%2 = bitcast <8 x i16> %a to <8 x half>`
			`ret <8 x half> %2`
			`}`

			`define <8 x i16> @bitcast_h_to_i(float, <8 x half> %a) {`
			`; CHECK-LABEL: bitcast_h_to_i:`
			`; CHECK: mov v0.16b, v1.16b`
			`%2 = bitcast <8 x half> %a to <8 x i16>`
			`ret <8 x i16> %2`
			`}`

[AArch64] Handle vec4, vec8, vec16 *itofp for half Summary: Set operation action for SINT_TO_FP and UINT_TO_FP nodes with v4i32, v8i8, v8i16 inputs to allow promotion of v4f16 results. Add tests for sitofp and uitofp for vec4, vec8, vec16, and i8, i16, i32, and i64 vectors. Only missing tests are for v16i8 and v16i16 as the shift operations are too complicated to write a proper check sequence. The conversions from v4i64 to v4f16 do not depend on this patch - v4i64 is split and the conversion gets handled while lowering v2i64. I am adding a test here for completeness. Reviewers: aemerson, rengolin, ab, jmolloy, srhines Subscribers: rengolin, aemerson, llvm-commits Differential Revision: http://reviews.llvm.org/D9166 llvm-svn: 235609 2015-04-24 01:16:27 +08:00
			`define <8 x half> @sitofp_i8(<8 x i8> %a) #0 {`
			`; CHECK-LABEL: sitofp_i8:`
			`; CHECK-NEXT: sshll v[[REG1:[0-9]+]].8h, v0.8b, #0`
			`; CHECK-NEXT: sshll2 [[LO:v[0-9]+\.4s]], v[[REG1]].8h, #0`
			`; CHECK-NEXT: sshll [[HI:v[0-9]+\.4s]], v[[REG1]].4h, #0`
			`; CHECK-DAG: scvtf [[HIF:v[0-9]+\.4s]], [[HI]]`
			`; CHECK-DAG: scvtf [[LOF:v[0-9]+\.4s]], [[LO]]`
			`; CHECK-DAG: fcvtn v[[LOREG:[0-9]+]].4h, [[LOF]]`
			`; CHECK-DAG: fcvtn v0.4h, [[HIF]]`
			`; CHECK: ins v0.d[1], v[[LOREG]].d[0]`
			`%1 = sitofp <8 x i8> %a to <8 x half>`
			`ret <8 x half> %1`
			`}`


			`define <8 x half> @sitofp_i16(<8 x i16> %a) #0 {`
			`; CHECK-LABEL: sitofp_i16:`
			`; CHECK-NEXT: sshll2 [[LO:v[0-9]+\.4s]], v0.8h, #0`
			`; CHECK-NEXT: sshll [[HI:v[0-9]+\.4s]], v0.4h, #0`
			`; CHECK-DAG: scvtf [[HIF:v[0-9]+\.4s]], [[HI]]`
			`; CHECK-DAG: scvtf [[LOF:v[0-9]+\.4s]], [[LO]]`
			`; CHECK-DAG: fcvtn v[[LOREG:[0-9]+]].4h, [[LOF]]`
			`; CHECK-DAG: fcvtn v0.4h, [[HIF]]`
			`; CHECK: ins v0.d[1], v[[LOREG]].d[0]`
			`%1 = sitofp <8 x i16> %a to <8 x half>`
			`ret <8 x half> %1`
			`}`


			`define <8 x half> @sitofp_i32(<8 x i32> %a) #0 {`
			`; CHECK-LABEL: sitofp_i32:`
			`; CHECK-DAG: scvtf [[OP1:v[0-9]+\.4s]], v0.4s`
			`; CHECK-DAG: scvtf [[OP2:v[0-9]+\.4s]], v1.4s`
			`; CHECK-DAG: fcvtn v[[REG:[0-9]+]].4h, [[OP2]]`
			`; CHECK-DAG: fcvtn v0.4h, [[OP1]]`
			`; CHECK: ins v0.d[1], v[[REG]].d[0]`
			`%1 = sitofp <8 x i32> %a to <8 x half>`
			`ret <8 x half> %1`
			`}`


			`define <8 x half> @sitofp_i64(<8 x i64> %a) #0 {`
			`; CHECK-LABEL: sitofp_i64:`
			`; CHECK-DAG: scvtf [[OP1:v[0-9]+\.2d]], v0.2d`
			`; CHECK-DAG: scvtf [[OP2:v[0-9]+\.2d]], v1.2d`
			`; CHECK-DAG: fcvtn [[OP3:v[0-9]+]].2s, [[OP1]]`
			`; CHECK-DAG: fcvtn2 [[OP3]].4s, [[OP2]]`
			`; CHECK: fcvtn v0.4h, [[OP3]].4s`
			`%1 = sitofp <8 x i64> %a to <8 x half>`
			`ret <8 x half> %1`
			`}`

			`define <8 x half> @uitofp_i8(<8 x i8> %a) #0 {`
			`; CHECK-LABEL: uitofp_i8:`
			`; CHECK-NEXT: ushll v[[REG1:[0-9]+]].8h, v0.8b, #0`
			`; CHECK-NEXT: ushll2 [[LO:v[0-9]+\.4s]], v[[REG1]].8h, #0`
			`; CHECK-NEXT: ushll [[HI:v[0-9]+\.4s]], v[[REG1]].4h, #0`
			`; CHECK-DAG: ucvtf [[HIF:v[0-9]+\.4s]], [[HI]]`
			`; CHECK-DAG: ucvtf [[LOF:v[0-9]+\.4s]], [[LO]]`
			`; CHECK-DAG: fcvtn v[[LOREG:[0-9]+]].4h, [[LOF]]`
			`; CHECK-DAG: fcvtn v0.4h, [[HIF]]`
			`; CHECK: ins v0.d[1], v[[LOREG]].d[0]`
			`%1 = uitofp <8 x i8> %a to <8 x half>`
			`ret <8 x half> %1`
			`}`


			`define <8 x half> @uitofp_i16(<8 x i16> %a) #0 {`
			`; CHECK-LABEL: uitofp_i16:`
			`; CHECK-NEXT: ushll2 [[LO:v[0-9]+\.4s]], v0.8h, #0`
			`; CHECK-NEXT: ushll [[HI:v[0-9]+\.4s]], v0.4h, #0`
			`; CHECK-DAG: ucvtf [[HIF:v[0-9]+\.4s]], [[HI]]`
			`; CHECK-DAG: ucvtf [[LOF:v[0-9]+\.4s]], [[LO]]`
			`; CHECK-DAG: fcvtn v[[LOREG:[0-9]+]].4h, [[LOF]]`
			`; CHECK-DAG: fcvtn v0.4h, [[HIF]]`
			`; CHECK: ins v0.d[1], v[[LOREG]].d[0]`
			`%1 = uitofp <8 x i16> %a to <8 x half>`
			`ret <8 x half> %1`
			`}`


			`define <8 x half> @uitofp_i32(<8 x i32> %a) #0 {`
			`; CHECK-LABEL: uitofp_i32:`
			`; CHECK-DAG: ucvtf [[OP1:v[0-9]+\.4s]], v0.4s`
			`; CHECK-DAG: ucvtf [[OP2:v[0-9]+\.4s]], v1.4s`
			`; CHECK-DAG: fcvtn v[[REG:[0-9]+]].4h, [[OP2]]`
			`; CHECK-DAG: fcvtn v0.4h, [[OP1]]`
			`; CHECK: ins v0.d[1], v[[REG]].d[0]`
			`%1 = uitofp <8 x i32> %a to <8 x half>`
			`ret <8 x half> %1`
			`}`


			`define <8 x half> @uitofp_i64(<8 x i64> %a) #0 {`
			`; CHECK-LABEL: uitofp_i64:`
			`; CHECK-DAG: ucvtf [[OP1:v[0-9]+\.2d]], v0.2d`
			`; CHECK-DAG: ucvtf [[OP2:v[0-9]+\.2d]], v1.2d`
			`; CHECK-DAG: fcvtn [[OP3:v[0-9]+]].2s, [[OP1]]`
			`; CHECK-DAG: fcvtn2 [[OP3]].4s, [[OP2]]`
			`; CHECK: fcvtn v0.4h, [[OP3]].4s`
			`%1 = uitofp <8 x i64> %a to <8 x half>`
			`ret <8 x half> %1`
			`}`

Define selection for v4f16, v8f16 scalar_to_vector Summary: This fixes failure when trying to select insertelement <4 x half> undef, half %a, i64 0 which gets transformed to a scalar_to_vector node. The accompanying v4 and v8 tests fail instruction selection without this patch. Reviewers: ab, jmolloy Subscribers: srhines, llvm-commits Differential Revision: http://reviews.llvm.org/D15322 llvm-svn: 255072 2015-12-09 07:07:06 +08:00			`define void @test_insert_at_zero(half %a, <8 x half>* %b) #0 {`
			`; CHECK-LABEL: test_insert_at_zero:`
			`; CHECK-NEXT: str q0, [x0]`
			`; CHECK-NEXT: ret`
			`%1 = insertelement <8 x half> undef, half %a, i64 0`
			`store <8 x half> %1, <8 x half>* %b, align 4`
			`ret void`
			`}`

Fix fptosi, fptoui from f16 vectors to i8, i16 vectors Summary: Convert f16 vectors to corresponding f32 vectors before doing the conversion to int. Add tests for v4f16, v8f16. Reviewers: ab, jmolloy Subscribers: llvm-commits, srhines Differential Revision: http://reviews.llvm.org/D14936 llvm-svn: 255263 2015-12-11 01:16:49 +08:00			`define <8 x i8> @fptosi_i8(<8 x half> %a) #0 {`
			`; CHECK-LABEL: fptosi_i8:`
			`; CHECK-DAG: fcvtl [[LO:v[0-9]+\.4s]], v0.4h`
			`; CHECK-DAG: fcvtl2 [[HI:v[0-9]+\.4s]], v0.8h`
			`; CHECK-DAG: fcvtzs [[LOF32:v[0-9]+\.4s]], [[LO]]`
			`; CHECK-DAG: xtn [[I16:v[0-9]+]].4h, [[LOF32]]`
			`; CHECK-DAG: fcvtzs [[HIF32:v[0-9]+\.4s]], [[HI]]`
			`; CHECK-DAG: xtn2 [[I16]].8h, [[HIF32]]`
			`; CHECK-NEXT: xtn v0.8b, [[I16]].8h`
			`; CHECK-NEXT: ret`
			`%1 = fptosi<8 x half> %a to <8 x i8>`
			`ret <8 x i8> %1`
			`}`

			`define <8 x i16> @fptosi_i16(<8 x half> %a) #0 {`
			`; CHECK-LABEL: fptosi_i16:`
			`; CHECK-DAG: fcvtl [[LO:v[0-9]+\.4s]], v0.4h`
			`; CHECK-DAG: fcvtl2 [[HI:v[0-9]+\.4s]], v0.8h`
			`; CHECK-DAG: fcvtzs [[LOF32:v[0-9]+\.4s]], [[LO]]`
			`; CHECK-DAG: xtn [[I16:v[0-9]+]].4h, [[LOF32]]`
			`; CHECK-DAG: fcvtzs [[HIF32:v[0-9]+\.4s]], [[HI]]`
			`; CHECK-NEXT: xtn2 [[I16]].8h, [[HIF32]]`
			`; CHECK-NEXT: ret`
			`%1 = fptosi<8 x half> %a to <8 x i16>`
			`ret <8 x i16> %1`
			`}`

			`define <8 x i8> @fptoui_i8(<8 x half> %a) #0 {`
			`; CHECK-LABEL: fptoui_i8:`
			`; CHECK-DAG: fcvtl [[LO:v[0-9]+\.4s]], v0.4h`
			`; CHECK-DAG: fcvtl2 [[HI:v[0-9]+\.4s]], v0.8h`
			`; CHECK-DAG: fcvtzu [[LOF32:v[0-9]+\.4s]], [[LO]]`
			`; CHECK-DAG: xtn [[I16:v[0-9]+]].4h, [[LOF32]]`
			`; CHECK-DAG: fcvtzu [[HIF32:v[0-9]+\.4s]], [[HI]]`
			`; CHECK-DAG: xtn2 [[I16]].8h, [[HIF32]]`
			`; CHECK-NEXT: xtn v0.8b, [[I16]].8h`
			`; CHECK-NEXT: ret`
			`%1 = fptoui<8 x half> %a to <8 x i8>`
			`ret <8 x i8> %1`
			`}`

			`define <8 x i16> @fptoui_i16(<8 x half> %a) #0 {`
			`; CHECK-LABEL: fptoui_i16:`
			`; CHECK-DAG: fcvtl [[LO:v[0-9]+\.4s]], v0.4h`
			`; CHECK-DAG: fcvtl2 [[HI:v[0-9]+\.4s]], v0.8h`
			`; CHECK-DAG: fcvtzu [[LOF32:v[0-9]+\.4s]], [[LO]]`
			`; CHECK-DAG: xtn [[I16:v[0-9]+]].4h, [[LOF32]]`
			`; CHECK-DAG: fcvtzu [[HIF32:v[0-9]+\.4s]], [[HI]]`
			`; CHECK-NEXT: xtn2 [[I16]].8h, [[HIF32]]`
			`; CHECK-NEXT: ret`
			`%1 = fptoui<8 x half> %a to <8 x i16>`
			`ret <8 x i16> %1`
			`}`

Do not lower VSETCC if operand is an f16 vector Summary: SETCC with f16 vectors has OperationAction set to Expand but still gets lowered to FCM* intrinsics based on its result type. This patch skips lowering of VSETCC if the operand is an f16 vector. v4 and v8 tests included. Reviewers: ab, jmolloy Subscribers: srhines, llvm-commits Differential Revision: http://reviews.llvm.org/D15361 llvm-svn: 258471 2016-01-22 09:16:57 +08:00			`; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests. Skipped.`
			`define <8 x i1> @test_fcmp_une(<8 x half> %a, <8 x half> %b) #0 {`
			`%1 = fcmp une <8 x half> %a, %b`
			`ret <8 x i1> %1`
			`}`

			`; FileCheck checks are unwieldy with 16 fcvt and 16 csel tests. Skipped.`
			`define <8 x i1> @test_fcmp_ueq(<8 x half> %a, <8 x half> %b) #0 {`
			`%1 = fcmp ueq <8 x half> %a, %b`
			`ret <8 x i1> %1`
			`}`

			`; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests. Skipped.`
			`define <8 x i1> @test_fcmp_ugt(<8 x half> %a, <8 x half> %b) #0 {`
			`%1 = fcmp ugt <8 x half> %a, %b`
			`ret <8 x i1> %1`
			`}`

			`; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests. Skipped.`
			`define <8 x i1> @test_fcmp_uge(<8 x half> %a, <8 x half> %b) #0 {`
			`%1 = fcmp uge <8 x half> %a, %b`
			`ret <8 x i1> %1`
			`}`

			`; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests. Skipped.`
			`define <8 x i1> @test_fcmp_ult(<8 x half> %a, <8 x half> %b) #0 {`
			`%1 = fcmp ult <8 x half> %a, %b`
			`ret <8 x i1> %1`
			`}`

			`; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests. Skipped.`
			`define <8 x i1> @test_fcmp_ule(<8 x half> %a, <8 x half> %b) #0 {`
			`%1 = fcmp ule <8 x half> %a, %b`
			`ret <8 x i1> %1`
			`}`

			`; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests. Skipped.`
			`define <8 x i1> @test_fcmp_uno(<8 x half> %a, <8 x half> %b) #0 {`
			`%1 = fcmp uno <8 x half> %a, %b`
			`ret <8 x i1> %1`
			`}`

			`; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests. Skipped.`
			`define <8 x i1> @test_fcmp_one(<8 x half> %a, <8 x half> %b) #0 {`
			`%1 = fcmp one <8 x half> %a, %b`
			`ret <8 x i1> %1`
			`}`

			`; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests. Skipped.`
			`define <8 x i1> @test_fcmp_oeq(<8 x half> %a, <8 x half> %b) #0 {`
			`%1 = fcmp oeq <8 x half> %a, %b`
			`ret <8 x i1> %1`
			`}`

			`; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests. Skipped.`
			`define <8 x i1> @test_fcmp_ogt(<8 x half> %a, <8 x half> %b) #0 {`
			`%1 = fcmp ogt <8 x half> %a, %b`
			`ret <8 x i1> %1`
			`}`

			`; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests. Skipped.`
			`define <8 x i1> @test_fcmp_oge(<8 x half> %a, <8 x half> %b) #0 {`
			`%1 = fcmp oge <8 x half> %a, %b`
			`ret <8 x i1> %1`
			`}`

			`; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests. Skipped.`
			`define <8 x i1> @test_fcmp_olt(<8 x half> %a, <8 x half> %b) #0 {`
			`%1 = fcmp olt <8 x half> %a, %b`
			`ret <8 x i1> %1`
			`}`

			`; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests. Skipped.`
			`define <8 x i1> @test_fcmp_ole(<8 x half> %a, <8 x half> %b) #0 {`
			`%1 = fcmp ole <8 x half> %a, %b`
			`ret <8 x i1> %1`
			`}`

			`; FileCheck checks are unwieldy with 16 fcvt and 8 csel tests. Skipped.`
			`define <8 x i1> @test_fcmp_ord(<8 x half> %a, <8 x half> %b) #0 {`
			`%1 = fcmp ord <8 x half> %a, %b`
			`ret <8 x i1> %1`
			`}`

[AArch64] Handle vec4, vec8, vec16 *itofp for half Summary: Set operation action for SINT_TO_FP and UINT_TO_FP nodes with v4i32, v8i8, v8i16 inputs to allow promotion of v4f16 results. Add tests for sitofp and uitofp for vec4, vec8, vec16, and i8, i16, i32, and i64 vectors. Only missing tests are for v16i8 and v16i16 as the shift operations are too complicated to write a proper check sequence. The conversions from v4i64 to v4f16 do not depend on this patch - v4i64 is split and the conversion gets handled while lowering v2i64. I am adding a test here for completeness. Reviewers: aemerson, rengolin, ab, jmolloy, srhines Subscribers: rengolin, aemerson, llvm-commits Differential Revision: http://reviews.llvm.org/D9166 llvm-svn: 235609 2015-04-24 01:16:27 +08:00			`attributes #0 = { nounwind }`