IR: update Clang to use polymorphic __fp16 conversion intrinsics.

There should be no change in semantics at this stage.

llvm-svn: 213249
This commit is contained in:
Tim Northover 2014-07-17 10:51:31 +00:00
parent fd7e424935
commit 6dbcbac98b
2 changed files with 144 additions and 137 deletions

View File

@ -701,7 +701,10 @@ Value *ScalarExprEmitter::EmitScalarConversion(Value *Src, QualType SrcType,
// If casting to/from storage-only half FP, use special intrinsics.
if (SrcType->isHalfType() && !CGF.getContext().getLangOpts().NativeHalfType) {
Src = Builder.CreateCall(CGF.CGM.getIntrinsic(llvm::Intrinsic::convert_from_fp16), Src);
Src = Builder.CreateCall(
CGF.CGM.getIntrinsic(llvm::Intrinsic::convert_from_fp16,
CGF.CGM.FloatTy),
Src);
SrcType = CGF.getContext().FloatTy;
SrcTy = CGF.FloatTy;
}
@ -797,7 +800,9 @@ Value *ScalarExprEmitter::EmitScalarConversion(Value *Src, QualType SrcType,
if (DstTy != ResTy) {
assert(ResTy->isIntegerTy(16) && "Only half FP requires extra conversion");
Res = Builder.CreateCall(CGF.CGM.getIntrinsic(llvm::Intrinsic::convert_to_fp16), Res);
Res = Builder.CreateCall(
CGF.CGM.getIntrinsic(llvm::Intrinsic::convert_to_fp16, CGF.CGM.FloatTy),
Res);
}
return Res;
@ -1686,9 +1691,10 @@ ScalarExprEmitter::EmitScalarPrePostIncDec(const UnaryOperator *E, LValue LV,
if (type->isHalfType() && !CGF.getContext().getLangOpts().NativeHalfType) {
// Another special case: half FP increment should be done via float
value =
Builder.CreateCall(CGF.CGM.getIntrinsic(llvm::Intrinsic::convert_from_fp16),
input);
value = Builder.CreateCall(
CGF.CGM.getIntrinsic(llvm::Intrinsic::convert_from_fp16,
CGF.CGM.FloatTy),
input);
}
if (value->getType()->isFloatTy())
@ -1707,9 +1713,10 @@ ScalarExprEmitter::EmitScalarPrePostIncDec(const UnaryOperator *E, LValue LV,
value = Builder.CreateFAdd(value, amt, isInc ? "inc" : "dec");
if (type->isHalfType() && !CGF.getContext().getLangOpts().NativeHalfType)
value =
Builder.CreateCall(CGF.CGM.getIntrinsic(llvm::Intrinsic::convert_to_fp16),
value);
value = Builder.CreateCall(
CGF.CGM.getIntrinsic(llvm::Intrinsic::convert_to_fp16,
CGF.CGM.FloatTy),
value);
// Objective-C pointer types.
} else {

View File

@ -11,274 +11,274 @@ void foo(void) {
// Check unary ops
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK fptoi float
test = (h0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp une float
test = (!h1);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fsub float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = -h1;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = +h1;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fadd float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1++;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fadd float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
++h1;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fadd float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
--h1;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fadd float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1--;
// Check binary ops with various operands
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fmul float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = h0 * h2;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call i16 @llvm.convert.to.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fmul float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = h0 * (__fp16) -2.0;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fmul float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = h0 * f2;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fmul float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = f0 * h2;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fdiv float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = (h0 / h2);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fdiv float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = (h0 / (__fp16) -2.0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fdiv float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = (h0 / f2);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fdiv float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = (f0 / h2);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fadd float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = (h2 + h0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fadd float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = ((__fp16)-2.0 + h0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fadd float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = (h2 + f0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fadd float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = (f2 + h0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fsub float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = (h2 - h0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fsub float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = ((__fp16)-2.0 - h0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fsub float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = (h2 - f0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fsub float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = (f2 - h0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp olt
test = (h2 < h0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp olt
test = (h2 < (__fp16)42.0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp olt
test = (h2 < f0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp olt
test = (f2 < h0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp ogt
test = (h0 > h2);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp ogt
test = ((__fp16)42.0 > h2);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp ogt
test = (h0 > f2);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp ogt
test = (f0 > h2);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp ole
test = (h2 <= h0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp ole
test = (h2 <= (__fp16)42.0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp ole
test = (h2 <= f0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp ole
test = (f2 <= h0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp oge
test = (h0 >= h2);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp oge
test = (h0 >= (__fp16)-2.0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp oge
test = (h0 >= f2);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp oge
test = (f0 >= h2);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp oeq
test = (h1 == h2);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp oeq
test = (h1 == (__fp16)1.0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp oeq
test = (h1 == f1);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp oeq
test = (f1 == h1);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp une
test = (h1 != h2);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp une
test = (h1 != (__fp16)1.0);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp une
test = (h1 != f1);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp une
test = (f1 != h1);
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fcmp une
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h1 = (h1 ? h2 : h0);
// Check assignments (inc. compound)
h0 = h1;
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h0 = (__fp16)-2.0;
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h0 = f0;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fadd float
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h0 += h1;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fadd
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h0 += (__fp16)1.0;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fadd
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h0 += f2;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fsub
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h0 -= h1;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fsub
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h0 -= (__fp16)1.0;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fsub
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h0 -= f2;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fmul
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h0 *= h1;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fmul
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h0 *= (__fp16)1.0;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fmul
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h0 *= f2;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fdiv
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h0 /= h1;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fdiv
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h0 /= (__fp16)1.0;
// CHECK: call float @llvm.convert.from.fp16
// CHECK: call float @llvm.convert.from.fp16.f32(
// CHECK: fdiv
// CHECK: call i16 @llvm.convert.to.fp16
// CHECK: call i16 @llvm.convert.to.fp16.f32(
h0 /= f2;
}