llvm-project

Commit Graph

Author	SHA1	Message	Date
Jan Vesely	44e0522c09	half_divide: Implement using x/y Passes CTS on carrizo v2: Use full precision implementation Reviewer: Jeroen Ketema <j.ketema@xs4all.nl> Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 322899	2018-01-18 21:12:06 +00:00
Jan Vesely	2813b4f8d9	half_tan: Implement using tan v2: Use full precision implementation Reviewer: Jeroen Ketema <j.ketema@xs4all.nl> Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 322898	2018-01-18 21:12:04 +00:00
Jan Vesely	bf38fae8de	half_sin: Implement using sin Passes CTS on carrizo v2: Use full precision implementation Reviewer: Jeroen Ketema <j.ketema@xs4all.nl> Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 322897	2018-01-18 21:12:01 +00:00
Jan Vesely	398108b91e	half_recip: Implement using 1/x Passes CTS on carrizo v2: Use full precision implementation Reviewer: Jeroen Ketema <j.ketema@xs4all.nl> Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 322896	2018-01-18 21:11:58 +00:00
Jan Vesely	a1aba44ffa	half_log2: Implement using log2 Passes CTS on carrizo v2: Use full precision implementation Reviewer: Jeroen Ketema <j.ketema@xs4all.nl> Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 322895	2018-01-18 21:11:56 +00:00
Jan Vesely	b3b72af4b9	half_log10: Implement using log10 Passes CTS on carrizo v2: Use full precision implementation Reviewer: Jeroen Ketema <j.ketema@xs4all.nl> Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 322894	2018-01-18 21:11:53 +00:00
Jan Vesely	6852023802	half_log: Implement using log Passes CTS on carrizo v2: Use full precision implementation Reviewer: Jeroen Ketema <j.ketema@xs4all.nl> Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 322893	2018-01-18 21:11:50 +00:00
Jan Vesely	aa4c3899b5	half_exp10: Implement using exp10 Passes CTS on carrizo v2: Use full precision implementation Reviewer: Jeroen Ketema <j.ketema@xs4all.nl> Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 322892	2018-01-18 21:11:48 +00:00
Jan Vesely	3c0e19b61a	half_exp2: Implement using exp2 Passes CTS on carrizo v2: Use full precision implementation Reviewer: Jeroen Ketema <j.ketema@xs4all.nl> Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 322891	2018-01-18 21:11:45 +00:00
Jan Vesely	caa9000b1c	half_exp: Implement using exp Passes CTS on carrizo v2: Use full precision implementation Reviewer: Jeroen Ketema <j.ketema@xs4all.nl> Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 322890	2018-01-18 21:11:43 +00:00
Jan Vesely	b5d556061d	half_cos: Implement using cos Passes CTS on carrizo v2: Use full precision implementation Reviewer: Jeroen Ketema <j.ketema@xs4all.nl> Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 322889	2018-01-18 21:11:40 +00:00
Jan Vesely	e53ae3b596	half_sqrt: Cleanup implementation Passes CTS on carrizo v2: Use full precision implementation Reviewer: Jeroen Ketema <j.ketema@xs4all.nl> Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 322888	2018-01-18 21:11:38 +00:00
Jan Vesely	a95db14461	half_rsqrt: Cleanup implementation Passes CTS on carrizo v2: Use full precision implementation Reviewer: Jeroen Ketema <j.ketema@xs4all.nl> Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 322887	2018-01-18 21:11:35 +00:00
Jan Vesely	fe8e00bc3c	rootn: Port from amd_builtins Passes piglit on turks and carrizo fp64 passes ctx on carrizo v2: fix formatting check fp32 denormal support at runtime Reviewer: Jeroen Ketema <j.ketema@xs4all.nl> Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 322763	2018-01-17 21:22:14 +00:00
Jan Vesely	c45ec604f5	powr: Port from amd_builtins Passes piglit on turks and carrizo fp64 passes cts on carrizo v2: fix formatting check fp32 denormal support at runtime Reviewer: Jeroen Ketema <j.ketema@xs4all.nl> Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 322762	2018-01-17 21:22:06 +00:00
Jan Vesely	5efc8fe321	pown: Port from amd_builtins Passes piglit on turks and carrizo fp64 passes CTS on carrizo v2: fix formatting check fp32 denormal support at runtime Reviewer: Jeroen Ketema <j.ketema@xs4all.nl> Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 322761	2018-01-17 21:22:03 +00:00
Jan Vesely	cc5c65b2c2	pow: Port from amd_builtins Passes piglit on turks and carrizo fp64 passes CTS on carrizo v2: fix formatting check fp32 denormal support at runtime Reviewer: Jeroen Ketema <j.ketema@xs4all.nl> Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 322760	2018-01-17 21:21:35 +00:00
Jan Vesely	fe7c045753	math: Implement minmag Reviewer: Aaron Watry Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 318265	2017-11-15 04:10:39 +00:00
Jan Vesely	7ba243cc3d	math: Implement maxmag Reviewer: Aaron Watry Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 318264	2017-11-15 04:10:37 +00:00
Jan Vesely	383fbd050c	native_powr: Switch implementation to native_exp2 and native_log2 v2: don't use assume check only for x<0, the other conditions are handled transparently v3: don't check inputs at all, nan propagation works as expected Reviewer: Jeroen Ketema Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 318204	2017-11-14 21:55:41 +00:00
Jan Vesely	f38b40daf7	native_divide: provide function implementation instead of macro Reviewer: Jeroen Ketema Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 318067	2017-11-13 18:28:56 +00:00
Jan Vesely	1b9825f982	native_recip: provide function implementation instead of macro Reviewer: Jeroen Ketema Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 318066	2017-11-13 18:28:53 +00:00
Jan Vesely	a6758c94ef	native_rsqrt: Switch implementation to 1 / native_sqrt Reviewer: Jeroen Ketema Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 318065	2017-11-13 18:28:51 +00:00
Jan Vesely	541a3f0758	native_tan: Switch implementation to use native_sin/native_cos Reviewer: Jeroen Ketema Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 318064	2017-11-13 18:28:48 +00:00
Jan Vesely	79b7566210	math: Use precomputed constant for log2(10.0) exp10 CTS fails with or without this change Reviewer: Jeroen Ketema Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 318063	2017-11-13 18:28:45 +00:00
Jan Vesely	6b4a625438	native_exp10: Switch implementation to llvm intrinsic v2: Use native_log2 instead of wrong constant Reviewer: Jeroen Ketema Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 317941	2017-11-10 22:16:41 +00:00
Jan Vesely	4301e6d0c9	native_sqrt: Switch implementation to llvm intrinsic Reviewer: Jeroen Ketema Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 317940	2017-11-10 22:16:39 +00:00
Jan Vesely	1f34c851e0	native_sin: Switch implementation to llvm intrinsic Reviewer: Jeroen Ketema Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 317939	2017-11-10 22:16:36 +00:00
Jan Vesely	0750b7df51	native_cos: Switch implementation to llvm intrinsic Reviewer: Jeroen Ketema Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 317938	2017-11-10 22:16:33 +00:00
Jan Vesely	edbde58de0	native_exp2: Switch implementation to llvm intrinsic Reviewer: Jeroen Ketema Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 317937	2017-11-10 22:16:31 +00:00
Jan Vesely	504f85c551	native_exp: Switch implementation to llvm intrinsic Reviewer: Jeroen Ketema Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 317936	2017-11-10 22:16:28 +00:00
Jan Vesely	f58dee9f3a	native_log2: Switch to generic native intrinsic inc file v2: Add __CLC_XCONCAT instead of function name redirection Use __CLC_XCONCAT for intrinsic functions as well Reviewer: Jeroen Ketema Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 317932	2017-11-10 22:16:15 +00:00
Jan Vesely	39ef293533	tgamma: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317260	2017-11-02 19:49:00 +00:00
Jan Vesely	91d7b92d8a	tanh: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317259	2017-11-02 19:48:58 +00:00
Jan Vesely	e4d5d10076	tan: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317258	2017-11-02 19:48:57 +00:00
Jan Vesely	b0fab2696a	sqrt: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317257	2017-11-02 19:48:55 +00:00
Jan Vesely	e3802356e2	sinpi: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317256	2017-11-02 19:48:53 +00:00
Jan Vesely	4708b10878	sinh: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317255	2017-11-02 19:48:51 +00:00
Jan Vesely	a3febe3fa9	sin: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317254	2017-11-02 19:48:50 +00:00
Jan Vesely	25671b40d7	native_log: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317253	2017-11-02 19:48:48 +00:00
Jan Vesely	fd13434d83	native_log2: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317252	2017-11-02 19:48:46 +00:00
Jan Vesely	d6ad07687d	native_log10: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317251	2017-11-02 19:48:44 +00:00
Jan Vesely	139185dfc7	log: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317250	2017-11-02 19:48:43 +00:00
Jan Vesely	27dffff6e8	logb: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317249	2017-11-02 19:48:41 +00:00
Jan Vesely	7fc23fbdcb	log2: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317248	2017-11-02 19:48:39 +00:00
Jan Vesely	a9132ce347	log1p: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317247	2017-11-02 19:48:37 +00:00
Jan Vesely	4e062cb74e	lgamma: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317246	2017-11-02 19:48:35 +00:00
Jan Vesely	4cb612e140	exp2: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317245	2017-11-02 19:48:33 +00:00
Jan Vesely	e99ba9a23d	cospi: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317244	2017-11-02 19:48:31 +00:00
Jan Vesely	c708278f13	cosh: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317243	2017-11-02 19:48:30 +00:00
Jan Vesely	f76371d948	cos: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317242	2017-11-02 19:48:27 +00:00
Jan Vesely	50a3cccdbe	cbrt: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317241	2017-11-02 19:48:25 +00:00
Jan Vesely	a4df39bcad	atanpi: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317240	2017-11-02 19:48:23 +00:00
Jan Vesely	1bd2ac257a	atanh: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317239	2017-11-02 19:48:22 +00:00
Jan Vesely	0942b5e1bf	atan: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317238	2017-11-02 19:48:20 +00:00
Jan Vesely	d3d5e322e3	asinpi: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317237	2017-11-02 19:48:18 +00:00
Jan Vesely	48bda32986	asinh: Use unary_dec instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317236	2017-11-02 19:48:16 +00:00
Jan Vesely	ba4b98c691	asin: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317235	2017-11-02 19:48:15 +00:00
Jan Vesely	61171847b7	acospi: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317234	2017-11-02 19:48:13 +00:00
Jan Vesely	720783d9f5	acosh: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317233	2017-11-02 19:48:11 +00:00
Jan Vesely	caca914218	acos: Use unary_decl instead of custom inc file Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-By: Aaron Watry <awatry@gmail.com> llvm-svn: 317232	2017-11-02 19:48:06 +00:00
Jan Vesely	47e093da9b	math: Implement native_log10 Use llvm instrinsic by default Provide amdgpu workaround v2: drop old amd copyrights Reviewer: Aaron Watry Reviewed-by: Vedran Miletić <vedran@miletic.net> Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 316588	2017-10-25 16:49:22 +00:00
Jan Vesely	7ab2d0bdcd	shared: Implement aligned vector stores (vstorea_half) Float version passes newly posted piglit tests on turks, float and double pass on carrizo. v2: scalar vstorea_half v3: fix typo Reviewer: Aaron Watry Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 316291	2017-10-22 14:21:59 +00:00
Jan Vesely	12061c7125	shared: Implement aligned vector loads (vloada_half) Passes newly posted piglits on turks and carrizo v2: add scalar vloada_half v3: fix typo Reviewer: Aaron Watry Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 316290	2017-10-22 14:21:56 +00:00
Jan Vesely	1de1444d62	Do not include clc_nextafter header globally Drop unused clc/math/clc_nextafter.h header Reviewer: Jeroen Ketema Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 315190	2017-10-08 19:33:58 +00:00
Jan Vesely	6a5c8ddb3a	math/nextafter: Use custom declaration inc file Reviewer: Jeroen Ketema Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 315189	2017-10-08 19:33:55 +00:00
Jan Vesely	72be1cc0be	math/binary_decl.inc: Do not declare mixed float/double functions fmin/fmax only need vector/scalar mix Reviewer: Jeroen Ketema Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 315188	2017-10-08 19:33:53 +00:00
Jan Vesely	beb6591753	ldexp: Fix double precision function return type Fixes ~1200 external calls from nvtpx library. Reviewer: Jeroen Ketema Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 315170	2017-10-08 06:56:14 +00:00
Jeroen Ketema	fe9fa89854	Let get_work_dim take exactly 0 arguments Reviewed-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 314634	2017-10-01 20:11:46 +00:00
Jeroen Ketema	17fdf263c5	Do no circularly define NULL Reviewed-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 314633	2017-10-01 20:10:14 +00:00
Jan Vesely	41b1500db0	geometric: geometric functions are only supported for vector lengths <=4 Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-by: Aaron Watry <awatry@gmail.com> llvm-svn: 314545	2017-09-29 19:06:47 +00:00
Jan Vesely	c9bbbe2403	Implement cl_khr_int64_extended_atomics builtins Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-by: Aaron Watry <awatry@gmail.com> Tested-by: Aaron Watry <awatry@gmail.com> llvm-svn: 313811	2017-09-20 20:42:19 +00:00
Jan Vesely	1c81f4b0e3	Implement cl_khr_int64_base_atomics builtins Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-by: Aaron Watry <awatry@gmail.com> Tested-by: Aaron Watry <awatry@gmail.com> llvm-svn: 313810	2017-09-20 20:42:14 +00:00
Aaron Watry	e62f5fa64d	Add native_recip(x) as ((1)/(x)) Signed-off-by: Aaron Watry <awatry@gmail.com> Acked-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 313107	2017-09-13 01:40:25 +00:00
Aaron Watry	415a60f303	integer: Add popcount implementation using ctpop intrinsic Also copy/modify the unary_intrin.inc from math/ to make the intrinsic declaration somewhat reusable. Passes CL CTS integer_ops/test_integer_ops popcount tests for CL 1.2 Tested-by on GCN 1.0 (Pitcairn) Signed-off-by: Aaron Watry <awatry@gmail.com> Reviewed-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 312854	2017-09-09 02:23:54 +00:00
Jan Vesely	285d2fb85c	Implement vload_half{,n} and vload(half) v2: add vload(half) as well make helpers amdgpu specific (NVPTX uses different private AS numbering) use clang builtin on clang >= 6 Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-by: Tom Stellard <tstellar@redhat.com> llvm-svn: 312839	2017-09-08 23:59:00 +00:00
Jan Vesely	661ac03a1b	vstore: Cleanup and add vstore(half) Add missing undefs Make helpers amdgpu specific (NVPTX uses different numbering for private AS) Use clang builtins on clang >= 6 Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-by: Tom Stellard <tstellar@redhat.com> llvm-svn: 312838	2017-09-08 23:58:57 +00:00
Jan Vesely	1796d590c1	Fixup clc.h comment Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 312491	2017-09-04 15:52:03 +00:00
Aaron Watry	0bf96b1712	relational: Implement shuffle2 builtin This was added in CL 1.1 Tested with a Radeon HD 7850 (Pitcairn) using the CL CTS via: test_conformance/relationals/test_relationals shuffle_built_in_dual_input v2: Add half support to shuffle2 Move shuffle2 to misc/ Signed-off-by: Aaron Watry <awatry@gmail.com> Reviewed-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 312404	2017-09-02 02:23:28 +00:00
Aaron Watry	880f15dae6	relational: Implement shuffle builtin This was added in CL 1.1 Tested with a Radeon HD 7850 (Pitcairn) using the CL CTS via: test_conformance/relationals/test_relationals shuffle_built_in v2: Add half-precision support to shuffle when available. Move to misc/ and add section 6.12.12 to clc.h Signed-off-by: Aaron Watry <awatry@gmail.com> Reviewed-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 312403	2017-09-02 02:23:26 +00:00
Aaron Watry	da8dfefd1c	Add halfN types and enable fp16 when generating builtin declarations Uses the same mechanism to enable fp16 as we use for fp64 when processing clc.h Signed-off-by: Aaron Watry <awatry@gmail.com> Reviewed-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 312402	2017-09-02 02:23:16 +00:00
Jan Vesely	1977092dc3	amdgcn: Implement {read_,write_,}mem_fence builtin v2: add more detailed comment about waitcnt instruction Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-by: Aaron Watry <awatry@gmail.com> Tested-by: Aaron Watry <awatry@gmail.com> llvm-svn: 311021	2017-08-16 17:08:56 +00:00
Jan Vesely	09f0a560e1	add __kernel_exec macros also consolidate macros into one file, and rename to clcmacros.h Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-by: Aaron Watry <awatry@gmail.com> llvm-svn: 309358	2017-07-28 03:39:03 +00:00
Jan Vesely	2f2a3bc0dc	generic: add missing get_work_dim include Fixes few piglits since clang r304193 Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> Reviewed-by: Aaron Watry <awatry@gmail.com> llvm-svn: 304556	2017-06-02 15:58:35 +00:00
Jan Vesely	9f7172965c	math: Implement sinh function mostly copied form amd_builtins llvm-svn: 296233	2017-02-25 02:46:53 +00:00
Aaron Watry	dfec3c8e95	math: Add native_tan as wrapper to tan Trivially define native_tan as a redirect to tan. If there are any targets with a native implementation, we can deal with it later. Signed-off-by: Aaron Watry <awatry@gmail.com> Reviewed-by: Matt Arsenault <arsenm2@gmail.com> llvm-svn: 295920	2017-02-23 01:46:57 +00:00
Jeroen Ketema	ed98e8d099	Add the correct prefixes to the cl_khr_fp64 pragma llvm-svn: 294915	2017-02-12 21:31:41 +00:00
Matt Arsenault	9df2b9781c	math: Add native_rsqrt builtin function Trivial define to rsqrt. Patch by Vedran Miletić <vedran@miletic.net> llvm-svn: 294608	2017-02-09 18:39:26 +00:00
Aaron Watry	c606efabb7	math: Add logb builtin Ported from the amd-builtins branch. Signed-off-by: Aaron Watry <awatry@gmail.com> Reviewed-by: Matt Arsenault <Matthew.Arsenault@amd.com> CC: Tom Stellard <thomas.stellard@amd.com> llvm-svn: 292335	2017-01-18 03:14:10 +00:00
Aaron Watry	900bd7eb7f	math: Add expm1 builtin function Ported from the amd-builtins branch. Signed-off-by: Aaron Watry <awatry@gmail.com> Reviewed-by: Matt Arsenault <Matthew.Arsenault@amd.com> CC: Tom Stellard <thomas.stellard@amd.com> llvm-svn: 292334	2017-01-18 03:13:37 +00:00
Aaron Watry	af569547fa	math: Implement tgamma Signed-off-by: Aaron Watry <awatry@gmail.com> Reviewed-by: Tom Stellard <thomas.stellard@amd.com> llvm-svn: 281566	2016-09-15 00:17:34 +00:00
Aaron Watry	e9009cdd21	math: Implement lgamma Just use lgamma_r and ignore the value returned in the second argument Signed-off-by: Aaron Watry <awatry@gmail.com> Reviewed-by: Tom Stellard <thomas.stellard@amd.com> llvm-svn: 281565	2016-09-15 00:17:31 +00:00
Aaron Watry	0ab07e1bde	math: Implement lgamma_r Ported from the amd-builtins branch, which is itself based on the Sun Microsystems implementation. Signed-off-by: Aaron Watry <awatry@gmail.com> Reviewed-by: Tom Stellard <thomas.stellard@amd.com> llvm-svn: 281564	2016-09-15 00:17:28 +00:00
Jan Vesely	ad8672727c	Implement vstore_half{,n} Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 278962	2016-08-17 20:02:11 +00:00
Tom Stellard	d835b3f1af	Implement cbrt builtin This implementation was ported from the AMD builtin library and has been tested with piglit, OpenCV, and the ocl conformance tests. llvm-svn: 276497	2016-07-22 23:45:15 +00:00
Tom Stellard	9cb070f96a	Implement cosh builtin This implementation was ported from the AMD builtin library and has been tested with piglit, OpenCV, and the ocl conformance tests. llvm-svn: 276496	2016-07-22 23:45:13 +00:00
Tom Stellard	ff13926a60	geometric/floatn.inc: Add vec8 and vec16 types llvm-svn: 276495	2016-07-22 23:45:11 +00:00
Jan Vesely	a82e080b57	AMDGPU: Implement get_global_offset builtin Also fix get_global_id to consider offset No idea how to add this for ptx, so they are stuck with the old get_global_id implementation. v2: split to a separate patch v3: Switch R600 to use implictarg.ptr Signed-off-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 276443	2016-07-22 17:24:24 +00:00
Jan Vesely	c374cb76f4	math: Add erf ported from amd-builtins The scalar float/double function bodies are a direct copy/paste, aside from the removed (optional) code in float function body that requires subnormals. reviewers: jvesely Patch by: Vedran Miletić <rivanvx@gmail.com> llvm-svn: 268766	2016-05-06 18:02:30 +00:00
Aaron Watry	55a8e0fd6d	math: Add fdim implementation Based on the amd-builtin, but explicitly vectorized for all sizes (not just float4), and includes a vectorized double implementation. Passes piglit (float) tests on pitcairn. Signed-off-by: Aaron Watry <awatry@gmail.com> Reviewed-by: Jan Vesely <jan.vesely@rutgers.edu> llvm-svn: 268708	2016-05-06 03:34:45 +00:00

1 2 3 4 5 ...

331 Commits