diff --git a/clang/lib/Headers/avx512fintrin.h b/clang/lib/Headers/avx512fintrin.h index 4730ef536cfa..340847dba81d 100644 --- a/clang/lib/Headers/avx512fintrin.h +++ b/clang/lib/Headers/avx512fintrin.h @@ -1,4 +1,4 @@ -/*===---- avx512fintrin.h - AVX2 intrinsics -----------------------------------=== +/*===---- avx512fintrin.h - AVX2 intrinsics --------------------------------=== * * Permission is hereby granted, free of charge, to any person obtaining a copy * of this software and associated documentation files (the "Software"), to deal @@ -47,18 +47,18 @@ typedef unsigned short __mmask16; #define _MM_FROUND_CUR_DIRECTION 0x04 static __inline __m512 __attribute__ ((__always_inline__, __nodebug__)) - _mm512_setzero_ps (void) +_mm512_setzero_ps(void) { return (__m512){ 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0 }; } static __inline __m512d __attribute__ ((__always_inline__, __nodebug__)) -_mm512_setzero_pd (void) +_mm512_setzero_pd(void) { return (__m512d){ 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0 }; } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_setzero_si512 (void) +_mm512_setzero_si512(void) { return (__m512i)(__v8di){ 0, 0, 0, 0, 0, 0, 0, 0 }; } @@ -138,7 +138,7 @@ _mm512_rcp14_ps(__m512 __A) (__mmask16) -1); } static __inline__ __m128 __attribute__((__always_inline__, __nodebug__)) -_mm_rcp14_ss (__m128 __A, __m128 __B) +_mm_rcp14_ss(__m128 __A, __m128 __B) { return (__m128) __builtin_ia32_rcp14ss_mask ((__v4sf) __A, (__v4sf) __B, @@ -148,7 +148,7 @@ _mm_rcp14_ss (__m128 __A, __m128 __B) } static __inline__ __m128d __attribute__((__always_inline__, __nodebug__)) -_mm_rcp14_sd (__m128d __A, __m128d __B) +_mm_rcp14_sd(__m128d __A, __m128d __B) { return (__m128d) __builtin_ia32_rcp14sd_mask ((__v2df) __A, (__v2df) __B, @@ -202,7 +202,7 @@ _mm512_min_ps(__m512 __A, __m512 __B) } static __inline __m256i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_cvtps_ph (__m512 __A, const int __I) +_mm512_cvtps_ph(__m512 __A, const int __I) { return (__m256i) __builtin_ia32_vcvtps2ph512_mask ((__v16sf) __A, __I, @@ -212,7 +212,7 @@ _mm512_cvtps_ph (__m512 __A, const int __I) } static __inline __m512 __attribute__ ((__always_inline__, __nodebug__)) -_mm512_cvtph_ps (__m256i __A) +_mm512_cvtph_ps(__m256i __A) { return (__m512) __builtin_ia32_vcvtph2ps512_mask ((__v16hi) __A, (__v16sf) @@ -240,7 +240,7 @@ _mm512_cvttpd_epi32(__m512d a) } static __inline __m256i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_cvtt_roundpd_epi32 (__m512d __A, const int __R) +_mm512_cvtt_roundpd_epi32(__m512d __A, const int __R) { return (__m256i) __builtin_ia32_cvttpd2dq512_mask ((__v8df) __A, (__v8si) @@ -249,7 +249,7 @@ _mm512_cvtt_roundpd_epi32 (__m512d __A, const int __R) __R); } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_cvtt_roundps_epi32 (__m512 __A, const int __R) +_mm512_cvtt_roundps_epi32(__m512 __A, const int __R) { return (__m512i) __builtin_ia32_cvttps2dq512_mask ((__v16sf) __A, (__v16si) @@ -259,7 +259,7 @@ _mm512_cvtt_roundps_epi32 (__m512 __A, const int __R) } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_cvt_roundps_epi32 (__m512 __A, const int __R) +_mm512_cvt_roundps_epi32(__m512 __A, const int __R) { return (__m512i) __builtin_ia32_cvtps2dq512_mask ((__v16sf) __A, (__v16si) @@ -268,7 +268,7 @@ _mm512_cvt_roundps_epi32 (__m512 __A, const int __R) __R); } static __inline __m256i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_cvt_roundpd_epi32 (__m512d __A, const int __R) +_mm512_cvt_roundpd_epi32(__m512d __A, const int __R) { return (__m256i) __builtin_ia32_cvtpd2dq512_mask ((__v8df) __A, (__v8si) @@ -277,7 +277,7 @@ _mm512_cvt_roundpd_epi32 (__m512d __A, const int __R) __R); } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_cvt_roundps_epu32 (__m512 __A, const int __R) +_mm512_cvt_roundps_epu32(__m512 __A, const int __R) { return (__m512i) __builtin_ia32_cvtps2udq512_mask ((__v16sf) __A, (__v16si) @@ -286,7 +286,7 @@ _mm512_cvt_roundps_epu32 (__m512 __A, const int __R) __R); } static __inline __m256i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_cvt_roundpd_epu32 (__m512d __A, const int __R) +_mm512_cvt_roundpd_epu32(__m512d __A, const int __R) { return (__m256i) __builtin_ia32_cvtpd2udq512_mask ((__v8df) __A, (__v8si) @@ -296,14 +296,14 @@ _mm512_cvt_roundpd_epu32 (__m512d __A, const int __R) } static __inline __m512 __attribute__ ((__always_inline__, __nodebug__)) -_mm512_roundscale_ps (__m512 __A, const int __imm) +_mm512_roundscale_ps(__m512 __A, const int __imm) { return (__m512) __builtin_ia32_rndscaleps_mask ((__v16sf) __A, __imm, (__v16sf) __A, -1, _MM_FROUND_CUR_DIRECTION); } static __inline __m512d __attribute__ ((__always_inline__, __nodebug__)) -_mm512_roundscale_pd (__m512d __A, const int __imm) +_mm512_roundscale_pd(__m512d __A, const int __imm) { return (__m512d) __builtin_ia32_rndscalepd_mask ((__v8df) __A, __imm, (__v8df) __A, -1, @@ -311,7 +311,7 @@ _mm512_roundscale_pd (__m512d __A, const int __imm) } static __inline __mmask16 __attribute__ ((__always_inline__, __nodebug__)) -_mm512_cmp_ps_mask (__m512 a, __m512 b, const int p) +_mm512_cmp_ps_mask(__m512 a, __m512 b, const int p) { return (__mmask16) __builtin_ia32_cmpps512_mask ((__v16sf) a, (__v16sf) b, p, (__mmask16) -1, @@ -319,7 +319,7 @@ _mm512_cmp_ps_mask (__m512 a, __m512 b, const int p) } static __inline __mmask8 __attribute__ ((__always_inline__, __nodebug__)) -_mm512_cmp_pd_mask (__m512d __X, __m512d __Y, const int __P) +_mm512_cmp_pd_mask(__m512d __X, __m512d __Y, const int __P) { return (__mmask8) __builtin_ia32_cmppd512_mask ((__v8df) __X, (__v8df) __Y, __P, @@ -328,7 +328,7 @@ _mm512_cmp_pd_mask (__m512d __X, __m512d __Y, const int __P) } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_cvttps_epu32 (__m512 __A) +_mm512_cvttps_epu32(__m512 __A) { return (__m512i) __builtin_ia32_cvttps2udq512_mask ((__v16sf) __A, (__v16si) @@ -338,7 +338,7 @@ _mm512_cvttps_epu32 (__m512 __A) } static __inline __m512 __attribute__ (( __always_inline__, __nodebug__)) -_mm512_cvt_roundepi32_ps (__m512i __A, const int __R) +_mm512_cvt_roundepi32_ps(__m512i __A, const int __R) { return (__m512) __builtin_ia32_cvtdq2ps512_mask ((__v16si) __A, (__v16sf) @@ -348,7 +348,7 @@ _mm512_cvt_roundepi32_ps (__m512i __A, const int __R) } static __inline __m512 __attribute__ (( __always_inline__, __nodebug__)) -_mm512_cvt_roundepu32_ps (__m512i __A, const int __R) +_mm512_cvt_roundepu32_ps(__m512i __A, const int __R) { return (__m512) __builtin_ia32_cvtudq2ps512_mask ((__v16si) __A, (__v16sf) @@ -358,7 +358,7 @@ _mm512_cvt_roundepu32_ps (__m512i __A, const int __R) } static __inline __m512d __attribute__ (( __always_inline__, __nodebug__)) -_mm512_cvtepi32_pd (__m256i __A) +_mm512_cvtepi32_pd(__m256i __A) { return (__m512d) __builtin_ia32_cvtdq2pd512_mask ((__v8si) __A, (__v8df) @@ -367,7 +367,7 @@ _mm512_cvtepi32_pd (__m256i __A) } static __inline __m512d __attribute__ (( __always_inline__, __nodebug__)) -_mm512_cvtepu32_pd (__m256i __A) +_mm512_cvtepu32_pd(__m256i __A) { return (__m512d) __builtin_ia32_cvtudq2pd512_mask ((__v8si) __A, (__v8df) @@ -375,7 +375,7 @@ _mm512_cvtepu32_pd (__m256i __A) (__mmask8) -1); } static __inline __m256 __attribute__ (( __always_inline__, __nodebug__)) -_mm512_cvt_roundpd_ps (__m512d __A, const int __R) +_mm512_cvt_roundpd_ps(__m512d __A, const int __R) { return (__m256) __builtin_ia32_cvtpd2ps512_mask ((__v8df) __A, (__v8sf) @@ -385,7 +385,7 @@ _mm512_cvt_roundpd_ps (__m512d __A, const int __R) } static __inline __m512i __attribute__ (( __always_inline__, __nodebug__)) -_mm512_abs_epi64 (__m512i __A) +_mm512_abs_epi64(__m512i __A) { return (__m512i) __builtin_ia32_pabsq512_mask ((__v8di) __A, (__v8di) @@ -394,7 +394,7 @@ _mm512_abs_epi64 (__m512i __A) } static __inline __m512i __attribute__ (( __always_inline__, __nodebug__)) -_mm512_abs_epi32 (__m512i __A) +_mm512_abs_epi32(__m512i __A) { return (__m512i) __builtin_ia32_pabsd512_mask ((__v16si) __A, (__v16si) @@ -404,7 +404,7 @@ _mm512_abs_epi32 (__m512i __A) static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_max_epi32 (__m512i __A, __m512i __B) +_mm512_max_epi32(__m512i __A, __m512i __B) { return (__m512i) __builtin_ia32_pmaxsd512_mask ((__v16si) __A, (__v16si) __B, @@ -414,7 +414,7 @@ _mm512_max_epi32 (__m512i __A, __m512i __B) } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_max_epu32 (__m512i __A, __m512i __B) +_mm512_max_epu32(__m512i __A, __m512i __B) { return (__m512i) __builtin_ia32_pmaxud512_mask ((__v16si) __A, (__v16si) __B, @@ -424,7 +424,7 @@ _mm512_max_epu32 (__m512i __A, __m512i __B) } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_max_epi64 (__m512i __A, __m512i __B) +_mm512_max_epi64(__m512i __A, __m512i __B) { return (__m512i) __builtin_ia32_pmaxsq512_mask ((__v8di) __A, (__v8di) __B, @@ -434,7 +434,7 @@ _mm512_max_epi64 (__m512i __A, __m512i __B) } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_max_epu64 (__m512i __A, __m512i __B) +_mm512_max_epu64(__m512i __A, __m512i __B) { return (__m512i) __builtin_ia32_pmaxuq512_mask ((__v8di) __A, (__v8di) __B, @@ -444,7 +444,7 @@ _mm512_max_epu64 (__m512i __A, __m512i __B) } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_min_epi32 (__m512i __A, __m512i __B) +_mm512_min_epi32(__m512i __A, __m512i __B) { return (__m512i) __builtin_ia32_pminsd512_mask ((__v16si) __A, (__v16si) __B, @@ -454,7 +454,7 @@ _mm512_min_epi32 (__m512i __A, __m512i __B) } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_min_epu32 (__m512i __A, __m512i __B) +_mm512_min_epu32(__m512i __A, __m512i __B) { return (__m512i) __builtin_ia32_pminud512_mask ((__v16si) __A, (__v16si) __B, @@ -464,7 +464,7 @@ _mm512_min_epu32 (__m512i __A, __m512i __B) } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_min_epi64 (__m512i __A, __m512i __B) +_mm512_min_epi64(__m512i __A, __m512i __B) { return (__m512i) __builtin_ia32_pminsq512_mask ((__v8di) __A, (__v8di) __B, @@ -474,7 +474,7 @@ _mm512_min_epi64 (__m512i __A, __m512i __B) } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_min_epu64 (__m512i __A, __m512i __B) +_mm512_min_epu64(__m512i __A, __m512i __B) { return (__m512i) __builtin_ia32_pminuq512_mask ((__v8di) __A, (__v8di) __B, @@ -484,7 +484,7 @@ _mm512_min_epu64 (__m512i __A, __m512i __B) } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_mul_epi32 (__m512i __X, __m512i __Y) +_mm512_mul_epi32(__m512i __X, __m512i __Y) { return (__m512i) __builtin_ia32_pmuldq512_mask ((__v16si) __X, (__v16si) __Y, @@ -494,7 +494,7 @@ _mm512_mul_epi32 (__m512i __X, __m512i __Y) } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_mul_epu32 (__m512i __X, __m512i __Y) +_mm512_mul_epu32(__m512i __X, __m512i __Y) { return (__m512i) __builtin_ia32_pmuludq512_mask ((__v16si) __X, (__v16si) __Y, @@ -504,7 +504,7 @@ _mm512_mul_epu32 (__m512i __X, __m512i __Y) } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_mask_blend_epi64 (__mmask8 __U, __m512i __A, __m512i __W) +_mm512_mask_blend_epi64(__mmask8 __U, __m512i __A, __m512i __W) { return (__m512i) __builtin_ia32_blendmq_512_mask ((__v8di) __A, (__v8di) __W, @@ -512,7 +512,7 @@ _mm512_mask_blend_epi64 (__mmask8 __U, __m512i __A, __m512i __W) } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_mask_blend_epi32 (__mmask16 __U, __m512i __A, __m512i __W) +_mm512_mask_blend_epi32(__mmask16 __U, __m512i __A, __m512i __W) { return (__m512i) __builtin_ia32_blendmd_512_mask ((__v16si) __A, (__v16si) __W, @@ -520,7 +520,7 @@ _mm512_mask_blend_epi32 (__mmask16 __U, __m512i __A, __m512i __W) } static __inline __mmask16 __attribute__ ((__always_inline__, __nodebug__)) -_mm512_test_epi32_mask (__m512i __A, __m512i __B) +_mm512_test_epi32_mask(__m512i __A, __m512i __B) { return (__mmask16) __builtin_ia32_ptestmd512 ((__v16si) __A, (__v16si) __B, @@ -528,7 +528,7 @@ _mm512_test_epi32_mask (__m512i __A, __m512i __B) } static __inline __mmask8 __attribute__ ((__always_inline__, __nodebug__)) -_mm512_test_epi64_mask (__m512i __A, __m512i __B) +_mm512_test_epi64_mask(__m512i __A, __m512i __B) { return (__mmask8) __builtin_ia32_ptestmq512 ((__v8di) __A, (__v8di) __B, @@ -536,7 +536,7 @@ _mm512_test_epi64_mask (__m512i __A, __m512i __B) } static __inline __m512d __attribute__ ((__always_inline__, __nodebug__)) -_mm512_mask_blend_pd (__mmask8 __U, __m512d __A, __m512d __W) +_mm512_mask_blend_pd(__mmask8 __U, __m512d __A, __m512d __W) { return (__m512d) __builtin_ia32_blendmpd_512_mask ((__v8df) __A, (__v8df) __W, @@ -544,7 +544,7 @@ _mm512_mask_blend_pd (__mmask8 __U, __m512d __A, __m512d __W) } static __inline __m512 __attribute__ ((__always_inline__, __nodebug__)) -_mm512_mask_blend_ps (__mmask16 __U, __m512 __A, __m512 __W) +_mm512_mask_blend_ps(__mmask16 __U, __m512 __A, __m512 __W) { return (__m512) __builtin_ia32_blendmps_512_mask ((__v16sf) __A, (__v16sf) __W, @@ -552,7 +552,7 @@ _mm512_mask_blend_ps (__mmask16 __U, __m512 __A, __m512 __W) } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_maskz_set1_epi32 (__mmask16 __M, int __A) +_mm512_maskz_set1_epi32(__mmask16 __M, int __A) { return (__m512i) __builtin_ia32_pbroadcastd512_gpr_mask (__A, (__v16si) @@ -561,7 +561,7 @@ _mm512_maskz_set1_epi32 (__mmask16 __M, int __A) } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_maskz_set1_epi64 (__mmask8 __M, long long __A) +_mm512_maskz_set1_epi64(__mmask8 __M, long long __A) { #ifdef __x86_64__ return (__m512i) __builtin_ia32_pbroadcastq512_gpr_mask (__A, @@ -577,7 +577,7 @@ _mm512_maskz_set1_epi64 (__mmask8 __M, long long __A) } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_maskz_loadu_epi32 (__mmask16 __U, void const *__P) +_mm512_maskz_loadu_epi32(__mmask16 __U, void const *__P) { return (__m512i) __builtin_ia32_loaddqusi512_mask ((const __v16si *)__P, (__v16si) @@ -586,7 +586,7 @@ _mm512_maskz_loadu_epi32 (__mmask16 __U, void const *__P) } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_maskz_loadu_epi64 (__mmask8 __U, void const *__P) +_mm512_maskz_loadu_epi64(__mmask8 __U, void const *__P) { return (__m512i) __builtin_ia32_loaddqudi512_mask ((const __v8di *)__P, (__v8di) @@ -595,7 +595,7 @@ _mm512_maskz_loadu_epi64 (__mmask8 __U, void const *__P) } static __inline __m512 __attribute__ ((__always_inline__, __nodebug__)) -_mm512_maskz_loadu_ps (__mmask16 __U, void const *__P) +_mm512_maskz_loadu_ps(__mmask16 __U, void const *__P) { return (__m512) __builtin_ia32_loadups512_mask ((const __v16sf *)__P, (__v16sf) @@ -604,7 +604,7 @@ _mm512_maskz_loadu_ps (__mmask16 __U, void const *__P) } static __inline __m512d __attribute__ ((__always_inline__, __nodebug__)) -_mm512_maskz_loadu_pd (__mmask8 __U, void const *__P) +_mm512_maskz_loadu_pd(__mmask8 __U, void const *__P) { return (__m512d) __builtin_ia32_loadupd512_mask ((const __v8df *)__P, (__v8df) @@ -613,34 +613,34 @@ _mm512_maskz_loadu_pd (__mmask8 __U, void const *__P) } static __inline void __attribute__ ((__always_inline__, __nodebug__)) -_mm512_mask_storeu_epi64 (void *__P, __mmask8 __U, __m512i __A) +_mm512_mask_storeu_epi64(void *__P, __mmask8 __U, __m512i __A) { __builtin_ia32_storedqudi512_mask ((__v8di *)__P, (__v8di) __A, (__mmask8) __U); } static __inline void __attribute__ ((__always_inline__, __nodebug__)) -_mm512_mask_storeu_epi32 (void *__P, __mmask16 __U, __m512i __A) +_mm512_mask_storeu_epi32(void *__P, __mmask16 __U, __m512i __A) { __builtin_ia32_storedqusi512_mask ((__v16si *)__P, (__v16si) __A, (__mmask16) __U); } static __inline void __attribute__ ((__always_inline__, __nodebug__)) -_mm512_mask_storeu_pd (void *__P, __mmask8 __U, __m512d __A) +_mm512_mask_storeu_pd(void *__P, __mmask8 __U, __m512d __A) { __builtin_ia32_storeupd512_mask ((__v8df *)__P, (__v8df) __A, (__mmask8) __U); } static __inline void __attribute__ ((__always_inline__, __nodebug__)) -_mm512_mask_storeu_ps (void *__P, __mmask16 __U, __m512 __A) +_mm512_mask_storeu_ps(void *__P, __mmask16 __U, __m512 __A) { __builtin_ia32_storeups512_mask ((__v16sf *)__P, (__v16sf) __A, (__mmask16) __U); } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_permutex2var_epi32 (__m512i __A, __m512i __I, __m512i __B) +_mm512_permutex2var_epi32(__m512i __A, __m512i __I, __m512i __B) { return (__m512i) __builtin_ia32_vpermt2vard512_mask ((__v16si) __I /* idx */ , @@ -649,7 +649,7 @@ _mm512_permutex2var_epi32 (__m512i __A, __m512i __I, __m512i __B) (__mmask16) -1); } static __inline __m512i __attribute__ ((__always_inline__, __nodebug__)) -_mm512_permutex2var_epi64 (__m512i __A, __m512i __I, __m512i __B) +_mm512_permutex2var_epi64(__m512i __A, __m512i __I, __m512i __B) { return (__m512i) __builtin_ia32_vpermt2varq512_mask ((__v8di) __I /* idx */ , @@ -659,7 +659,7 @@ _mm512_permutex2var_epi64 (__m512i __A, __m512i __I, __m512i __B) } static __inline __m512d __attribute__ ((__always_inline__, __nodebug__)) -_mm512_permutex2var_pd (__m512d __A, __m512i __I, __m512d __B) +_mm512_permutex2var_pd(__m512d __A, __m512i __I, __m512d __B) { return (__m512d) __builtin_ia32_vpermt2varpd512_mask ((__v8di) __I /* idx */ , @@ -668,7 +668,7 @@ _mm512_permutex2var_pd (__m512d __A, __m512i __I, __m512d __B) (__mmask8) -1); } static __inline __m512 __attribute__ ((__always_inline__, __nodebug__)) -_mm512_permutex2var_ps (__m512 __A, __m512i __I, __m512 __B) +_mm512_permutex2var_ps(__m512 __A, __m512i __I, __m512 __B) { return (__m512) __builtin_ia32_vpermt2varps512_mask ((__v16si) __I /* idx */ , @@ -678,7 +678,7 @@ _mm512_permutex2var_ps (__m512 __A, __m512i __I, __m512 __B) } static __inline __m512 __attribute__ ((__always_inline__, __nodebug__)) -_mm512_floor_ps (__m512 __A) +_mm512_floor_ps(__m512 __A) { return (__m512) __builtin_ia32_rndscaleps_mask ((__v16sf) __A, _MM_FROUND_FLOOR, @@ -687,7 +687,7 @@ _mm512_floor_ps (__m512 __A) } static __inline __m512d __attribute__ ((__always_inline__, __nodebug__)) -_mm512_floor_pd (__m512d __A) +_mm512_floor_pd(__m512d __A) { return (__m512d) __builtin_ia32_rndscalepd_mask ((__v8df) __A, _MM_FROUND_FLOOR, @@ -696,7 +696,7 @@ _mm512_floor_pd (__m512d __A) } static __inline __m512 __attribute__ ((__always_inline__, __nodebug__)) -_mm512_ceil_ps (__m512 __A) +_mm512_ceil_ps(__m512 __A) { return (__m512) __builtin_ia32_rndscaleps_mask ((__v16sf) __A, _MM_FROUND_CEIL, @@ -705,7 +705,7 @@ _mm512_ceil_ps (__m512 __A) } static __inline __m512d __attribute__ ((__always_inline__, __nodebug__)) -_mm512_ceil_pd (__m512d __A) +_mm512_ceil_pd(__m512d __A) { return (__m512d) __builtin_ia32_rndscalepd_mask ((__v8df) __A, _MM_FROUND_CEIL,