forked from OSchip/llvm-project
parent
e99b27f35e
commit
235a365d58
|
@ -527,5 +527,10 @@ BUILTIN(__builtin_ia32_pmovzxbq256, "V4LLiV16c", "")
|
|||
BUILTIN(__builtin_ia32_pmovzxwd256, "V8iV8s", "")
|
||||
BUILTIN(__builtin_ia32_pmovzxwq256, "V4LLiV8s", "")
|
||||
BUILTIN(__builtin_ia32_pmovzxdq256, "V4LLiV4i", "")
|
||||
BUILTIN(__builtin_ia32_pmuldq256, "V4LLiV8iV8i", "")
|
||||
BUILTIN(__builtin_ia32_pmulhrsw256, "V16sV16sV16s", "")
|
||||
BUILTIN(__builtin_ia32_pmulhuw256, "V16sV16sV16s", "")
|
||||
BUILTIN(__builtin_ia32_pmulhw256, "V16sV16sV16s", "")
|
||||
BUILTIN(__builtin_ia32_pmuludq256, "V4LLiV8iV8i", "")
|
||||
|
||||
#undef BUILTIN
|
||||
|
|
|
@ -405,6 +405,48 @@ _mm256_cvtepu32_epi64(__m128i __V)
|
|||
return (__m256i)__builtin_ia32_pmovzxdq256((__v4si)__V);
|
||||
}
|
||||
|
||||
static __inline__ __m256i __attribute__((__always_inline__, __nodebug__))
|
||||
_mm256_mul_epi32(__m256i a, __m256i b)
|
||||
{
|
||||
return (__m256i)__builtin_ia32_pmuldq256((__v8si)a, (__v8si)b);
|
||||
}
|
||||
|
||||
static __inline__ __m256i __attribute__((__always_inline__, __nodebug__))
|
||||
_mm256_mulhrs_epi16(__m256i a, __m256i b)
|
||||
{
|
||||
return (__m256i)__builtin_ia32_pmulhrsw256((__v16hi)a, (__v16hi)b);
|
||||
}
|
||||
|
||||
static __inline__ __m256i __attribute__((__always_inline__, __nodebug__))
|
||||
_mm256_mulhi_epu16(__m256i a, __m256i b)
|
||||
{
|
||||
return (__m256i)__builtin_ia32_pmulhuw256((__v16hi)a, (__v16hi)b);
|
||||
}
|
||||
|
||||
static __inline__ __m256i __attribute__((__always_inline__, __nodebug__))
|
||||
_mm256_mulhi_epi16(__m256i a, __m256i b)
|
||||
{
|
||||
return (__m256i)__builtin_ia32_pmulhw256((__v16hi)a, (__v16hi)b);
|
||||
}
|
||||
|
||||
static __inline__ __m256i __attribute__((__always_inline__, __nodebug__))
|
||||
_mm256_mullo_epi16(__m256i a, __m256i b)
|
||||
{
|
||||
return (__m256i)((__v16hi)a * (__v16hi)b);
|
||||
}
|
||||
|
||||
static __inline__ __m256i __attribute__((__always_inline__, __nodebug__))
|
||||
_mm256_mullo_epi32 (__m256i a, __m256i b)
|
||||
{
|
||||
return (__m256i)((__v8si)a * (__v8si)b);
|
||||
}
|
||||
|
||||
static __inline__ __m256i __attribute__((__always_inline__, __nodebug__))
|
||||
_mm256_mul_epu32(__m256i a, __m256i b)
|
||||
{
|
||||
return __builtin_ia32_pmuludq256((__v8si)a, (__v8si)b);
|
||||
}
|
||||
|
||||
static __inline__ __m256i __attribute__((__always_inline__, __nodebug__))
|
||||
_mm256_or_si256(__m256i a, __m256i b)
|
||||
{
|
||||
|
|
|
@ -380,3 +380,38 @@ __m256 test_mm256_cvtepu32_epi64(__m128 a) {
|
|||
// CHECK: @llvm.x86.avx2.pmovzxdq
|
||||
return _mm256_cvtepu32_epi64(a);
|
||||
}
|
||||
|
||||
__m256 test_mm256_mul_epi32(__m256 a, __m256 b) {
|
||||
// CHECK: @llvm.x86.avx2.pmul.dq
|
||||
return _mm256_mul_epi32(a, b);
|
||||
}
|
||||
|
||||
__m256 test_mm256_mulhrs_epi16(__m256 a, __m256 b) {
|
||||
// CHECK: @llvm.x86.avx2.pmul.hr.sw
|
||||
return _mm256_mulhrs_epi16(a, b);
|
||||
}
|
||||
|
||||
__m256 test_mm256_mulhi_epu16(__m256 a, __m256 b) {
|
||||
// CHECK: @llvm.x86.avx2.pmulhu.w
|
||||
return _mm256_mulhi_epu16(a, b);
|
||||
}
|
||||
|
||||
__m256 test_mm256_mulhi_epi16(__m256 a, __m256 b) {
|
||||
// CHECK: @llvm.x86.avx2.pmulh.w
|
||||
return _mm256_mulhi_epi16(a, b);
|
||||
}
|
||||
|
||||
__m256 test_mm256_mullo_epi16(__m256 a, __m256 b) {
|
||||
// CHECK: mul <16 x i16>
|
||||
return _mm256_mullo_epi16(a, b);
|
||||
}
|
||||
|
||||
__m256 test_mm256_mullo_epi32(__m256 a, __m256 b) {
|
||||
// CHECK: mul <8 x i32>
|
||||
return _mm256_mullo_epi32(a, b);
|
||||
}
|
||||
|
||||
__m256 test_mm256_mul_epu32(__m256 a, __m256 b) {
|
||||
// CHECK: @llvm.x86.avx2.pmulu.dq
|
||||
return _mm256_mul_epu32(a, b);
|
||||
}
|
||||
|
|
Loading…
Reference in New Issue