forked from OSchip/llvm-project
[clang][AVX512][Builtin] Adding intrinsics for the SAD instruction set.
Differential Revision: http://reviews.llvm.org/D19591 llvm-svn: 267942
This commit is contained in:
parent
257fe3ab99
commit
de8d3753d3
|
@ -2214,6 +2214,10 @@ TARGET_BUILTIN(__builtin_ia32_movntps512, "vf*V16f","","avx512f")
|
|||
TARGET_BUILTIN(__builtin_ia32_palignr512_mask, "V64cV64cV64ciV64cULLi","","avx512bw")
|
||||
TARGET_BUILTIN(__builtin_ia32_palignr128_mask, "V16cV16cV16ciV16cUs","","avx512bw,avx512vl")
|
||||
TARGET_BUILTIN(__builtin_ia32_palignr256_mask, "V32cV32cV32ciV32cUi","","avx512bw,avx512vl")
|
||||
TARGET_BUILTIN(__builtin_ia32_dbpsadbw128_mask, "V8sV16cV16cIiV8sUc","","avx512bw,avx512vl")
|
||||
TARGET_BUILTIN(__builtin_ia32_dbpsadbw256_mask, "V16sV32cV32cIiV16sUs","","avx512bw,avx512vl")
|
||||
TARGET_BUILTIN(__builtin_ia32_dbpsadbw512_mask, "V32sV64cV64cIiV32sUi","","avx512bw")
|
||||
TARGET_BUILTIN(__builtin_ia32_psadbw512, "V8LLiV64cV64c","","avx512bw")
|
||||
|
||||
|
||||
#undef BUILTIN
|
||||
|
|
|
@ -2191,6 +2191,39 @@ __builtin_ia32_palignr512_mask ((__v8di) __A,\
|
|||
(__mmask64) __U);\
|
||||
})
|
||||
|
||||
#define _mm512_dbsad_epu8( __A, __B, __imm) __extension__ ({\
|
||||
__builtin_ia32_dbpsadbw512_mask ((__v64qi) __A,\
|
||||
(__v64qi) __B,\
|
||||
__imm,\
|
||||
(__v32hi) _mm512_undefined_epi32(),\
|
||||
(__mmask32) -1);\
|
||||
})
|
||||
|
||||
#define _mm512_mask_dbsad_epu8( __W, __U, __A, __B, __imm) ({\
|
||||
__builtin_ia32_dbpsadbw512_mask ((__v64qi) __A,\
|
||||
(__v64qi) __B,\
|
||||
__imm,\
|
||||
(__v32hi) __W,\
|
||||
(__mmask32) __U);\
|
||||
})
|
||||
|
||||
#define _mm512_maskz_dbsad_epu8( __U, __A, __B, __imm) ({\
|
||||
__builtin_ia32_dbpsadbw512_mask ((__v64qi) __A,\
|
||||
(__v64qi) __B,\
|
||||
__imm,\
|
||||
(__v32hi) _mm512_setzero_hi(),\
|
||||
(__mmask32) __U);\
|
||||
})
|
||||
|
||||
static __inline__ __m512i __DEFAULT_FN_ATTRS
|
||||
_mm512_sad_epu8 (__m512i __A, __m512i __B)
|
||||
{
|
||||
return (__m512i) __builtin_ia32_psadbw512 ((__v64qi) __A,
|
||||
(__v64qi) __B);
|
||||
}
|
||||
|
||||
|
||||
|
||||
#undef __DEFAULT_FN_ATTRS
|
||||
|
||||
#endif
|
||||
|
|
|
@ -3392,6 +3392,54 @@ __builtin_ia32_palignr256_mask ((__v4di)( __A),\
|
|||
(__mmask32)( __U));\
|
||||
})
|
||||
|
||||
#define _mm_dbsad_epu8( __A, __B, __imm) __extension__ ({ \
|
||||
__builtin_ia32_dbpsadbw128_mask ((__v16qi)( __A),\
|
||||
(__v16qi)( __B),\
|
||||
( __imm),\
|
||||
(__v8hi) _mm_setzero_hi (),\
|
||||
(__mmask8) -1);\
|
||||
})
|
||||
|
||||
#define _mm_mask_dbsad_epu8( __W, __U, __A, __B, __imm) __extension__ ({ \
|
||||
__builtin_ia32_dbpsadbw128_mask ((__v16qi)( __A),\
|
||||
(__v16qi)( __B),\
|
||||
( __imm),\
|
||||
(__v8hi)( __W),\
|
||||
(__mmask8)( __U));\
|
||||
})
|
||||
|
||||
#define _mm_maskz_dbsad_epu8( __U, __A, __B, __imm) __extension__ ({ \
|
||||
__builtin_ia32_dbpsadbw128_mask ((__v16qi)( __A),\
|
||||
(__v16qi)( __B),\
|
||||
( __imm),\
|
||||
(__v8hi) _mm_setzero_si128 (),\
|
||||
(__mmask8)( __U));\
|
||||
})
|
||||
|
||||
#define _mm256_dbsad_epu8( __A, __B, __imm) __extension__ ({ \
|
||||
__builtin_ia32_dbpsadbw256_mask ((__v32qi)( __A),\
|
||||
(__v32qi)( __B),\
|
||||
( __imm),\
|
||||
(__v16hi) _mm256_setzero_si256 (),\
|
||||
(__mmask16) -1);\
|
||||
})
|
||||
|
||||
#define _mm256_mask_dbsad_epu8( __W, __U, __A, __B, __imm) __extension__ ({ \
|
||||
__builtin_ia32_dbpsadbw256_mask ((__v32qi)( __A),\
|
||||
(__v32qi)( __B),\
|
||||
( __imm),\
|
||||
(__v16hi)( __W),\
|
||||
(__mmask16)( __U));\
|
||||
})
|
||||
|
||||
#define _mm256_maskz_dbsad_epu8( __U, __A, __B, __imm) __extension__ ({ \
|
||||
__builtin_ia32_dbpsadbw256_mask ((__v32qi)( __A),\
|
||||
(__v32qi)( __B),\
|
||||
( __imm),\
|
||||
(__v16hi) _mm256_setzero_si256 (),\
|
||||
(__mmask16)( __U));\
|
||||
})
|
||||
|
||||
#undef __DEFAULT_FN_ATTRS
|
||||
|
||||
#endif /* __AVX512VLBWINTRIN_H */
|
||||
|
|
|
@ -1507,3 +1507,26 @@ __m512i test_mm512_maskz_alignr_epi8(__mmask64 __U, __m512i __A,__m512i __B){
|
|||
|
||||
|
||||
|
||||
__m512i test_mm512_mm_dbsad_epu8(__m512i __A, __m512i __B) {
|
||||
// CHECK-LABEL: @test_mm512_mm_dbsad_epu8
|
||||
// CHECK: @llvm.x86.avx512.mask.dbpsadbw.512
|
||||
return _mm512_dbsad_epu8(__A, __B, 170);
|
||||
}
|
||||
|
||||
__m512i test_mm512_mm_mask_dbsad_epu8(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) {
|
||||
// CHECK-LABEL: @test_mm512_mm_mask_dbsad_epu8
|
||||
// CHECK: @llvm.x86.avx512.mask.dbpsadbw.512
|
||||
return _mm512_mask_dbsad_epu8(__W, __U, __A, __B, 170);
|
||||
}
|
||||
|
||||
__m512i test_mm512_mm_maskz_dbsad_epu8(__mmask32 __U, __m512i __A, __m512i __B) {
|
||||
// CHECK-LABEL: @test_mm512_mm_maskz_dbsad_epu8
|
||||
// CHECK: @llvm.x86.avx512.mask.dbpsadbw.512
|
||||
return _mm512_maskz_dbsad_epu8(__U, __A, __B, 170);
|
||||
}
|
||||
|
||||
__m512i test_mm512_sad_epu8(__m512i __A, __m512i __B) {
|
||||
// CHECK-LABEL: @test_mm512_sad_epu8
|
||||
// CHECK: @llvm.x86.avx512.psad.bw.512
|
||||
return _mm512_sad_epu8(__A, __B);
|
||||
}
|
||||
|
|
|
@ -2340,3 +2340,38 @@ __m256i test_mm256_maskz_alignr_epi8(__mmask32 __U, __m256i __A, __m256i __B) {
|
|||
return _mm256_maskz_alignr_epi8(__U, __A, __B, 2);
|
||||
}
|
||||
|
||||
__m128i test_mm_dbsad_epu8(__m128i __A, __m128i __B) {
|
||||
// CHECK-LABEL: @test_mm_dbsad_epu8
|
||||
// CHECK: @llvm.x86.avx512.mask.dbpsadbw.128
|
||||
return _mm_dbsad_epu8(__A, __B, 170);
|
||||
}
|
||||
|
||||
__m128i test_mm_mask_dbsad_epu8(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) {
|
||||
// CHECK-LABEL: @test_mm_mask_dbsad_epu8
|
||||
// CHECK: @llvm.x86.avx512.mask.dbpsadbw.128
|
||||
return _mm_mask_dbsad_epu8(__W, __U, __A, __B, 170);
|
||||
}
|
||||
|
||||
__m128i test_mm_maskz_dbsad_epu8(__mmask8 __U, __m128i __A, __m128i __B) {
|
||||
// CHECK-LABEL: @test_mm_maskz_dbsad_epu8
|
||||
// CHECK: @llvm.x86.avx512.mask.dbpsadbw.128
|
||||
return _mm_maskz_dbsad_epu8(__U, __A, __B, 170);
|
||||
}
|
||||
|
||||
__m256i test_mm256_dbsad_epu8(__m256i __A, __m256i __B) {
|
||||
// CHECK-LABEL: @test_mm256_dbsad_epu8
|
||||
// CHECK: @llvm.x86.avx512.mask.dbpsadbw.256
|
||||
return _mm256_dbsad_epu8(__A, __B, 170);
|
||||
}
|
||||
|
||||
__m256i test_mm256_mask_dbsad_epu8(__m256i __W, __mmask16 __U, __m256i __A, __m256i __B) {
|
||||
// CHECK-LABEL: @test_mm256_mask_dbsad_epu8
|
||||
// CHECK: @llvm.x86.avx512.mask.dbpsadbw.256
|
||||
return _mm256_mask_dbsad_epu8(__W, __U, __A, __B, 170);
|
||||
}
|
||||
|
||||
__m256i test_mm256_maskz_dbsad_epu8(__mmask16 __U, __m256i __A, __m256i __B) {
|
||||
// CHECK-LABEL: @test_mm256_maskz_dbsad_epu8
|
||||
// CHECK: @llvm.x86.avx512.mask.dbpsadbw.256
|
||||
return _mm256_maskz_dbsad_epu8(__U, __A, __B, 170);
|
||||
}
|
||||
|
|
Loading…
Reference in New Issue