diff options
author | Craig Topper <craig.topper@gmail.com> | 2011-12-19 07:03:25 +0000 |
---|---|---|
committer | Craig Topper <craig.topper@gmail.com> | 2011-12-19 07:03:25 +0000 |
commit | 9c2ffd803af03f1728423d0d73ff87d988642633 (patch) | |
tree | 86b625709e1c89a4f1387ec25bb570bb2902bd79 /lib/Headers/avx2intrin.h | |
parent | 099e7f647ccda915513f2b2ec53352dc756082d3 (diff) |
More AVX2 intrinsic support including saturating add/sub and palignr.
git-svn-id: https://llvm.org/svn/llvm-project/cfe/trunk@146857 91177308-0d34-0410-b5e6-96231b3b80d8
Diffstat (limited to 'lib/Headers/avx2intrin.h')
-rw-r--r-- | lib/Headers/avx2intrin.h | 54 |
1 files changed, 54 insertions, 0 deletions
diff --git a/lib/Headers/avx2intrin.h b/lib/Headers/avx2intrin.h index 1cfcac5c29..e4f1e14c90 100644 --- a/lib/Headers/avx2intrin.h +++ b/lib/Headers/avx2intrin.h @@ -95,6 +95,35 @@ _mm256_add_epi64(__m256i a, __m256i b) } static __inline__ __m256i __attribute__((__always_inline__, __nodebug__)) +_mm256_adds_epi8(__m256i a, __m256i b) +{ + return (__m256i)__builtin_ia32_paddsb256((__v32qi)a, (__v32qi)b); +} + +static __inline__ __m256i __attribute__((__always_inline__, __nodebug__)) +_mm256_adds_epi16(__m256i a, __m256i b) +{ + return (__m256i)__builtin_ia32_paddsw256((__v16hi)a, (__v16hi)b); +} + +static __inline__ __m256i __attribute__((__always_inline__, __nodebug__)) +_mm256_adds_epu8(__m256i a, __m256i b) +{ + return (__m256i)__builtin_ia32_paddusb256((__v32qi)a, (__v32qi)b); +} + +static __inline__ __m256i __attribute__((__always_inline__, __nodebug__)) +_mm256_adds_epu16(__m256i a, __m256i b) +{ + return (__m256i)__builtin_ia32_paddusw256((__v16hi)a, (__v16hi)b); +} + +#define _mm256_alignr_epi8(a, b, n) __extension__ ({ \ + __m256i __a = (a); \ + __m256i __b = (b); \ + (__m256i)__builtin_ia32_palignr256((__v32qi)__a, (__v32qi)__b, (n)); }) + +static __inline__ __m256i __attribute__((__always_inline__, __nodebug__)) _mm256_sub_epi8(__m256i a, __m256i b) { return (__m256i)((__v32qi)a - (__v32qi)b); @@ -117,3 +146,28 @@ _mm256_sub_epi64(__m256i a, __m256i b) { return a - b; } + +static __inline__ __m256i __attribute__((__always_inline__, __nodebug__)) +_mm256_subs_epi8(__m256i a, __m256i b) +{ + return (__m256i)__builtin_ia32_psubsb256((__v32qi)a, (__v32qi)b); +} + +static __inline__ __m256i __attribute__((__always_inline__, __nodebug__)) +_mm256_subs_epi16(__m256i a, __m256i b) +{ + return (__m256i)__builtin_ia32_psubsw256((__v16hi)a, (__v16hi)b); +} + +static __inline__ __m256i __attribute__((__always_inline__, __nodebug__)) +_mm256_subs_epu8(__m256i a, __m256i b) +{ + return (__m256i)__builtin_ia32_psubusb256((__v32qi)a, (__v32qi)b); +} + +static __inline__ __m256i __attribute__((__always_inline__, __nodebug__)) +_mm256_subs_epu16(__m256i a, __m256i b) +{ + return (__m256i)__builtin_ia32_psubusw256((__v16hi)a, (__v16hi)b); +} + |