Lines Matching defs:__m256

38 typedef float __m256 __attribute__ ((__vector_size__ (32)));
49 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
50 _mm256_add_ps(__m256 __a, __m256 __b)
61 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
62 _mm256_sub_ps(__m256 __a, __m256 __b)
73 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
74 _mm256_addsub_ps(__m256 __a, __m256 __b)
76 return (__m256)__builtin_ia32_addsubps256((__v8sf)__a, (__v8sf)__b);
85 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
86 _mm256_div_ps(__m256 __a, __m256 __b)
97 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
98 _mm256_max_ps(__m256 __a, __m256 __b)
100 return (__m256)__builtin_ia32_maxps256((__v8sf)__a, (__v8sf)__b);
109 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
110 _mm256_min_ps(__m256 __a, __m256 __b)
112 return (__m256)__builtin_ia32_minps256((__v8sf)__a, (__v8sf)__b);
121 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
122 _mm256_mul_ps(__m256 __a, __m256 __b)
133 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
134 _mm256_sqrt_ps(__m256 __a)
136 return (__m256)__builtin_ia32_sqrtps256((__v8sf)__a);
139 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
140 _mm256_rsqrt_ps(__m256 __a)
142 return (__m256)__builtin_ia32_rsqrtps256((__v8sf)__a);
145 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
146 _mm256_rcp_ps(__m256 __a)
148 return (__m256)__builtin_ia32_rcpps256((__v8sf)__a);
156 __m256 __V = (V); \
157 (__m256)__builtin_ia32_roundps256((__v8sf)__V, (M)); })
171 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
172 _mm256_and_ps(__m256 __a, __m256 __b)
174 return (__m256)((__v8si)__a & (__v8si)__b);
183 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
184 _mm256_andnot_ps(__m256 __a, __m256 __b)
186 return (__m256)(~(__v8si)__a & (__v8si)__b);
195 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
196 _mm256_or_ps(__m256 __a, __m256 __b)
198 return (__m256)((__v8si)__a | (__v8si)__b);
207 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
208 _mm256_xor_ps(__m256 __a, __m256 __b)
210 return (__m256)((__v8si)__a ^ (__v8si)__b);
220 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
221 _mm256_hadd_ps(__m256 __a, __m256 __b)
223 return (__m256)__builtin_ia32_haddps256((__v8sf)__a, (__v8sf)__b);
232 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
233 _mm256_hsub_ps(__m256 __a, __m256 __b)
235 return (__m256)__builtin_ia32_hsubps256((__v8sf)__a, (__v8sf)__b);
257 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
258 _mm256_permutevar_ps(__m256 __a, __m256i __c)
260 return (__m256)__builtin_ia32_vpermilvarps256((__v8sf)__a,
283 __m256 __A = (A); \
284 (__m256)__builtin_shufflevector((__v8sf)__A, (__v8sf) _mm256_setzero_ps(), \
298 __m256 __V1 = (V1); \
299 __m256 __V2 = (V2); \
300 (__m256)__builtin_ia32_vperm2f128_ps256((__v8sf)__V1, (__v8sf)__V2, (M)); })
314 __m256 __V1 = (V1); \
315 __m256 __V2 = (V2); \
316 (__m256)__builtin_ia32_blendps256((__v8sf)__V1, (__v8sf)__V2, (M)); })
325 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
326 _mm256_blendv_ps(__m256 __a, __m256 __b, __m256 __c)
328 return (__m256)__builtin_ia32_blendvps256(
334 __m256 __V1 = (V1); \
335 __m256 __V2 = (V2); \
336 (__m256)__builtin_ia32_dpps256((__v8sf)__V1, (__v8sf)__V2, (M)); })
340 __m256 __a = (a); \
341 __m256 __b = (b); \
342 (__m256)__builtin_shufflevector((__v8sf)__a, (__v8sf)__b, \
407 __m256 __a = (a); \
408 __m256 __b = (b); \
409 (__m256)__builtin_ia32_cmpps256((__v8sf)__a, (__v8sf)__b, (c)); })
427 __m256 __A = (A); \
471 __m256 __V1 = (V1); \
473 (__m256)__builtin_ia32_vinsertf128_ps256((__v8sf)__V1, (__v4sf)__V2, (O)); })
521 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
524 return (__m256)__builtin_ia32_cvtdq2ps256((__v8si) __a);
534 _mm256_cvtps_epi32(__m256 __a)
558 _mm256_cvttps_epi32(__m256 __a)
564 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
565 _mm256_movehdup_ps(__m256 __a)
570 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
571 _mm256_moveldup_ps(__m256 __a)
595 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
596 _mm256_unpackhi_ps(__m256 __a, __m256 __b)
601 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
602 _mm256_unpacklo_ps(__m256 __a, __m256 __b)
663 _mm256_testz_ps(__m256 __a, __m256 __b)
669 _mm256_testc_ps(__m256 __a, __m256 __b)
675 _mm256_testnzc_ps(__m256 __a, __m256 __b)
706 _mm256_movemask_ps(__m256 __a)
737 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
740 return (__m256)__builtin_ia32_vbroadcastss256(__a);
749 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
752 return (__m256)__builtin_ia32_vbroadcastf128_ps256(__a);
762 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
765 return *(__m256 *)__p;
777 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
781 __m256 __v;
815 _mm256_store_ps(float *__p, __m256 __a)
817 *(__m256 *)__p = __a;
827 _mm256_storeu_ps(float *__p, __m256 __a)
864 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
865 _mm256_maskload_ps(float const *__p, __m256 __m)
867 return (__m256)__builtin_ia32_maskloadps256((const __v8sf *)__p, (__v8sf)__m);
872 _mm256_maskstore_ps(float *__p, __m256 __m, __m256 __a)
909 _mm256_stream_ps(float *__p, __m256 __a)
921 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
925 return (__m256){ __h, __g, __f, __e, __d, __c, __b, __a };
976 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
980 return (__m256){ __a, __b, __c, __d, __e, __f, __g, __h };
1030 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1033 return (__m256){ __w, __w, __w, __w, __w, __w, __w, __w };
1070 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1073 return (__m256){ 0, 0, 0, 0, 0, 0, 0, 0 };
1083 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1086 return (__m256)__a;
1096 _mm256_castps_pd(__m256 __a)
1102 _mm256_castps_si256(__m256 __a)
1107 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1110 return (__m256)__a;
1126 _mm256_castps256_ps128(__m256 __a)
1143 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1156 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1163 __m256 __v256 = _mm256_castps128_ps256(((struct __loadu_ps*)__addr_lo)->__v);
1192 _mm256_storeu2_m128(float *__addr_hi, float *__addr_lo, __m256 __a)