Lines Matching refs:src_temp4

136     __m128i src_temp4, src_temp5, src_temp6, src_temp8;
177 src_temp4 = _mm_loadu_si128((__m128i *)(pu1_src + 48));
182 _mm_storeu_si128((__m128i *)(pu1_dst + 48), src_temp4);
192 src_temp4 = _mm_loadu_si128((__m128i *)(pu1_src + 48));
202 _mm_storeu_si128((__m128i *)(pu1_dst + 48), src_temp4);
272 src_temp4 = _mm_loadu_si128((__m128i *)(pu1_src + 8 + i));
273 src_temp5 = _mm_srli_si128(src_temp4, 1);
276 src_temp4 = _mm_cvtepu8_epi16(src_temp4);
282 src_temp4 = _mm_add_epi16(src_temp4, src_temp5);
283 src_temp4 = _mm_add_epi16(src_temp4, src_temp6);
284 src_temp4 = _mm_add_epi16(src_temp4, const_value_8x16);
286 src_temp4 = _mm_srai_epi16(src_temp4, 2);
289 src_temp1 = _mm_packus_epi16(src_temp1, src_temp4);
319 src_temp4 = _mm_loadu_si128((__m128i *)(au1_flt + 48));
324 _mm_storeu_si128((__m128i *)(pu1_dst + 48), src_temp4);
335 src_temp4 = _mm_loadu_si128((__m128i *)(au1_flt + 48));
345 _mm_storeu_si128((__m128i *)(pu1_dst + 48), src_temp4);
410 __m128i src_temp1, src_temp7, src_temp3, src_temp4, src_temp5, src_temp6;
449 src_temp4 = _mm_loadu_si128((__m128i *)(pu1_ref + nt + 16));
454 src_temp4 = _mm_sad_epu8(src_temp4, m_zero);
458 src_temp4 = _mm_add_epi16(src_temp3, src_temp4);
460 src_temp4 = _mm_add_epi16(src_temp4, src_temp8);
462 src_temp4 = _mm_shuffle_epi8(src_temp4, sm);
463 src_temp4 = _mm_hadd_epi16(src_temp4, m_zero);
465 acc_dc = _mm_cvtsi128_si32(src_temp4);
538 src_temp4 = _mm_cvtepu8_epi16(src_temp3);
541 src_temp4 = _mm_hadd_epi16(src_temp4, m_zero);
542 src_temp4 = _mm_hadd_epi16(src_temp4, m_zero);
543 src_temp4 = _mm_hadd_epi16(src_temp4, m_zero);
545 acc_dc = _mm_cvtsi128_si32(src_temp4);
583 src_temp4 = _mm_shuffle_epi8(src_temp2, sm1);
587 src_temp4 = _mm_insert_epi8(src_temp4, pu1_dst[(3 * dst_strd) + 0], 0);
591 temp3 = _mm_cvtsi128_si32(src_temp4);
603 src_temp4 = _mm_sad_epu8(src_temp3, m_zero);
604 src_temp4 = _mm_shuffle_epi8(src_temp4, sm);
605 src_temp4 = _mm_hadd_epi16(src_temp4, m_zero);
607 acc_dc = _mm_cvtsi128_si32(src_temp4);
646 src_temp4 = _mm_set1_epi8(dc_val);
654 src_temp4 = _mm_insert_epi8(src_temp4, pu1_dst[((4) * dst_strd)], 0);
662 _mm_storel_epi64((__m128i *)(pu1_dst + ((4) * dst_strd)), src_temp4);
672 src_temp4 = _mm_loadu_si128((__m128i *)(pu1_ref + nt + 16));
678 src_temp4 = _mm_sad_epu8(src_temp4, m_zero);
683 src_temp4 = _mm_add_epi16(src_temp3, src_temp4);
684 src_temp4 = _mm_shuffle_epi8(src_temp4, sm);
685 src_temp4 = _mm_hadd_epi16(src_temp4, m_zero);
687 acc_dc = _mm_cvtsi128_si32(src_temp4);
722 src_temp4 = _mm_set1_epi8(dc_val);
733 src_temp4 = _mm_insert_epi8(src_temp4, pu1_dst[((4) * dst_strd)], 0);
741 _mm_storeu_si128((__m128i *)(pu1_dst + ((4) * dst_strd)), src_temp4);
749 src_temp4 = _mm_insert_epi8(src_temp4, pu1_dst[((11) * dst_strd)], 0);
760 _mm_storeu_si128((__m128i *)(pu1_dst + ((11) * dst_strd)), src_temp4);
776 src_temp4 = _mm_loadu_si128((__m128i *)(pu1_ref + nt + 16));
787 src_temp4 = _mm_sad_epu8(src_temp4, m_zero);
796 src_temp4 = _mm_add_epi16(src_temp3, src_temp4);
798 src_temp4 = _mm_add_epi16(src_temp4, src_temp8);
800 src_temp4 = _mm_shuffle_epi8(src_temp4, sm);
801 src_temp4 = _mm_hadd_epi16(src_temp4, m_zero);
803 acc_dc = _mm_cvtsi128_si32(src_temp4);
846 src_temp4 = src_temp1;
864 src_temp4 = _mm_insert_epi8(src_temp4, pu1_dst[((4) * dst_strd)], 0);
876 _mm_storeu_si128((__m128i *)(pu1_dst + ((row + 3) * dst_strd)), src_temp4);
947 __m128i src_temp1, src_temp2, src_temp3, src_temp4, src_temp5, src_temp6, src_temp7, src_temp8;
958 src_temp4 = _mm_srli_si128(src_temp1, 3);
977 src_temp4 = _mm_shuffle_epi8(src_temp4, sm);
1004 _mm_storeu_si128((__m128i *)(pu1_dst + ((row + 12) * dst_strd)), src_temp4);
1022 _mm_storeu_si128((__m128i *)(pu1_dst + 16 + ((row + 12) * dst_strd)), src_temp4);
1035 __m128i src_temp1, src_temp2, src_temp3, src_temp4, src_temp5, src_temp6;
1048 src_temp4 = _mm_loadu_si128((__m128i *)(pu1_ref + two_nt + 1));
1050 src_temp4 = _mm_cvtepu8_epi16(src_temp4);
1053 src_temp3 = _mm_sub_epi16(src_temp4, src_temp10);
1071 src_temp4 = _mm_set1_epi8(pu1_ref[two_nt - 4]);
1075 temp3 = _mm_cvtsi128_si32(src_temp4);
1091 src_temp4 = _mm_set1_epi8(pu1_ref[two_nt - 5]);
1102 _mm_storel_epi64((__m128i *)(pu1_dst + (4 * dst_strd)), src_temp4);
1110 src_temp4 = _mm_loadu_si128((__m128i *)(pu1_ref + two_nt + 1 + 8));
1111 src_temp4 = _mm_cvtepu8_epi16(src_temp4);
1113 src_temp10 = _mm_sub_epi16(src_temp4, src_temp10);
1124 src_temp4 = _mm_set1_epi8(pu1_ref[two_nt - 5]);
1133 _mm_storeu_si128((__m128i *)(pu1_dst + ((4) * dst_strd)), src_temp4);
1142 src_temp4 = _mm_set1_epi8(pu1_ref[two_nt - 13]);
1150 _mm_storeu_si128((__m128i *)(pu1_dst + ((12) * dst_strd)), src_temp4);
1207 __m128i src_temp0, src_temp1, src_temp2, src_temp3, src_temp4, src_temp5, src_temp6, src_temp7;
1282 src_temp4 = src_temp2;
1287 src_temp4 = _mm_insert_epi8(src_temp4, pu1_dst[(2 * dst_strd)], 0);
1292 temp3 = _mm_cvtsi128_si32(src_temp4);
1309 src_temp4 = src_temp0;
1318 src_temp4 = _mm_insert_epi8(src_temp4, pu1_dst[((4) * dst_strd)], 0);
1327 _mm_storel_epi64((__m128i *)(pu1_dst + ((4) * dst_strd)), src_temp4);
1343 src_temp4 = src_temp0;
1352 src_temp4 = _mm_insert_epi8(src_temp4, pu1_dst[((row + 4) * dst_strd)], 0);
1361 _mm_storeu_si128((__m128i *)(pu1_dst + ((row + 4) * dst_strd)), src_temp4);