/external/libvpx/libvpx/vpx_dsp/arm/ |
H A D | idct4x4_add_neon.c | 20 int16x4_t d16s16, d17s16, d18s16, d19s16, d20s16, d21s16; local 46 d20s16 = vdup_n_s16(cospi_8_64); 63 q1s32 = vmull_s16(d17s16, d20s16); 67 q15s32 = vmlsl_s16(q15s32, d19s16, d20s16); 104 q1s32 = vmull_s16(d17s16, d20s16); 108 q15s32 = vmlsl_s16(q15s32, d19s16, d20s16);
|
H A D | idct32x32_add_neon.c | 174 int16x4_t d16s16, d17s16, d18s16, d19s16, d20s16, d21s16, d22s16, d23s16; local 202 d20s16 = vget_low_s16(q10s16); 217 q10s16 = vcombine_s16(d20s16, d28s16); // vswp d21, d28
|
H A D | idct8x8_add_neon.c | 25 int16x4_t d16s16, d17s16, d18s16, d19s16, d20s16, d21s16, d22s16, d23s16; local 34 d20s16 = vget_low_s16(*q10s16); 49 *q10s16 = vcombine_s16(d20s16, d28s16); // vswp d21, d28 96 int16x4_t d16s16, d17s16, d18s16, d19s16, d20s16, d21s16, d22s16, d23s16; local 111 d20s16 = vget_low_s16(*q10s16); 180 q2s32 = vmull_s16(d20s16, d0s16); 182 q8s32 = vmull_s16(d20s16, d1s16);
|
H A D | vpx_convolve8_avg_neon.c | 63 int16x4_t d16s16, d17s16, d18s16, d19s16, d20s16, d22s16, d23s16; local 118 d20s16 = vreinterpret_s16_u16(vget_low_u16(q10u16)); 176 q1s32 = MULTIPLY_BY_Q0(d16s16, d17s16, d20s16, d22s16, 178 q2s32 = MULTIPLY_BY_Q0(d17s16, d20s16, d22s16, d18s16, 180 q14s32 = MULTIPLY_BY_Q0(d20s16, d22s16, d18s16, d19s16, 223 d20s16 = d23s16; 252 int16x4_t d16s16, d17s16, d18s16, d19s16, d20s16, d21s16, d22s16; local 313 d20s16 = vreinterpret_s16_u16(vget_low_u16(q10u16)); 323 d20s16, d21s16, d22s16, d24s16, q0s16); 326 q2s32 = MULTIPLY_BY_Q0(d17s16, d18s16, d19s16, d20s16, [all...] |
H A D | vpx_convolve8_neon.c | 63 int16x4_t d16s16, d17s16, d18s16, d19s16, d20s16, d22s16, d23s16; local 120 d20s16 = vreinterpret_s16_u16(vget_low_u16(q10u16)); 169 q1s32 = MULTIPLY_BY_Q0(d16s16, d17s16, d20s16, d22s16, 171 q2s32 = MULTIPLY_BY_Q0(d17s16, d20s16, d22s16, d18s16, 173 q14s32 = MULTIPLY_BY_Q0(d20s16, d22s16, d18s16, d19s16, 211 d20s16 = d23s16; 236 int16x4_t d16s16, d17s16, d18s16, d19s16, d20s16, d21s16, d22s16; local 288 d20s16 = vreinterpret_s16_u16(vget_low_u16(q10u16)); 298 d20s16, d21s16, d22s16, d24s16, q0s16); 301 q2s32 = MULTIPLY_BY_Q0(d17s16, d18s16, d19s16, d20s16, [all...] |
H A D | idct16x16_add_neon.c | 25 int16x4_t d16s16, d17s16, d18s16, d19s16, d20s16, d21s16, d22s16, d23s16; local 34 d20s16 = vget_low_s16(*q10s16); 49 *q10s16 = vcombine_s16(d20s16, d28s16); // vswp d21, d28 91 int16x4_t d16s16, d17s16, d18s16, d19s16, d20s16, d21s16, d22s16, d23s16; local 132 d20s16 = vget_low_s16(q10s16); 209 q0s32 = vmull_s16(d20s16, d31s16); 211 q12s32 = vmull_s16(d20s16, d30s16); 221 d20s16 = vqrshrn_n_s32(q12s32, 14); 223 q10s16 = vcombine_s16(d20s16, d21s16); 334 int16x4_t d16s16, d17s16, d18s16, d19s16, d20s16, d21s1 local 1029 int16x4_t d20s16, d21s16, d22s16, d23s16; local [all...] |
/external/libvpx/libvpx/vp9/common/arm/neon/ |
H A D | vp9_iht8x8_add_neon.c | 43 int16x4_t d16s16, d17s16, d18s16, d19s16, d20s16, d21s16, d22s16, d23s16; local 52 d20s16 = vget_low_s16(*q10s16); 67 *q10s16 = vcombine_s16(d20s16, d28s16); // vswp d21, d28 114 int16x4_t d16s16, d17s16, d18s16, d19s16, d20s16, d21s16, d22s16, d23s16; local 129 d20s16 = vget_low_s16(*q10s16); 198 q2s32 = vmull_s16(d20s16, d0s16); 200 q8s32 = vmull_s16(d20s16, d1s16); 270 int16x4_t d16s16, d17s16, d18s16, d19s16, d20s16, d21s16, d22s16, d23s16; local 280 d20s16 = vget_low_s16(*q10s16); 351 q4s32 = vmlal_s16(q4s32, d20s16, d1s1 [all...] |