/external/libvpx/libvpx/vp9/common/arm/neon/ |
H A D | vp9_iht4x4_add_neon.c | 28 int16x8_t *q9s16) { 34 d1x2s16 = vtrn_s16(vget_low_s16(*q9s16), vget_high_s16(*q9s16)); 41 *q9s16 = vreinterpretq_s16_s32(q0x2s32.val[1]); 72 int16x8_t *q9s16) { 80 d18s16 = vget_low_s16(*q9s16); 81 d19s16 = vget_high_s16(*q9s16); 101 *q9s16 = vsubq_s16(q13s16, q14s16); 102 *q9s16 = vcombine_s16(vget_high_s16(*q9s16), 26 TRANSPOSE4X4( int16x8_t *q8s16, int16x8_t *q9s16) argument 67 IDCT4x4_1D( int16x4_t *d0s16, int16x4_t *d1s16, int16x4_t *d2s16, int16x8_t *q8s16, int16x8_t *q9s16) argument 107 IADST4x4_1D( int16x4_t *d3s16, int16x4_t *d4s16, int16x4_t *d5s16, int16x8_t *q3s16, int16x8_t *q8s16, int16x8_t *q9s16) argument 162 int16x8_t q3s16, q8s16, q9s16; local [all...] |
H A D | vp9_iht8x8_add_neon.c | 36 int16x8_t *q9s16, 50 d18s16 = vget_low_s16(*q9s16); 51 d19s16 = vget_high_s16(*q9s16); 66 *q9s16 = vcombine_s16(d18s16, d26s16); // vswp d19, d26 76 q1x2s32 = vtrnq_s32(vreinterpretq_s32_s16(*q9s16), 93 *q9s16 = q0x2s16.val[1]; 105 int16x8_t *q9s16, 127 d18s16 = vget_low_s16(*q9s16); 128 d19s16 = vget_high_s16(*q9s16); 195 *q9s16 34 TRANSPOSE8X8( int16x8_t *q8s16, int16x8_t *q9s16, int16x8_t *q10s16, int16x8_t *q11s16, int16x8_t *q12s16, int16x8_t *q13s16, int16x8_t *q14s16, int16x8_t *q15s16) argument 103 IDCT8x8_1D( int16x8_t *q8s16, int16x8_t *q9s16, int16x8_t *q10s16, int16x8_t *q11s16, int16x8_t *q12s16, int16x8_t *q13s16, int16x8_t *q14s16, int16x8_t *q15s16) argument 259 IADST8X8_1D( int16x8_t *q8s16, int16x8_t *q9s16, int16x8_t *q10s16, int16x8_t *q11s16, int16x8_t *q12s16, int16x8_t *q13s16, int16x8_t *q14s16, int16x8_t *q15s16) argument 495 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local [all...] |
/external/libvpx/libvpx/vpx_dsp/arm/ |
H A D | idct4x4_add_neon.c | 22 int16x8_t q8s16, q9s16, q13s16, q14s16; local 34 q9s16 = vld1q_s16(input + 8); 38 d18s16 = vget_low_s16(q9s16); 39 d19s16 = vget_high_s16(q9s16); 44 q9s16 = vcombine_s16(d1x2s16.val[0], d1x2s16.val[1]); 50 vreinterpretq_s32_s16(q9s16)); 79 q9s16 = vsubq_s16(q13s16, q14s16); 83 d18s16 = vget_high_s16(q9s16); // vswp d18 d19 84 d19s16 = vget_low_s16(q9s16); 89 q9s16 [all...] |
H A D | idct32x32_add_neon.c | 30 q6s16, q7s16, q8s16, q9s16); 38 int16x8_t q9s16) { 50 q9s16 = vrshrq_n_s16(q9s16, 6); 57 q9s16 = vreinterpretq_s16_u16(vaddw_u8(vreinterpretq_u16_s16(q9s16), 64 d11s16 = vreinterpret_s16_u8(vqmovun_s16(q9s16)); 176 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local 184 q9s16 = vld1q_s16(in); 200 d18s16 = vget_low_s16(q9s16); 31 __STORE_COMBINE_CENTER_RESULTS( uint8_t *p1, uint8_t *p2, int stride, int16x8_t q6s16, int16x8_t q7s16, int16x8_t q8s16, int16x8_t q9s16) argument 262 idct32_bands_end_1st_pass( int16_t *out, int16x8_t q2s16, int16x8_t q3s16, int16x8_t q6s16, int16x8_t q7s16, int16x8_t q8s16, int16x8_t q9s16, int16x8_t q10s16, int16x8_t q11s16, int16x8_t q12s16, int16x8_t q13s16, int16x8_t q14s16, int16x8_t q15s16) argument 357 idct32_bands_end_2nd_pass( int16_t *out, uint8_t *dest, int stride, int16x8_t q2s16, int16x8_t q3s16, int16x8_t q6s16, int16x8_t q7s16, int16x8_t q8s16, int16x8_t q9s16, int16x8_t q10s16, int16x8_t q11s16, int16x8_t q12s16, int16x8_t q13s16, int16x8_t q14s16, int16x8_t q15s16) argument 467 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local [all...] |
H A D | idct8x8_add_neon.c | 18 int16x8_t *q9s16, 32 d18s16 = vget_low_s16(*q9s16); 33 d19s16 = vget_high_s16(*q9s16); 48 *q9s16 = vcombine_s16(d18s16, d26s16); // vswp d19, d26 58 q1x2s32 = vtrnq_s32(vreinterpretq_s32_s16(*q9s16), 75 *q9s16 = q0x2s16.val[1]; 87 int16x8_t *q9s16, 109 d18s16 = vget_low_s16(*q9s16); 110 d19s16 = vget_high_s16(*q9s16); 177 *q9s16 16 TRANSPOSE8X8( int16x8_t *q8s16, int16x8_t *q9s16, int16x8_t *q10s16, int16x8_t *q11s16, int16x8_t *q12s16, int16x8_t *q13s16, int16x8_t *q14s16, int16x8_t *q15s16) argument 85 IDCT8x8_1D( int16x8_t *q8s16, int16x8_t *q9s16, int16x8_t *q10s16, int16x8_t *q11s16, int16x8_t *q12s16, int16x8_t *q13s16, int16x8_t *q14s16, int16x8_t *q15s16) argument 248 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local 364 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local [all...] |
H A D | idct16x16_add_neon.c | 18 int16x8_t *q9s16, 32 d18s16 = vget_low_s16(*q9s16); 33 d19s16 = vget_high_s16(*q9s16); 48 *q9s16 = vcombine_s16(d18s16, d26s16); // vswp d19, d26 58 q1x2s32 = vtrnq_s32(vreinterpretq_s32_s16(*q9s16), 75 *q9s16 = q0x2s16.val[1]; 96 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local 105 q9s16 = q0x2s16.val[0]; 125 TRANSPOSE8X8(&q8s16, &q9s16, &q10s16, &q11s16, 130 d18s16 = vget_low_s16(q9s16); 16 TRANSPOSE8X8( int16x8_t *q8s16, int16x8_t *q9s16, int16x8_t *q10s16, int16x8_t *q11s16, int16x8_t *q12s16, int16x8_t *q13s16, int16x8_t *q14s16, int16x8_t *q15s16) argument 341 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local 891 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local 1035 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local [all...] |
/external/libvpx/libvpx/vp8/common/arm/neon/ |
H A D | sixtappredict_neon.c | 39 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16; local 229 q9s16 = vreinterpretq_s16_u16(q9u16); 231 q7s16 = vqaddq_s16(q7s16, q9s16); 334 q9s16 = vreinterpretq_s16_u16(q9u16); 338 q7s16 = vqaddq_s16(q7s16, q9s16); 417 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16; local 492 q9s16 = vreinterpretq_s16_u16(q9u16); 497 q9s16 = vqaddq_s16(q9s16, q5s16); 502 d8u8 = vqrshrun_n_s16(q9s16, 820 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16; local 1295 int16x8_t q3s16, q4s16, q5s16, q6s16, q7s16, q8s16, q9s16, q10s16; local [all...] |