/external/libvpx/libvpx/vpx_dsp/arm/ |
H A D | idct32x32_add_neon.c | 18 q13s16 = vld1q_s16(trans_buf + second * 8); 125 DO_BUTTERFLY(q14s16, q13s16, const_1, const_2, qA, qB); 128 int16x8_t q13s16, 139 dAs16 = vget_low_s16(q13s16); 140 dBs16 = vget_high_s16(q13s16); 176 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local 192 q13s16 = vld1q_s16(in); 208 d26s16 = vget_low_s16(q13s16); 209 d27s16 = vget_high_s16(q13s16); 220 q13s16 126 DO_BUTTERFLY( int16x8_t q14s16, int16x8_t q13s16, int16_t first_const, int16_t second_const, int16x8_t *qAs16, int16x8_t *qBs16) argument 262 idct32_bands_end_1st_pass( int16_t *out, int16x8_t q2s16, int16x8_t q3s16, int16x8_t q6s16, int16x8_t q7s16, int16x8_t q8s16, int16x8_t q9s16, int16x8_t q10s16, int16x8_t q11s16, int16x8_t q12s16, int16x8_t q13s16, int16x8_t q14s16, int16x8_t q15s16) argument 357 idct32_bands_end_2nd_pass( int16_t *out, uint8_t *dest, int stride, int16x8_t q2s16, int16x8_t q3s16, int16x8_t q6s16, int16x8_t q7s16, int16x8_t q8s16, int16x8_t q9s16, int16x8_t q10s16, int16x8_t q11s16, int16x8_t q12s16, int16x8_t q13s16, int16x8_t q14s16, int16x8_t q15s16) argument 467 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local [all...] |
H A D | idct8x8_add_neon.c | 22 int16x8_t *q13s16, 40 d26s16 = vget_low_s16(*q13s16); 41 d27s16 = vget_high_s16(*q13s16); 52 *q13s16 = vcombine_s16(d19s16, d27s16); 62 q3x2s32 = vtrnq_s32(vreinterpretq_s32_s16(*q13s16), 79 *q13s16 = q2x2s16.val[1]; 91 int16x8_t *q13s16, 117 d26s16 = vget_low_s16(*q13s16); 118 d27s16 = vget_high_s16(*q13s16); 194 *q13s16 16 TRANSPOSE8X8( int16x8_t *q8s16, int16x8_t *q9s16, int16x8_t *q10s16, int16x8_t *q11s16, int16x8_t *q12s16, int16x8_t *q13s16, int16x8_t *q14s16, int16x8_t *q15s16) argument 85 IDCT8x8_1D( int16x8_t *q8s16, int16x8_t *q9s16, int16x8_t *q10s16, int16x8_t *q11s16, int16x8_t *q12s16, int16x8_t *q13s16, int16x8_t *q14s16, int16x8_t *q15s16) argument 248 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local 364 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local [all...] |
H A D | idct16x16_add_neon.c | 22 int16x8_t *q13s16, 40 d26s16 = vget_low_s16(*q13s16); 41 d27s16 = vget_high_s16(*q13s16); 52 *q13s16 = vcombine_s16(d19s16, d27s16); 62 q3x2s32 = vtrnq_s32(vreinterpretq_s32_s16(*q13s16), 79 *q13s16 = q2x2s16.val[1]; 96 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local 117 q13s16 = q0x2s16.val[0]; 126 &q12s16, &q13s16, &q14s16, &q15s16); 138 d26s16 = vget_low_s16(q13s16); 16 TRANSPOSE8X8( int16x8_t *q8s16, int16x8_t *q9s16, int16x8_t *q10s16, int16x8_t *q11s16, int16x8_t *q12s16, int16x8_t *q13s16, int16x8_t *q14s16, int16x8_t *q15s16) argument 341 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local 891 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local 1035 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local [all...] |
H A D | idct4x4_add_neon.c | 22 int16x8_t q8s16, q9s16, q13s16, q14s16; local 74 q13s16 = vcombine_s16(d26s16, d27s16); 78 q8s16 = vaddq_s16(q13s16, q14s16); 79 q9s16 = vsubq_s16(q13s16, q14s16); 115 q13s16 = vcombine_s16(d26s16, d27s16); 119 q8s16 = vaddq_s16(q13s16, q14s16); 120 q9s16 = vsubq_s16(q13s16, q14s16);
|
H A D | intrapred_neon.c | 728 int16x8_t q12s16, q13s16, q14s16, q15s16; local 747 q13s16 = vaddq_s16(vreinterpretq_s16_u16(q0u16), 754 d1u8 = vqmovun_s16(q13s16); 766 q13s16 = vaddq_s16(vreinterpretq_s16_u16(q0u16), 773 d1u8 = vqmovun_s16(q13s16); 785 q13s16 = vaddq_s16(vreinterpretq_s16_u16(q0u16), 792 d1u8 = vqmovun_s16(q13s16); 804 q13s16 = vaddq_s16(vreinterpretq_s16_u16(q0u16), 811 d1u8 = vqmovun_s16(q13s16);
|
/external/libvpx/libvpx/vp9/common/arm/neon/ |
H A D | vp9_iht8x8_add_neon.c | 40 int16x8_t *q13s16, 58 d26s16 = vget_low_s16(*q13s16); 59 d27s16 = vget_high_s16(*q13s16); 70 *q13s16 = vcombine_s16(d19s16, d27s16); 80 q3x2s32 = vtrnq_s32(vreinterpretq_s32_s16(*q13s16), 97 *q13s16 = q2x2s16.val[1]; 109 int16x8_t *q13s16, 135 d26s16 = vget_low_s16(*q13s16); 136 d27s16 = vget_high_s16(*q13s16); 212 *q13s16 34 TRANSPOSE8X8( int16x8_t *q8s16, int16x8_t *q9s16, int16x8_t *q10s16, int16x8_t *q11s16, int16x8_t *q12s16, int16x8_t *q13s16, int16x8_t *q14s16, int16x8_t *q15s16) argument 103 IDCT8x8_1D( int16x8_t *q8s16, int16x8_t *q9s16, int16x8_t *q10s16, int16x8_t *q11s16, int16x8_t *q12s16, int16x8_t *q13s16, int16x8_t *q14s16, int16x8_t *q15s16) argument 259 IADST8X8_1D( int16x8_t *q8s16, int16x8_t *q9s16, int16x8_t *q10s16, int16x8_t *q11s16, int16x8_t *q12s16, int16x8_t *q13s16, int16x8_t *q14s16, int16x8_t *q15s16) argument 495 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local [all...] |
H A D | vp9_iht4x4_add_neon.c | 76 int16x8_t q13s16, q14s16; local 98 q13s16 = vcombine_s16(d26s16, d27s16); 100 *q8s16 = vaddq_s16(q13s16, q14s16); 101 *q9s16 = vsubq_s16(q13s16, q14s16);
|
/external/libvpx/libvpx/vp8/common/arm/neon/ |
H A D | loopfiltersimplehorizontaledge_neon.c | 21 int16x8_t q2s16, q3s16, q13s16; local 42 q13s16 = vdupq_n_s16(3); 60 q2s16 = vmulq_s16(q2s16, q13s16); 61 q3s16 = vmulq_s16(q3s16, q13s16);
|
H A D | loopfiltersimpleverticaledge_neon.c | 185 int16x8_t q2s16, q13s16, q11s16; local 223 q13s16 = vsubl_s8(vget_high_s8(vreinterpretq_s8_u8(q4u8)), 230 q13s16 = vmulq_s16(q13s16, q11s16); 236 q13s16 = vaddw_s8(q13s16, vget_high_s8(q14s8)); 239 d29s8 = vqmovn_s16(q13s16);
|
H A D | mbloopfilter_neon.c | 33 int16x8_t q0s16, q2s16, q11s16, q12s16, q13s16, q14s16, q15s16; local 81 q13s16 = vsubl_s8(vget_high_s8(vreinterpretq_s8_u8(q7)), 89 q13s16 = vmulq_s16(q13s16, q11s16); 94 q13s16 = vaddw_s8(q13s16, vget_high_s8(q1s8)); 100 d3 = vqmovn_s16(q13s16); 123 q13s16 = vmlal_s8(vreinterpretq_s16_u16(q13u16), vget_high_s8(q1s8), d4); 130 d25 = vqshrn_n_s16(q13s16, 7);
|
H A D | sixtappredict_neon.c | 1296 int16x8_t q11s16, q12s16, q13s16, q15s16; local 1624 q13s16 = vreinterpretq_s16_u16(q13u16); 1627 q13s16 = vqaddq_s16(q13s16, q3s16); 1634 d11u8 = vqrshrun_n_s16(q13s16, 7);
|
/external/libvpx/libvpx/vp8/encoder/arm/neon/ |
H A D | shortfdct_neon.c | 127 int16x8_t q11s16, q12s16, q13s16, q14s16, q15s16, qEmptys16; local 158 q13s16 = vsubq_s16(v2tmp0.val[1], v2tmp1.val[0]); 163 q13s16 = vshlq_n_s16(q13s16, 3); 172 d26s16 = vget_low_s16(q13s16); 173 d27s16 = vget_high_s16(q13s16); 209 q13s16 = vsubq_s16(v2tmp0.val[1], v2tmp1.val[0]); 230 d26s16 = vget_low_s16(q13s16); 231 d27s16 = vget_high_s16(q13s16);
|