/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp8/encoder/arm/neon/ |
H A D | shortfdct_neon.asm | 46 vld1.32 {q11,q12}, [r12@128] ; q11=12000, q12=51000 90 vmlal.s16 q12, d7, d17 ; d1*2217 + 51000 98 vmlsl.s16 q12, d6, d16 ; d1*2217 - c1*5352 + 51000 103 vshrn.s32 d3, q12, #16 ; op[12]= (d1*2217 - c1*5352 + 51000)>>16 131 vadd.s16 q12, q1, q2 ; b1 = ip[1] + ip[2] 136 vshl.s16 q12, q12, #3 ; b1 << 3 140 vadd.s16 q0, q11, q12 ; [A0 | B0] = a1 + b1 141 vsub.s16 q2, q11, q12 ; [A [all...] |
H A D | fastquantizeb_neon.asm | 59 vshr.s16 q12, q0, #15 ; sz2 87 veor.s16 q10, q12 ; y2^sz2 93 vsub.s16 q10, q12 ; x2=(y^sz)-sz = (y^sz)-(-1) (2's complement) 107 vmul.s16 q12, q6, q10 ; x2 * Dequant 122 vst1.s16 {q12, q13}, [r7] ; store dqcoeff = x * Dequant 170 vabs.s16 q12, q0 ; calculate x = abs(z) 181 vadd.s16 q12, q14 ; x + Round 186 vqdmulh.s16 q12, q8 ; y = ((Round+abs(z)) * Quant) >> 16 195 vshr.s16 q12, #1 ; right shift 1 after vqdmulh 205 veor.s16 q12, q [all...] |
H A D | vp8_memcpy_neon.asm | 44 vld1.8 {q12, q13}, [r1]! 47 vst1.8 {q12, q13}, [r0]!
|
H A D | subtract_neon.asm | 47 vsubl.u8 q12, d4, d5 87 vsubl.u8 q12, d8, d10 96 vst1.16 {q12}, [r0], r6 144 vsubl.u8 q12, d8, d9 153 vst1.16 {q12}, [r0], r12 180 vsubl.u8 q12, d8, d9 189 vst1.16 {q12}, [r0], r12
|
H A D | vp8_mse16x16_neon.asm | 44 vsubl.u8 q12, d1, d5 95 vsubl.u8 q12, d1, d5
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp9/common/arm/neon/ |
H A D | vp9_idct16x16_add_neon.asm | 30 vtrn.32 q12, q14 34 vtrn.16 q12, q13 56 vld2.s16 {q11,q12}, [r0]! 57 vld2.s16 {q12,q13}, [r0]! 167 vadd.s32 q12, q11, q1 175 vqrshrn.s32 d17, q12, #14 ; >> 14 187 vmull.s16 q12, d20, d30 195 vmlsl.s16 q12, d28, d31 203 vqrshrn.s32 d20, q12, #14 ; >> 14 225 vmull.s16 q12, d2 [all...] |
H A D | vp9_idct32x32_1_add_neon.asm | 25 vld1.8 {q12}, [$src], $stride 37 vqadd.u8 q12, q12, $diff 49 vqsub.u8 q12, q12, $diff 61 vst1.8 {q12},[$dst], $stride
|
H A D | vp9_iht8x8_add_neon.asm | 110 vtrn.32 q12, q14 114 vtrn.16 q12, q13 214 vmull.s16 q12, d21, d1 222 vmlal.s16 q12, d29, d0 230 vqrshrn.s32 d31, q12, #14 ; >> 14 252 vmull.s16 q12, d29, d16 260 vmlal.s16 q12, d27, d16 268 vqrshrn.s32 d13, q12, #14 ; >> 14 275 vsub.s16 q12, q3, q4 ; output[4] = step1[3] - step1[4]; 327 vadd.s32 q12, q [all...] |
H A D | vp9_reconintra_neon.asm | 541 vadd.s16 q12, q0, q8 545 vqmovun.s16 d0, q12 547 vadd.s16 q12, q2, q8 554 vqmovun.s16 d24, q12 563 vadd.s16 q12, q1, q8 567 vqmovun.s16 d0, q12 569 vadd.s16 q12, q2, q8 576 vqmovun.s16 d24, q12 585 vadd.s16 q12, q0, q8 589 vqmovun.s16 d0, q12 [all...] |
H A D | vp9_iht4x4_add_neon.asm | 55 ; stored back into d16-d19 registers. This macro will touch q11,q12,q13, 61 vmull.s16 q12, d6, d17 ; s2 = sinpi_3_9 * x1 77 vadd.s32 q13, q10, q12 ; s0 = x0 + x3 79 vadd.s32 q14, q11, q12 ; s1 = x1 + x3 80 vsub.s32 q10, q10, q12 ; s3 = x0 + x1 - x3
|
H A D | vp9_convolve8_avg_neon.asm | 87 vtrn.16 q12, q13 123 vmovl.u8 q12, d28 169 vmov q11, q12 234 vmovl.u8 q12, d24
|
H A D | vp9_convolve8_neon.asm | 87 vtrn.16 q12, q13 123 vmovl.u8 q12, d28 158 vmov q11, q12 223 vmovl.u8 q12, d24
|
H A D | vp9_idct32x32_add_neon.asm | 238 ; Touches q8-q12, q15 (q13-q14 are preserved) 261 vmull.s16 q12, $regC, d31 262 ; (used) five for intermediate (q8-q12), one for constants (q15) 270 ; (used) six for intermediate (q8-q12, q15) 272 vadd.s32 q11, q12, q11 283 ; Touches q8-q12, q15 (q13-q14 are preserved) 372 vld1.s16 {q12}, [r3]! 395 vtrn.32 q12, q14 403 vtrn.16 q12, q13 416 vst1.16 {q12}, [r [all...] |
/hardware/samsung_slsi/exynos5/libswconverter/ |
H A D | csc_interleave_memcpy_neon.s | 82 vld1.8 {q12}, [r11]! 99 vst2.8 {q12, q13}, [r10]!
|
H A D | csc_tiled_to_linear_y_neon.s | 98 vld1.8 {q12, q13}, [r8]! 113 vst1.8 {q12}, [r7], r2
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp8/common/arm/neon/ |
H A D | variance_neon.asm | 42 vsubl.u8 q12, d1, d5 55 vpadal.s16 q8, q12 115 vsubl.u8 q12, d1, d5 125 vpadal.s16 q8, q12 178 vsubl.u8 q12, d2, d6 186 vpadal.s16 q8, q12 235 vsubl.u8 q12, d1, d5 245 vpadal.s16 q8, q12
|
H A D | vp8_subpixelvariance16x16_neon.asm | 75 vmull.u8 q12, d9, d0 96 vmlal.u8 q12, d9, d1 106 vqrshrn.u16 d19, q12, #7 126 vmull.u8 q12, d6, d0 143 vmlal.u8 q12, d6, d1 166 vqrshrn.u16 d13, q12, #7 263 vmull.u8 q12, d9, d0 284 vmlal.u8 q12, d9, d1 294 vqrshrn.u16 d19, q12, #7 382 vsubl.u8 q12, d [all...] |
H A D | sixtappredict8x8_neon.asm | 58 vabs.s32 q12, q14 173 vmull.u8 q12, d14, d0 185 vmlsl.u8 q12, d31, d1 197 vmlsl.u8 q12, d31, d4 209 vmlal.u8 q12, d31, d2 221 vmlal.u8 q12, d31, d5 239 vqadd.s16 q12, q7 258 vqrshrun.s16 d30, q12, #7 259 vld1.u8 {q12}, [lr]! 316 vmov q10, q12 [all...] |
H A D | sixtappredict16x16_neon.asm | 65 vabs.s32 q12, q14 93 vmull.u8 q12, d12, d0 102 vmlsl.u8 q12, d30, d1 118 vmlsl.u8 q12, d30, d4 134 vmlal.u8 q12, d30, d5 150 vmlal.u8 q12, d30, d2 174 vqadd.s16 q12, q6 190 vqrshrun.s16 d10, q12, #7 277 vmov q10, q12 298 vabs.s32 q12, q1 [all...] |
H A D | sixtappredict4x4_neon.asm | 53 vabs.s32 q12, q14 ;get abs(filer_parameters) 152 vmull.u8 q12, d31, d5 ;(src_ptr[3] * vp8_filter[5]) 164 vmlal.u8 q12, d22, d0 ;(src_ptr[-2] * vp8_filter[0]) 174 vmlsl.u8 q12, d31, d1 ;-(src_ptr[-1] * vp8_filter[1]) 184 vmlsl.u8 q12, d31, d4 ;-(src_ptr[2] * vp8_filter[4]) 194 vmlal.u8 q12, d31, d2 ;(src_ptr[0] * vp8_filter[2]) 207 vqadd.s16 q12, q11 214 vqrshrun.s16 d31, q12, #7 269 vabs.s32 q12, q14 ;get abs(filer_parameters)
|
H A D | sixtappredict8x4_neon.asm | 55 vabs.s32 q12, q14 160 vmull.u8 q12, d14, d0 172 vmlsl.u8 q12, d31, d1 184 vmlsl.u8 q12, d31, d4 196 vmlal.u8 q12, d31, d2 208 vmlal.u8 q12, d31, d5 226 vqadd.s16 q12, q7 232 vqrshrun.s16 d30, q12, #7 245 vld1.u8 {q12}, [lr]! 304 vabs.s32 q12, q1 [all...] |
H A D | vp8_subpixelvariance16x16s_neon.asm | 46 vld1.8 {q12}, [r2], r3 160 vsubl.u8 q12, d1, d3 174 vpadal.s16 q8, q12 276 vsubl.u8 q12, d3, d13 295 vpadal.s16 q13, q12 ;sum 432 vext.8 q13, q12, q13, #1 441 vrhadd.u8 q6, q12, q13 515 vsubl.u8 q12, d1, d3 529 vpadal.s16 q8, q12
|
/hardware/invensense/6515/libsensors_iio/software/simple_apps/playback/linux/ |
H A D | datalogger_outputs.c | 164 long q00, q12, q22, q03, t1, t2; local 179 q12 = inv_q29_mult(dl_out.quat[1], dl_out.quat[2]); 182 t1 = q12 - q03;
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vpx_scale/arm/neon/ |
H A D | vp8_vpxyv12_extendframeborders_neon.asm | 57 vmov q13, q12 68 vst1.8 {q12, q13}, [r5], lr 92 vld1.8 {q12, q13}, [r2]! 106 vst1.8 {q12, q13}, [r6]! 179 vst1.8 {q12}, [r5], lr
|
H A D | vp8_vpxyv12_copyframe_func_neon.asm | 65 vld1.8 {q12, q13}, [r10]! 76 vst1.8 {q12, q13}, [r11]!
|