operations/internal/tensor_utils.h

915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni/*
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni * Copyright 2017 The Android Open Source Project
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni *
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni * Licensed under the Apache License, Version 2.0 (the "License");
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni * you may not use this file except in compliance with the License.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni * You may obtain a copy of the License at
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni *
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni *      http://www.apache.org/licenses/LICENSE-2.0
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni *
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni * Unless required by applicable law or agreed to in writing, software
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni * distributed under the License is distributed on an "AS IS" BASIS,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni * See the License for the specific language governing permissions and
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni * limitations under the License.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni */
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni#ifndef FRAMEWORKS_ML_NN_COMMON_OPERATIONS_INTERNAL_TENSOR_UTILS_H_
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni#define FRAMEWORKS_ML_NN_COMMON_OPERATIONS_INTERNAL_TENSOR_UTILS_H_
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni#include "ActivationFunctor.h"
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ninamespace android {
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ninamespace nn {
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ninamespace tensor_utils {
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// Limit a float input f betweeen +abs_limit and -abs_limit.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Nifloat Clip(float f, float abs_limit);
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// Multiply a matrix by a batch vector, and store results in a batch-size
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// vector using a stride value provided in result_stride. 'result_stride' shows
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// how the number of elements between consecutive result values. For example
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// result_stride = 1, will cause the output to look like this:
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// [O_1, 0_2, ... O_rows] in memory, but result_stride = 3, will cause it to be
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// arranged like this in memory: [O_1, x, x, 0_2, x, x, ..., O_rows]
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Nivoid MatrixBatchVectorMultiplyAccumulate(const float* matrix, int m_rows,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni                                         int m_cols, const float* vector,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni                                         int n_batch, float* result,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni                                         int result_stride);
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// Cwise product of two vectors.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Nivoid VectorVectorCwiseProduct(const float* vector1, const float* vector2,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni                              int v_size, float* result);
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// Cwise product and accumulate of two vectors. Since it's a MAC opertation, the
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// assumption here is that result array is initialized to valid values.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Nivoid VectorVectorCwiseProductAccumulate(const float* vector1,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni                                        const float* vector2, int v_size,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni                                        float* result);
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// Dot product of two vectors.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Nifloat VectorVectorDotProduct(const float* vector1, const float* vector2,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni                             int v_size);
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// Dot product of two batch vectors of size n_batch * v_size:
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// vector1 = [x_1_1, x_1_2, ..., x_1_vsize,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni//            x_2_1, x_2_2, ..., x_2_vsize,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni//            ...
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni//            x_nbatch_1,..., x_nbatch_vsize]
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// vector2 = [y_1_1, y_1_2, ..., y_1_vsize,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni//            y_2_1, y_2_2, ..., y_2_vsize,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni//            ...
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni//            y_nbatch_1,..., y_nbatch_vsize]
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// Then result will be a vector of n_batch size which will be saved with a
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// stride of result_stride in memory starting from 'result':
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// [x_1_1 * y_1_1 + x_1_2 * y_1_2 + ... + x_1_vsize * y_1_vsize,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni//  x_2_1 * y_2_1 + x_2_2 * y_2_2 + ... + x_2_vsize * y_2_vsize,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni//  ...
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni//  x_nbatch_1 * y_nbatch_1 + ... + x_nbatch_vsize * y_nbatch_vsize]
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Nivoid BatchVectorBatchVectorDotProduct(const float* vector1,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni                                      const float* vector2, int v_size,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni                                      int n_batch, float* result,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni                                      int result_stride);
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// Cwise product and accumulate of a vector and a batch-vector. Since it's a MAC
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// operation, the assumption here is that result array is initialized to valid
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// values.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Nivoid VectorBatchVectorCwiseProductAccumulate(const float* vector, int v_size,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni                                             const float* batch_vector,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni                                             int n_batch, float* result);
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// Batch vector initialization with another vector.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Nivoid VectorBatchVectorAssign(const float* vector, int v_size, int n_batch,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni                             float* batch_vector);
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// Apply sigmoid to elements of a vector.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Nivoid ApplySigmoidToVector(const float* vector, int v_size, float* result);
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// Apply activation function to elements of a vector.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Nivoid ApplyActivationToVector(const float* vector, int v_size,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni                             ActivationFn activation, float* result);
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// Copy vector to another vector.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Nivoid CopyVector(const float* vector, int v_size, float* result);
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// Compute "1.0f - elements of vector" (used in CIFG).
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Nivoid Sub1Vector(const float* vector, int v_size, float* result);
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// Fill vector with 0.f.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Nivoid ZeroVector(float* vector, int v_size);
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// Clip elements of a vector using a abs_limit value.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Nivoid ClipVector(const float* vector, int v_size, float abs_limit,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni                float* result);
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// Shift left a vector in place with v_size size.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Nivoid VectorShiftLeft(float* vector, int v_size, float shift_value);
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// Reduce-sum on a float input vector:
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// input_vector: float pointer to input vector.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// input_stride: input vector stride.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// output_vector: float pointer to vector.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// output_size: output vector size.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// reduction_size: number of consecutive elements from input vector which are
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni// added to get one element of output.
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Nivoid ReductionSumVector(const float* input_vector, int input_stride,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni                        float* output_vector, int output_size,
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni                        int reduction_size);
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni}  // namespace tensor_utils
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni}  // namespace nn
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni}  // namespace android
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni
915cca2dab8ee7a05fec2905f11ec3664be49c6eYang Ni#endif  // FRAMEWORKS_ML_NN_COMMON_OPERATIONS_INTERNAL_TENSOR_UTILS_H_