core/kernels/pad_op.cc

9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudlur/* Copyright 2015 Google Inc. All Rights Reserved.
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudlur
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath KudlurLicensed under the Apache License, Version 2.0 (the "License");
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudluryou may not use this file except in compliance with the License.
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath KudlurYou may obtain a copy of the License at
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudlur
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudlur    http://www.apache.org/licenses/LICENSE-2.0
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudlur
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath KudlurUnless required by applicable law or agreed to in writing, software
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudlurdistributed under the License is distributed on an "AS IS" BASIS,
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath KudlurWITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath KudlurSee the License for the specific language governing permissions and
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudlurlimitations under the License.
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudlur==============================================================================*/
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur// See docs in ../ops/nn_ops.cc.
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#define EIGEN_USE_THREADS
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include "tensorflow/core/kernels/pad_op.h"
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include <memory>
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include <string>
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include <utility>
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
56313def004795f75ef8281a0294c958d28f1e06Vijay Vasudevan#include "third_party/eigen3/unsupported/Eigen/CXX11/Tensor"
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include "tensorflow/core/framework/op.h"
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include "tensorflow/core/framework/op_kernel.h"
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include "tensorflow/core/framework/register_types.h"
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include "tensorflow/core/framework/tensor_types.h"
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include "tensorflow/core/framework/types.h"
56313def004795f75ef8281a0294c958d28f1e06Vijay Vasudevan#include "tensorflow/core/platform/logging.h"
56313def004795f75ef8281a0294c958d28f1e06Vijay Vasudevan#include "tensorflow/core/platform/port.h"
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include "tensorflow/core/public/tensor.h"
56313def004795f75ef8281a0294c958d28f1e06Vijay Vasudevan#include "tensorflow/core/public/tensor_shape.h"
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlurnamespace tensorflow {
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlurtypedef Eigen::ThreadPoolDevice CPUDevice;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlurtypedef Eigen::GpuDevice GPUDevice;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlurtemplate <typename Device, typename T>
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlurclass PadOp : public OpKernel {
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur public:
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  explicit PadOp(OpKernelConstruction* context) : OpKernel(context) {}
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  void Compute(OpKernelContext* context) override {
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    const Tensor& in0 = context->input(0);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    const Tensor& in1 = context->input(1);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    const int dims = in0.dims();
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    static const int kMinDims = 0;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    static const int kMaxDims = 5;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    OP_REQUIRES(context, kMinDims <= dims && dims <= kMaxDims,
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                errors::Unimplemented("inputs rank not in [", kMinDims, ",",
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                                      kMaxDims, "]: ", dims));
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    OP_REQUIRES(
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        context,
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        TensorShapeUtils::IsMatrix(in1.shape()) && in1.dim_size(1) == 2,
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        errors::InvalidArgument("paddings must be a matrix with 2 columns: ",
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                                in1.shape().DebugString()));
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    const int fixed_dims =
02dff6d0d838397860b6ff5256413b54da482996Josh Levenberg        (allow_legacy_scalars() && dims == 0 && in1.dim_size(0) == 1) ? 1
02dff6d0d838397860b6ff5256413b54da482996Josh Levenberg                                                                      : dims;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    OP_REQUIRES(
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        context, fixed_dims == in1.dim_size(0),
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        errors::InvalidArgument(
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur            "The first dimension of paddings must be the rank of inputs",
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur            in1.shape().DebugString(), " ", in0.shape().DebugString()));
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    // Compute the shape of the output tensor, and allocate it.
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    TensorShape output_shape;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    TTypes<int32>::ConstMatrix paddings = in1.matrix<int32>();
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    for (int d = 0; d < fixed_dims; ++d) {
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      const int32 before_d = paddings(d, 0);  // Pad before existing elements.
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      const int32 after_d = paddings(d, 1);   // Pad after exisitng elements.
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      OP_REQUIRES(context, before_d >= 0 && after_d >= 0,
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                  errors::InvalidArgument("Paddings must be non-negative: ",
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                                          before_d, " ", after_d));
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      const int size_d =
02dff6d0d838397860b6ff5256413b54da482996Josh Levenberg          (allow_legacy_scalars() && d == in0.dims()) ? 1 : in0.dim_size(d);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      output_shape.AddDim(before_d + size_d + after_d);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    }
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    Tensor* output = nullptr;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    OP_REQUIRES_OK(context, context->allocate_output(0, output_shape, &output));
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    // Invoke the dims-specific implementation.
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    switch (fixed_dims) {
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      case 0:
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        Operate<0>(context, in0.tensor<T, 0>(), paddings, output);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        break;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      case 1:
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        // TODO(irving): Once Pad doesn't need a scalar special case,
02dff6d0d838397860b6ff5256413b54da482996Josh Levenberg        // change flat to tensor.  That is, once !allow_legacy_scalars().
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        Operate<1>(context, in0.flat<T>(), paddings, output);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        break;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      case 2:
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        Operate<2>(context, in0.tensor<T, 2>(), paddings, output);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        break;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      case 3:
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        Operate<3>(context, in0.tensor<T, 3>(), paddings, output);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        break;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      case 4:
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        Operate<4>(context, in0.tensor<T, 4>(), paddings, output);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        break;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      case 5:
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        Operate<5>(context, in0.tensor<T, 5>(), paddings, output);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        break;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      default:
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        OP_REQUIRES(context, false,
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                    errors::InvalidArgument("Only ranks up to 5 supported: ",
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                                            in0.shape().DebugString()));
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    }
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  }
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur private:
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  template <int Dims>
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  void Operate(OpKernelContext* context,
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur               typename TTypes<T, Dims>::ConstTensor input,
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur               TTypes<int32>::ConstMatrix paddings, Tensor* output) {
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    CHECK_EQ(Dims, paddings.dimension(0));
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    CHECK_EQ(2, paddings.dimension(1));
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    Eigen::array<std::pair<int32, int32>, Dims> paddings_array;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    for (int i = 0; i < Dims; ++i) {
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      paddings_array[i] = std::make_pair(paddings(i, 0), paddings(i, 1));
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    }
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    functor::Pad<Device, T, Dims> functor;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    functor(context->eigen_device<Device>(), output->tensor<T, Dims>(), input,
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur            paddings_array);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  }
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur};
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#define REGISTER_KERNEL(type)                            \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  REGISTER_KERNEL_BUILDER(Name("Pad")                    \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                              .Device(DEVICE_CPU)        \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                              .TypeConstraint<type>("T") \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                              .HostMemory("paddings"),   \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                          PadOp<CPUDevice, type>)
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath KudlurTF_CALL_ALL_TYPES(REGISTER_KERNEL);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#undef REGISTER_KERNEL
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#if GOOGLE_CUDA
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur// Forward declarations of the functor specializations for GPU.
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlurnamespace functor {
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#define DECLARE_GPU_SPEC(T, Dims)                                  \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  template <>                                                      \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  void Pad<GPUDevice, T, Dims>::operator()(                        \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      const GPUDevice& d, typename TTypes<T, Dims>::Tensor output, \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      typename TTypes<T, Dims>::ConstTensor input,                 \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      Eigen::array<std::pair<int32, int32>, Dims> paddings);       \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  extern template struct Pad<GPUDevice, T, Dims>;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#define DECLARE_GPU_SPECS(T) \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  DECLARE_GPU_SPEC(T, 0);    \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  DECLARE_GPU_SPEC(T, 1);    \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  DECLARE_GPU_SPEC(T, 2);    \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  DECLARE_GPU_SPEC(T, 3);    \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  DECLARE_GPU_SPEC(T, 4);    \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  DECLARE_GPU_SPEC(T, 5);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath KudlurTF_CALL_GPU_NUMBER_TYPES(DECLARE_GPU_SPECS);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur}  // namespace functor
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur// Registration of the GPU implementations.
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#define REGISTER_GPU_KERNEL(T)                         \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  REGISTER_KERNEL_BUILDER(Name("Pad")                  \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                              .Device(DEVICE_GPU)      \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                              .TypeConstraint<T>("T")  \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                              .HostMemory("paddings"), \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                          PadOp<GPUDevice, T>)
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath KudlurTF_CALL_GPU_NUMBER_TYPES(REGISTER_GPU_KERNEL);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#endif  // GOOGLE_CUDA
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan// A special GPU kernel for int32.
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan// TODO(b/25387198): Also enable int32 in device memory. This kernel
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan// registration requires all int32 inputs and outputs to be in host memory.
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay VasudevanREGISTER_KERNEL_BUILDER(Name("Pad")
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan                            .Device(DEVICE_GPU)
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan                            .TypeConstraint<int32>("T")
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan                            .HostMemory("input")
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan                            .HostMemory("paddings")
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan                            .HostMemory("output"),
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan                        PadOp<CPUDevice, int32>);
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur}  // end namespace tensorflow