core/kernels/pad_op.cc

c8b59c046895fa5b6d79f73e0b5817330fcfbfc1A. Unique TensorFlower/* Copyright 2015 The TensorFlow Authors. All Rights Reserved.
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudlur
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath KudlurLicensed under the Apache License, Version 2.0 (the "License");
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudluryou may not use this file except in compliance with the License.
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath KudlurYou may obtain a copy of the License at
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudlur
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudlur    http://www.apache.org/licenses/LICENSE-2.0
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudlur
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath KudlurUnless required by applicable law or agreed to in writing, software
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudlurdistributed under the License is distributed on an "AS IS" BASIS,
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath KudlurWITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath KudlurSee the License for the specific language governing permissions and
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudlurlimitations under the License.
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudlur==============================================================================*/
9c3043ff3bf31a6a81810b4ce9e87ef936f1f529Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur// See docs in ../ops/nn_ops.cc.
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#define EIGEN_USE_THREADS
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include "tensorflow/core/kernels/pad_op.h"
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include <memory>
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include <string>
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include <utility>
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
56313def004795f75ef8281a0294c958d28f1e06Vijay Vasudevan#include "third_party/eigen3/unsupported/Eigen/CXX11/Tensor"
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include "tensorflow/core/framework/op.h"
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include "tensorflow/core/framework/op_kernel.h"
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include "tensorflow/core/framework/register_types.h"
3ede5506acf6a026f09eda33277d46e34ac7ed10Josh Levenberg#include "tensorflow/core/framework/tensor.h"
3ede5506acf6a026f09eda33277d46e34ac7ed10Josh Levenberg#include "tensorflow/core/framework/tensor_shape.h"
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include "tensorflow/core/framework/tensor_types.h"
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#include "tensorflow/core/framework/types.h"
56313def004795f75ef8281a0294c958d28f1e06Vijay Vasudevan#include "tensorflow/core/platform/logging.h"
3ede5506acf6a026f09eda33277d46e34ac7ed10Josh Levenberg#include "tensorflow/core/platform/types.h"
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlurnamespace tensorflow {
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlurtypedef Eigen::ThreadPoolDevice CPUDevice;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlurtypedef Eigen::GpuDevice GPUDevice;
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp#ifdef TENSORFLOW_USE_SYCL
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harptypedef Eigen::SyclDevice SYCLDevice;
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp#endif // TENSORFLOW_USE_SYCL
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlurtemplate <typename Device, typename T>
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlurclass PadOp : public OpKernel {
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur public:
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  explicit PadOp(OpKernelConstruction* context) : OpKernel(context) {}
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  void Compute(OpKernelContext* context) override {
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    const Tensor& in0 = context->input(0);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    const Tensor& in1 = context->input(1);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    const int dims = in0.dims();
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    static const int kMinDims = 0;
13b63bd87e53fdb01cc87d3030f79c73bd487aa0Vijay Vasudevan    static const int kMaxDims = 6;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    OP_REQUIRES(context, kMinDims <= dims && dims <= kMaxDims,
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                errors::Unimplemented("inputs rank not in [", kMinDims, ",",
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                                      kMaxDims, "]: ", dims));
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    OP_REQUIRES(
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        context,
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        TensorShapeUtils::IsMatrix(in1.shape()) && in1.dim_size(1) == 2,
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        errors::InvalidArgument("paddings must be a matrix with 2 columns: ",
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                                in1.shape().DebugString()));
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    const int fixed_dims =
02dff6d0d838397860b6ff5256413b54da482996Josh Levenberg        (allow_legacy_scalars() && dims == 0 && in1.dim_size(0) == 1) ? 1
02dff6d0d838397860b6ff5256413b54da482996Josh Levenberg                                                                      : dims;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    OP_REQUIRES(
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        context, fixed_dims == in1.dim_size(0),
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        errors::InvalidArgument(
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur            "The first dimension of paddings must be the rank of inputs",
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur            in1.shape().DebugString(), " ", in0.shape().DebugString()));
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    // Compute the shape of the output tensor, and allocate it.
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    TensorShape output_shape;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    TTypes<int32>::ConstMatrix paddings = in1.matrix<int32>();
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    for (int d = 0; d < fixed_dims; ++d) {
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      const int32 before_d = paddings(d, 0);  // Pad before existing elements.
59f1eba5fb94506a205fa2e81145667754739da5Martin Wicke      const int32 after_d = paddings(d, 1);   // Pad after existing elements.
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      OP_REQUIRES(context, before_d >= 0 && after_d >= 0,
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                  errors::InvalidArgument("Paddings must be non-negative: ",
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                                          before_d, " ", after_d));
0307b9d8569011a94535322899d375a79c49df80David G. Andersen      const int64 size_d =
02dff6d0d838397860b6ff5256413b54da482996Josh Levenberg          (allow_legacy_scalars() && d == in0.dims()) ? 1 : in0.dim_size(d);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      output_shape.AddDim(before_d + size_d + after_d);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    }
a1f85a49b77ae8bcf696caf872d09d1649658512A. Unique TensorFlower
a1f85a49b77ae8bcf696caf872d09d1649658512A. Unique TensorFlower    // If there is no padding to be done, forward the input to output.
a1f85a49b77ae8bcf696caf872d09d1649658512A. Unique TensorFlower    if (output_shape.num_elements() == in0.NumElements()) {
a1f85a49b77ae8bcf696caf872d09d1649658512A. Unique TensorFlower      // When num_elements == 0, shape may have changed.
a1f85a49b77ae8bcf696caf872d09d1649658512A. Unique TensorFlower      Tensor out;
a1f85a49b77ae8bcf696caf872d09d1649658512A. Unique TensorFlower      CHECK(out.CopyFrom(in0, output_shape));
a1f85a49b77ae8bcf696caf872d09d1649658512A. Unique TensorFlower      context->set_output(0, out);
a1f85a49b77ae8bcf696caf872d09d1649658512A. Unique TensorFlower      return;
a1f85a49b77ae8bcf696caf872d09d1649658512A. Unique TensorFlower    }
a1f85a49b77ae8bcf696caf872d09d1649658512A. Unique TensorFlower
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    Tensor* output = nullptr;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    OP_REQUIRES_OK(context, context->allocate_output(0, output_shape, &output));
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    // Invoke the dims-specific implementation.
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    switch (fixed_dims) {
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      case 0:
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        Operate<0>(context, in0.tensor<T, 0>(), paddings, output);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        break;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      case 1:
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        // TODO(irving): Once Pad doesn't need a scalar special case,
02dff6d0d838397860b6ff5256413b54da482996Josh Levenberg        // change flat to tensor.  That is, once !allow_legacy_scalars().
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        Operate<1>(context, in0.flat<T>(), paddings, output);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        break;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      case 2:
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        Operate<2>(context, in0.tensor<T, 2>(), paddings, output);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        break;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      case 3:
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        Operate<3>(context, in0.tensor<T, 3>(), paddings, output);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        break;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      case 4:
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        Operate<4>(context, in0.tensor<T, 4>(), paddings, output);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        break;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      case 5:
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        Operate<5>(context, in0.tensor<T, 5>(), paddings, output);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        break;
13b63bd87e53fdb01cc87d3030f79c73bd487aa0Vijay Vasudevan      case 6:
13b63bd87e53fdb01cc87d3030f79c73bd487aa0Vijay Vasudevan        Operate<6>(context, in0.tensor<T, 6>(), paddings, output);
13b63bd87e53fdb01cc87d3030f79c73bd487aa0Vijay Vasudevan        break;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      default:
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur        OP_REQUIRES(context, false,
13b63bd87e53fdb01cc87d3030f79c73bd487aa0Vijay Vasudevan                    errors::InvalidArgument("Only ranks up to 6 supported: ",
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                                            in0.shape().DebugString()));
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    }
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  }
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur private:
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  template <int Dims>
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  void Operate(OpKernelContext* context,
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur               typename TTypes<T, Dims>::ConstTensor input,
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur               TTypes<int32>::ConstMatrix paddings, Tensor* output) {
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    CHECK_EQ(Dims, paddings.dimension(0));
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    CHECK_EQ(2, paddings.dimension(1));
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    Eigen::array<std::pair<int32, int32>, Dims> paddings_array;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    for (int i = 0; i < Dims; ++i) {
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      paddings_array[i] = std::make_pair(paddings(i, 0), paddings(i, 1));
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    }
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    functor::Pad<Device, T, Dims> functor;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur    functor(context->eigen_device<Device>(), output->tensor<T, Dims>(), input,
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur            paddings_array);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  }
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur};
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#define REGISTER_KERNEL(type)                            \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  REGISTER_KERNEL_BUILDER(Name("Pad")                    \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                              .Device(DEVICE_CPU)        \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                              .TypeConstraint<type>("T") \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                              .HostMemory("paddings"),   \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                          PadOp<CPUDevice, type>)
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
7f12947e4f31cdf9a0cca291a653980fa204d686Benoit SteinerTF_CALL_POD_TYPES(REGISTER_KERNEL);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#undef REGISTER_KERNEL
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#if GOOGLE_CUDA
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur// Forward declarations of the functor specializations for GPU.
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlurnamespace functor {
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#define DECLARE_GPU_SPEC(T, Dims)                                  \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  template <>                                                      \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  void Pad<GPUDevice, T, Dims>::operator()(                        \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      const GPUDevice& d, typename TTypes<T, Dims>::Tensor output, \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      typename TTypes<T, Dims>::ConstTensor input,                 \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur      Eigen::array<std::pair<int32, int32>, Dims> paddings);       \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  extern template struct Pad<GPUDevice, T, Dims>;
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur#define DECLARE_GPU_SPECS(T) \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  DECLARE_GPU_SPEC(T, 0);    \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  DECLARE_GPU_SPEC(T, 1);    \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  DECLARE_GPU_SPEC(T, 2);    \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  DECLARE_GPU_SPEC(T, 3);    \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur  DECLARE_GPU_SPEC(T, 4);    \
13b63bd87e53fdb01cc87d3030f79c73bd487aa0Vijay Vasudevan  DECLARE_GPU_SPEC(T, 5);    \
13b63bd87e53fdb01cc87d3030f79c73bd487aa0Vijay Vasudevan  DECLARE_GPU_SPEC(T, 6);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath KudlurTF_CALL_GPU_NUMBER_TYPES(DECLARE_GPU_SPECS);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur}  // namespace functor
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur// Registration of the GPU implementations.
079990d8b6bb4c60f23c4d0cc9ee29190ff13b9aVijay Vasudevan#define REGISTER_GPU_KERNEL(T)                                    \
079990d8b6bb4c60f23c4d0cc9ee29190ff13b9aVijay Vasudevan  REGISTER_KERNEL_BUILDER(Name("Pad")                             \
079990d8b6bb4c60f23c4d0cc9ee29190ff13b9aVijay Vasudevan                              .Device(DEVICE_GPU)                 \
079990d8b6bb4c60f23c4d0cc9ee29190ff13b9aVijay Vasudevan                              .TypeConstraint<T>("T")             \
079990d8b6bb4c60f23c4d0cc9ee29190ff13b9aVijay Vasudevan                              .TypeConstraint<int32>("Tpaddings") \
079990d8b6bb4c60f23c4d0cc9ee29190ff13b9aVijay Vasudevan                              .HostMemory("paddings"),            \
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur                          PadOp<GPUDevice, T>)
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath KudlurTF_CALL_GPU_NUMBER_TYPES(REGISTER_GPU_KERNEL);
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan// A special GPU kernel for int32.
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan// TODO(b/25387198): Also enable int32 in device memory. This kernel
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan// registration requires all int32 inputs and outputs to be in host memory.
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay VasudevanREGISTER_KERNEL_BUILDER(Name("Pad")
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan                            .Device(DEVICE_GPU)
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan                            .TypeConstraint<int32>("T")
079990d8b6bb4c60f23c4d0cc9ee29190ff13b9aVijay Vasudevan                            .TypeConstraint<int32>("Tpaddings")
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan                            .HostMemory("input")
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan                            .HostMemory("paddings")
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan                            .HostMemory("output"),
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan                        PadOp<CPUDevice, int32>);
fe056f0b5e52db86766761f5e6446a89c1aa3938Vijay Vasudevan#endif
ab34d55ce7618e52069a2e1c9e51aac5a1ea81c3Vijay Vasudevan
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp#ifdef TENSORFLOW_USE_SYCL
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp// Registration of the GPU implementations.
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp#define REGISTER_SYCL_KERNEL(T)                                   \
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp  REGISTER_KERNEL_BUILDER(Name("Pad")                             \
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp                              .Device(DEVICE_SYCL)                \
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp                              .TypeConstraint<T>("T")             \
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp                              .TypeConstraint<int32>("Tpaddings") \
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp                              .HostMemory("paddings"),            \
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp                          PadOp<SYCLDevice, T>)
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp
3e975ea978bac4d861bb09328b06f3c316212611Andrew HarpREGISTER_SYCL_KERNEL(float);
3e975ea978bac4d861bb09328b06f3c316212611Andrew HarpREGISTER_SYCL_KERNEL(double);
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp// A special GPU kernel for int32.
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp// TODO(b/25387198): Also enable int32 in device memory. This kernel
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp// registration requires all int32 inputs and outputs to be in host memory.
3e975ea978bac4d861bb09328b06f3c316212611Andrew HarpREGISTER_KERNEL_BUILDER(Name("Pad")
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp                            .Device(DEVICE_SYCL)
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp                            .TypeConstraint<int32>("T")
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp                            .TypeConstraint<int32>("Tpaddings")
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp                            .HostMemory("input")
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp                            .HostMemory("paddings")
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp                            .HostMemory("output"),
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp                        PadOp<CPUDevice, int32>);
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp#endif // TENSORFLOW_USE_SYCL
3e975ea978bac4d861bb09328b06f3c316212611Andrew Harp
f41959ccb2d9d4c722fe8fc3351401d53bcf490Manjunath Kudlur}  // end namespace tensorflow