tensorrt/convert/convert_nodes.cc

6908cc233c679b8fe61d99a30d3828362caf47beSami Kama/* Copyright 2018 The TensorFlow Authors. All Rights Reserved.
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami KamaLicensed under the Apache License, Version 2.0 (the "License");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamayou may not use this file except in compliance with the License.
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami KamaYou may obtain a copy of the License at
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    http://www.apache.org/licenses/LICENSE-2.0
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami KamaUnless required by applicable law or agreed to in writing, software
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamadistributed under the License is distributed on an "AS IS" BASIS,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami KamaWITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami KamaSee the License for the specific language governing permissions and
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamalimitations under the License.
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama==============================================================================*/
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
d7b4fe4d4322a3fdab8a1dedb93d37a1f800a559gracehoney#include "tensorflow/contrib/tensorrt/convert/convert_nodes.h"
d7b4fe4d4322a3fdab8a1dedb93d37a1f800a559gracehoney
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama#include <algorithm>
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama#include <list>
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama#include <map>
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama#include <memory>
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama#include <set>
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama#include <unordered_map>
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama#include <utility>
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama#include <vector>
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama#include "tensorflow/core/framework/node_def_builder.h"
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney#include "tensorflow/core/framework/types.h"
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama#include "tensorflow/core/graph/algorithm.h"
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama#include "tensorflow/core/graph/graph.h"
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama#include "tensorflow/core/graph/graph_constructor.h"
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama#include "tensorflow/core/lib/core/errors.h"
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama#include "tensorflow/core/lib/core/status.h"
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney#include "tensorflow/core/lib/strings/strcat.h"
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama#include "tensorflow/core/platform/logging.h"
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney#include "tensorflow/core/platform/tensor_coding.h"
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney#include "tensorflow/core/platform/types.h"
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
ae740a67bdc01b991ead6ac047c774bff4d7bc8fJie#if GOOGLE_CUDA
ae740a67bdc01b991ead6ac047c774bff4d7bc8fJie#if GOOGLE_TENSORRT
ae740a67bdc01b991ead6ac047c774bff4d7bc8fJie#include "tensorflow/contrib/tensorrt/log/trt_logger.h"
8e03944589542bd64559d68989bca4a4705eed93gracehoney#include "tensorrt/include/NvInfer.h"
8e03944589542bd64559d68989bca4a4705eed93gracehoney
d7b4fe4d4322a3fdab8a1dedb93d37a1f800a559gracehoney//  Check if the types are equal. Cast to int first so that failure log message
d7b4fe4d4322a3fdab8a1dedb93d37a1f800a559gracehoney//  would work!
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama#define CHECK_EQ_TYPE(val1, val2) CHECK_EQ((int)val1, (int)val2)
8e03944589542bd64559d68989bca4a4705eed93gracehoney
6908cc233c679b8fe61d99a30d3828362caf47beSami Kamanamespace tensorflow {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamanamespace tensorrt {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamanamespace convert {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamanamespace {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoneyinline tensorflow::Status ConvertDType(tensorflow::DataType tf_dtype,
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney                                       nvinfer1::DataType* trt_dtype) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  switch (tf_dtype) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    case tensorflow::DataType::DT_FLOAT:
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      *trt_dtype = nvinfer1::DataType::kFLOAT;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      break;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    case tensorflow::DataType::DT_INT8:
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      *trt_dtype = nvinfer1::DataType::kINT8;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      break;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    case tensorflow::DataType::DT_HALF:
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      *trt_dtype = nvinfer1::DataType::kHALF;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      break;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    default:
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      return tensorflow::errors::InvalidArgument("Unsupported data type");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return tensorflow::Status::OK();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoneyinline nvinfer1::Dims GetTensorShape(const tensorflow::Tensor& tensor) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::Dims dims;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  dims.nbDims = tensor.dims();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  for (int i = 0; i < dims.nbDims; i++) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    dims.d[i] = tensor.dim_size(i);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return dims;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoneyinline int64_t GetShapeSize(nvinfer1::Dims shape) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // Returns total number of elements in shape
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  int64_t count = 1;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  for (int d = 0; d < shape.nbDims; ++d) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    count *= shape.d[d];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return count;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoneystatic std::vector<std::pair<int, int>> CreateSamePadding(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    const nvinfer1::DimsHW& stride, const nvinfer1::DimsHW& kernel,
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    const std::vector<int64_t>& input_dims) {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  std::vector<std::pair<int, int>> padding(input_dims.size());
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  CHECK_EQ((size_t)stride.nbDims, input_dims.size());  // TODO(jie): N+C? NC+?
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  for (size_t i = 0; i < input_dims.size(); ++i) {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    // Formula to calculate the padding
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    int p = ((input_dims[i] - 1) / stride.d[i]) * stride.d[i] + kernel.d[i] -
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney            input_dims[i];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    p = (p > 0) ? p : 0;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    // Right precedence padding, like in TensorFlow
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    int left = p / 2;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    int right = p - left;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama    VLOG(2) << "PADDING_" << i << " pre: " << left << ", post: " << right
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney            << "paras: " << input_dims[i] << ", " << stride.d[i] << ", "
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama            << "kernel: " << kernel.d[i];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    padding[i] = {left, right};
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return padding;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamaclass TRT_ShapedWeights {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama public:
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  TRT_ShapedWeights(tensorflow::DataType type, const void* values,
cfa374cefe132be886c26a374c51454177c68868gracehoney                    nvinfer1::Dims shape,
cfa374cefe132be886c26a374c51454177c68868gracehoney                    const std::vector<char>* owned_values = nullptr)
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      : shape_(shape),
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney        type_(type),
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney        values_(values),
cfa374cefe132be886c26a374c51454177c68868gracehoney        owned_values_(owned_values ? *owned_values : std::vector<char>({})),
cd63c718be123324b6c39e0f8fbe453319799746Jie        empty_weight_flag_(false) {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    // Note: this->shape.type[] is not used
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  }
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  explicit TRT_ShapedWeights(tensorflow::DataType type)
cfa374cefe132be886c26a374c51454177c68868gracehoney      : shape_(),
cfa374cefe132be886c26a374c51454177c68868gracehoney        type_(type),
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney        values_(nullptr),
cfa374cefe132be886c26a374c51454177c68868gracehoney        owned_values_(),
cd63c718be123324b6c39e0f8fbe453319799746Jie        empty_weight_flag_(true) {}
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney
cfa374cefe132be886c26a374c51454177c68868gracehoney  TRT_ShapedWeights(const TRT_ShapedWeights& rhs)
cfa374cefe132be886c26a374c51454177c68868gracehoney      : shape_(rhs.shape_),
cfa374cefe132be886c26a374c51454177c68868gracehoney        type_(rhs.type_),
cfa374cefe132be886c26a374c51454177c68868gracehoney        values_(rhs.values_),
cfa374cefe132be886c26a374c51454177c68868gracehoney        owned_values_(rhs.owned_values_),
cd63c718be123324b6c39e0f8fbe453319799746Jie        empty_weight_flag_(rhs.empty_weight_flag_) {}
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  int64_t count() const {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    int64_t c = 1;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    for (int i = 0; i < shape_.nbDims; i++) c *= shape_.d[i];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return c;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  nvinfer1::Weights GetWeightsForTRT() const {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    nvinfer1::DataType trt_type(nvinfer1::DataType::kFLOAT);
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    TF_CHECK_OK(ConvertDType(type_, &trt_type));
cd63c718be123324b6c39e0f8fbe453319799746Jie    if (empty_weight_flag_) return nvinfer1::Weights{trt_type, nullptr, 0};
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    // Note: this->shape.type[] is not used
cfa374cefe132be886c26a374c51454177c68868gracehoney    return nvinfer1::Weights{trt_type, GetValues(), GetShapeSize(shape_)};
cfa374cefe132be886c26a374c51454177c68868gracehoney  }
cfa374cefe132be886c26a374c51454177c68868gracehoney
cfa374cefe132be886c26a374c51454177c68868gracehoney  const void* GetValues() const {
cfa374cefe132be886c26a374c51454177c68868gracehoney    if (values_) return values_;
cfa374cefe132be886c26a374c51454177c68868gracehoney    if (owned_values_.size()) return owned_values_.data();
cfa374cefe132be886c26a374c51454177c68868gracehoney    return nullptr;
cfa374cefe132be886c26a374c51454177c68868gracehoney  }
cfa374cefe132be886c26a374c51454177c68868gracehoney
cfa374cefe132be886c26a374c51454177c68868gracehoney  void SetValues(const void* values) {
cfa374cefe132be886c26a374c51454177c68868gracehoney    values_ = values;
cfa374cefe132be886c26a374c51454177c68868gracehoney    owned_values_.clear();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  size_t size_bytes() const {
75adab6104362d71ce28b0269bf31fd30471b1b6Jie    int type_size = tensorflow::DataTypeSize(this->type_);
75adab6104362d71ce28b0269bf31fd30471b1b6Jie    return this->count() * type_size;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Default converter
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  operator nvinfer1::Weights() const { return GetWeightsForTRT(); }
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  nvinfer1::Dims shape_;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  tensorflow::DataType type_;
cfa374cefe132be886c26a374c51454177c68868gracehoney
cfa374cefe132be886c26a374c51454177c68868gracehoney private:
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  const void* values_;
cfa374cefe132be886c26a374c51454177c68868gracehoney  std::vector<char> owned_values_;
cd63c718be123324b6c39e0f8fbe453319799746Jie  bool empty_weight_flag_;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama};
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamaclass TRT_TensorOrWeights {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama public:
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  explicit TRT_TensorOrWeights(nvinfer1::ITensor* tensor)
cd63c718be123324b6c39e0f8fbe453319799746Jie      : tensor_(tensor), weights_(DT_FLOAT), variant_(TRT_NODE_TENSOR) {}
cfa374cefe132be886c26a374c51454177c68868gracehoney  explicit TRT_TensorOrWeights(const TRT_ShapedWeights& weights)
cd63c718be123324b6c39e0f8fbe453319799746Jie      : tensor_(nullptr), weights_(weights), variant_(TRT_NODE_WEIGHTS) {}
cfa374cefe132be886c26a374c51454177c68868gracehoney  TRT_TensorOrWeights(const TRT_TensorOrWeights& rhs)
cd63c718be123324b6c39e0f8fbe453319799746Jie      : tensor_(rhs.tensor_),
cd63c718be123324b6c39e0f8fbe453319799746Jie        weights_(rhs.weights_),
cd63c718be123324b6c39e0f8fbe453319799746Jie        variant_(rhs.variant_) {}
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  ~TRT_TensorOrWeights() {}
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney
cd63c718be123324b6c39e0f8fbe453319799746Jie  bool is_tensor() const { return variant_ == TRT_NODE_TENSOR; }
cd63c718be123324b6c39e0f8fbe453319799746Jie  bool is_weights() const { return variant_ == TRT_NODE_WEIGHTS; }
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::ITensor* tensor() {
cfa374cefe132be886c26a374c51454177c68868gracehoney    CHECK_EQ(is_tensor(), true);
cd63c718be123324b6c39e0f8fbe453319799746Jie    return tensor_;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
cfa374cefe132be886c26a374c51454177c68868gracehoney  const nvinfer1::ITensor* tensor() const {
cfa374cefe132be886c26a374c51454177c68868gracehoney    CHECK_EQ(is_tensor(), true);
cd63c718be123324b6c39e0f8fbe453319799746Jie    return tensor_;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TRT_ShapedWeights& weights() {
cfa374cefe132be886c26a374c51454177c68868gracehoney    CHECK_EQ(is_weights(), true);
cd63c718be123324b6c39e0f8fbe453319799746Jie    return weights_;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  const TRT_ShapedWeights& weights() const {
cfa374cefe132be886c26a374c51454177c68868gracehoney    CHECK_EQ(is_weights(), true);
cd63c718be123324b6c39e0f8fbe453319799746Jie    return weights_;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::Dims shape() const {
cfa374cefe132be886c26a374c51454177c68868gracehoney    if (is_tensor()) {
cfa374cefe132be886c26a374c51454177c68868gracehoney      return tensor()->getDimensions();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    } else {
cfa374cefe132be886c26a374c51454177c68868gracehoney      return weights().shape_;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney private:
cd63c718be123324b6c39e0f8fbe453319799746Jie  nvinfer1::ITensor* tensor_;
cd63c718be123324b6c39e0f8fbe453319799746Jie  TRT_ShapedWeights weights_;
cd63c718be123324b6c39e0f8fbe453319799746Jie  enum { TRT_NODE_TENSOR, TRT_NODE_WEIGHTS } variant_;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama};
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamaclass TFAttrs {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama public:
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  explicit TFAttrs(const tensorflow::NodeDef& tf_node) {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    for (const auto& attr : tf_node.attr()) {
cd63c718be123324b6c39e0f8fbe453319799746Jie      attrs_.insert({attr.first, &attr.second});
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
cd63c718be123324b6c39e0f8fbe453319799746Jie  bool count(string key) const { return attrs_.count(key); }
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  tensorflow::AttrValue const* at(string key) const {
cd63c718be123324b6c39e0f8fbe453319799746Jie    if (!attrs_.count(key)) {
8e03944589542bd64559d68989bca4a4705eed93gracehoney      LOG(FATAL) << "Attribute not found: " << key;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
cd63c718be123324b6c39e0f8fbe453319799746Jie    return attrs_.at(key);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  template <typename T>
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  T get(string key) const;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  template <typename T>
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  T get(string key, const T& default_value) const {
cd63c718be123324b6c39e0f8fbe453319799746Jie    return attrs_.count(key) ? this->get<T>(key) : default_value;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney private:
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  typedef std::map<string, tensorflow::AttrValue const*> AttrMap;
cd63c718be123324b6c39e0f8fbe453319799746Jie  AttrMap attrs_;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama};
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatemplate <>
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoneystring TFAttrs::get<string>(string key) const {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return this->at(key)->s();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatemplate <>
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoneystd::vector<int> TFAttrs::get<std::vector<int>>(string key) const {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto attr = this->at(key)->list().i();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return std::vector<int>(attr.begin(), attr.end());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatemplate <>
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoneynvinfer1::Dims TFAttrs::get<nvinfer1::Dims>(string key) const {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto values = this->get<std::vector<int>>(key);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::Dims dims;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  dims.nbDims = values.size();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  std::copy(values.begin(), values.end(), dims.d);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // Note: No dimension type information is included
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return dims;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
6908cc233c679b8fe61d99a30d3828362caf47beSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatemplate <>
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoneynvinfer1::DataType TFAttrs::get<nvinfer1::DataType>(string key) const {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::DataType trt_dtype(nvinfer1::DataType::kFLOAT);
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  TF_CHECK_OK(ConvertDType(this->at(key)->type(), &trt_dtype));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return trt_dtype;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
6908cc233c679b8fe61d99a30d3828362caf47beSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatemplate <>
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoneytensorflow::DataType TFAttrs::get<tensorflow::DataType>(string key) const {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return this->at(key)->type();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatemplate <typename T>
cfa374cefe132be886c26a374c51454177c68868gracehoneyvoid Reorder4(nvinfer1::DimsNCHW shape, const T* idata,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama              nvinfer1::DimsNCHW istrides, T* odata,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama              nvinfer1::DimsNCHW ostrides) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  for (int n = 0; n < shape.n(); ++n) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    for (int c = 0; c < shape.c(); ++c) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      for (int h = 0; h < shape.h(); ++h) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        for (int w = 0; w < shape.w(); ++w) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama          odata[n * ostrides.n() + c * ostrides.c() + h * ostrides.h() +
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                w * ostrides.w()] = idata[n * istrides.n() + c * istrides.c() +
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                          h * istrides.h() + w * istrides.w()];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoneyvoid ReorderRSCKToKCRS(const TRT_ShapedWeights& iweights,
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney                       TRT_ShapedWeights* oweights) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  CHECK_EQ(iweights.type_, oweights->type_);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  CHECK_EQ(iweights.size_bytes(), oweights->size_bytes());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  int r = iweights.shape_.d[0];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  int s = iweights.shape_.d[1];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  int c = iweights.shape_.d[2];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  int k = iweights.shape_.d[3];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  oweights->shape_.d[0] = k;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  oweights->shape_.d[1] = c;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  oweights->shape_.d[2] = r;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  oweights->shape_.d[3] = s;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::DimsNCHW istrides = {1, k, s * k * c, c * k};
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::DimsNCHW ostrides = {c * r * s, r * s, s, 1};
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  switch (iweights.type_) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    case tensorflow::DataType::DT_FLOAT:
cfa374cefe132be886c26a374c51454177c68868gracehoney      Reorder4({k, c, r, s}, static_cast<float const*>(iweights.GetValues()),
cfa374cefe132be886c26a374c51454177c68868gracehoney               istrides,
cfa374cefe132be886c26a374c51454177c68868gracehoney               static_cast<float*>(const_cast<void*>(oweights->GetValues())),
cfa374cefe132be886c26a374c51454177c68868gracehoney               ostrides);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      break;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    default:
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      LOG(FATAL) << "!!!!!!!!!!!!!!!!!!!!!!!!broke!!!!!!!!!!!!";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamastruct InferDeleter {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  template <typename T>
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  void operator()(T* obj) const {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    if (obj) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      obj->destroy();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama};
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatemplate <typename T>
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamainline std::shared_ptr<T> infer_object(T* obj) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return std::shared_ptr<T>(obj, InferDeleter());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama// Logger for GIE info/warning/errors
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamaclass Converter;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamausing OpConverter =
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    std::function<tensorflow::Status(Converter&, const tensorflow::NodeDef&,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                     std::vector<TRT_TensorOrWeights> const&,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                     std::vector<TRT_TensorOrWeights>*)>;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamaclass Converter {
cd63c718be123324b6c39e0f8fbe453319799746Jie  std::unordered_map<string, TRT_TensorOrWeights> trt_tensors_;
cd63c718be123324b6c39e0f8fbe453319799746Jie  std::unordered_map<string, OpConverter> op_registry_;
cd63c718be123324b6c39e0f8fbe453319799746Jie  nvinfer1::INetworkDefinition* trt_network_;
cd63c718be123324b6c39e0f8fbe453319799746Jie  std::list<std::vector<uint8_t>> temp_bufs_;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  void register_op_converters();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  std::vector<TRT_TensorOrWeights> get_inputs(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      const tensorflow::NodeDef& node_def) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    std::vector<TRT_TensorOrWeights> inputs;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    for (const auto& input_name : node_def.input()) {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      VLOG(2) << "Retrieve input: " << input_name;
cd63c718be123324b6c39e0f8fbe453319799746Jie      inputs.push_back(trt_tensors_.at(input_name));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return inputs;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama public:
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  explicit Converter(nvinfer1::INetworkDefinition* trt_network)
cd63c718be123324b6c39e0f8fbe453319799746Jie      : trt_network_(trt_network) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    this->register_op_converters();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TRT_ShapedWeights get_temp_weights(tensorflow::DataType type,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                     nvinfer1::Dims shape) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    TRT_ShapedWeights weights(type, nullptr, shape);
75adab6104362d71ce28b0269bf31fd30471b1b6Jie    // TODO(jie): check weights size_bytes. 0 means type error
cd63c718be123324b6c39e0f8fbe453319799746Jie    temp_bufs_.push_back(std::vector<uint8_t>(weights.size_bytes()));
cd63c718be123324b6c39e0f8fbe453319799746Jie    weights.SetValues(temp_bufs_.back().data());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return weights;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  TRT_ShapedWeights get_temp_weights_like(const TRT_ShapedWeights& weights) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return this->get_temp_weights(weights.type_, weights.shape_);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  tensorflow::Status convert_node(const tensorflow::NodeDef& node_def) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    std::vector<TRT_TensorOrWeights> inputs = this->get_inputs(node_def);
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    string op = node_def.op();
cd63c718be123324b6c39e0f8fbe453319799746Jie    if (!op_registry_.count(op)) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      return tensorflow::errors::Unimplemented(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney          "No converter registered for op: " + op);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
cd63c718be123324b6c39e0f8fbe453319799746Jie    OpConverter op_converter = op_registry_.at(op);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    std::vector<TRT_TensorOrWeights> outputs;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    TF_RETURN_IF_ERROR(op_converter(*this, node_def, inputs, &outputs));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    for (size_t i = 0; i < outputs.size(); ++i) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      TRT_TensorOrWeights output = outputs.at(i);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      // TODO(jie): tf protobuf seems to be omitting the :0 suffix
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      string output_name = node_def.name();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      if (i != 0) output_name = output_name + ":" + std::to_string(i);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      if (output.is_tensor()) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        output.tensor()->setName(output_name.c_str());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      }
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      VLOG(2) << "Write out tensor: " << output_name;
cd63c718be123324b6c39e0f8fbe453319799746Jie      if (!trt_tensors_.insert({output_name, output}).second) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        return tensorflow::errors::AlreadyExists(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney            "Output tensor already exists for op: " + op);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::Status::OK();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
cd63c718be123324b6c39e0f8fbe453319799746Jie  nvinfer1::INetworkDefinition* network() { return trt_network_; }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  TRT_TensorOrWeights get_tensor(string name) {
cd63c718be123324b6c39e0f8fbe453319799746Jie    if (!trt_tensors_.count(name)) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      return TRT_TensorOrWeights(nullptr);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
cd63c718be123324b6c39e0f8fbe453319799746Jie    return trt_tensors_.at(name);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  bool insert_input_tensor(string name, nvinfer1::ITensor* tensor) {
cd63c718be123324b6c39e0f8fbe453319799746Jie    return trt_tensors_.insert({name, TRT_TensorOrWeights(tensor)}).second;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  nvinfer1::ITensor* TransposeTensor(nvinfer1::ITensor* input_tensor,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                     std::vector<int> order) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    auto dims = input_tensor->getDimensions();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    // TODO(jie): change the return to status and properly exit
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    if (order.size() - 1 != size_t(dims.nbDims))
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      LOG(ERROR) << "Dimension does not match, fail gracefully";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    nvinfer1::IShuffleLayer* layer = this->network()->addShuffle(*input_tensor);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    nvinfer1::Permutation permutation;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    for (int32_t i = 0; i < dims.nbDims; ++i) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      permutation.order[i] = order[i + 1] - 1;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    layer->setFirstTranspose(permutation);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    nvinfer1::Dims reshape_dims;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    reshape_dims.nbDims = dims.nbDims;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    for (int32_t i = 0; i < reshape_dims.nbDims; ++i) {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      reshape_dims.d[i] = 0;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      reshape_dims.type[i] = dims.type[i];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    layer->setReshapeDimensions(reshape_dims);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return layer->getOutput(0);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama};
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
6908cc233c679b8fe61d99a30d3828362caf47beSami Kama// ****************************************************************************
e01844e65e0dbd2682a894946bec7f072d36fa27Jie// Constant folding functions
e01844e65e0dbd2682a894946bec7f072d36fa27Jie// TODO(jie): once optimizer kicks in, we should have done constant folding
e01844e65e0dbd2682a894946bec7f072d36fa27Jie// there.
6908cc233c679b8fe61d99a30d3828362caf47beSami Kama//*****************************************************************************/
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamastruct LambdaFactory {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  enum class OP_CATEGORY : int { RSQRT = 0, NEG, ADD, MUL, SUB };
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  OP_CATEGORY op;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  template <typename T>
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  std::function<T(T)> unary() {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    switch (op) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      case OP_CATEGORY::RSQRT: {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama        VLOG(2) << "RSQRT GETS DONE";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        return [](T t) -> T { return 1.0 / std::sqrt(t); };
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      case OP_CATEGORY::NEG:
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        return [](T t) -> T { return -t; };
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      default:
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney        VLOG(2) << "Not supported op for unary: " << static_cast<int>(op);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        return nullptr;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  template <typename T>
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  std::function<T(T, T)> binary() {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    switch (op) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      case OP_CATEGORY::ADD:
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        return [](T l, T r) -> T { return l + r; };
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      case OP_CATEGORY::SUB:
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        return [](T l, T r) -> T { return l - r; };
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      case OP_CATEGORY::MUL:
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        return [](T l, T r) -> T { return l * r; };
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      default:
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney        LOG(WARNING) << "Not supported op for binary: " << static_cast<int>(op);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return [](T l, T r) -> T {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      LOG(FATAL) << "Unsupported op type ";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      return l;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    };
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  template <typename T>
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  std::function<T(T)> broadcast_r(T val) {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama    VLOG(2) << "LAMBDA VAL : " << val;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    switch (op) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      case OP_CATEGORY::ADD:
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        return [val](T l) -> T {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama          VLOG(2) << "LAMBDA VAL : " << val;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama          return l + val;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        };
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      // Return [val](T l)-> T {return l+val;};
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      case OP_CATEGORY::SUB:
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        return [val](T l) -> T {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama          VLOG(2) << "LAMBDA VAL : " << val;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama          return l - val;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        };
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      case OP_CATEGORY::MUL:
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        return [val](T l) -> T {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama          VLOG(2) << "LAMBDA VAL : " << val;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama          return l * val;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        };
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      default:
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney        LOG(WARNING) << "Not supported op for binary: " << static_cast<int>(op);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return [val](T l) -> T {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      LOG(FATAL) << "Unsupported op type ";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      return l;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    };
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  template <typename T>
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  std::function<T(T)> broadcast_l(T val) {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama    VLOG(2) << "LAMBDA VAL : " << val;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    switch (op) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      case OP_CATEGORY::ADD:
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        return [val](T l) -> T {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama          VLOG(2) << "LAMBDA VAL : " << val;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama          return val + l;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        };
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      case OP_CATEGORY::SUB:
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        return [val](T l) -> T {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama          VLOG(2) << "LAMBDA VAL : " << val;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama          return val - l;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        };
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      case OP_CATEGORY::MUL:
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        return [val](T l) -> T {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama          VLOG(2) << "LAMBDA VAL : " << val;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama          return val * l;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        };
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      default:
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney        LOG(ERROR) << "Not supported op for binary: " << static_cast<int>(op);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return [val](T l) -> T {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      LOG(FATAL) << "Unsupported op type ";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      return l;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    };
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama};
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoneytensorflow::Status UnaryCompute(const TRT_ShapedWeights& iweights,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                TRT_ShapedWeights* oweights,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                LambdaFactory unary_op) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  CHECK_EQ(iweights.type_, oweights->type_);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  switch (iweights.type_) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    case tensorflow::DataType::DT_FLOAT: {
cfa374cefe132be886c26a374c51454177c68868gracehoney      auto inp = static_cast<float const*>(iweights.GetValues());
cfa374cefe132be886c26a374c51454177c68868gracehoney      auto oup = static_cast<float*>(const_cast<void*>(oweights->GetValues()));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      std::transform(inp, inp + iweights.count(), oup, unary_op.unary<float>());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      break;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    default:
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      return tensorflow::errors::Unimplemented(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney          "Data type not supported: " +
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney          tensorflow::DataTypeString(iweights.type_));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return tensorflow::Status::OK();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoneytensorflow::Status BinaryCompute(const TRT_ShapedWeights& iweights_l,
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney                                 const TRT_ShapedWeights& iweights_r,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                 TRT_ShapedWeights* oweights,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                 LambdaFactory binary_op) {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Assume iweights_l.type == iweight_r.type
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  CHECK_EQ(iweights_l.type_, oweights->type_);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  CHECK_EQ(iweights_r.type_, oweights->type_);
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama  VLOG(2) << "SANITY CHECK!";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  switch (iweights_l.type_) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    case tensorflow::DataType::DT_FLOAT: {
cfa374cefe132be886c26a374c51454177c68868gracehoney      auto inp_l = static_cast<const float*>(iweights_l.GetValues());
cfa374cefe132be886c26a374c51454177c68868gracehoney      auto inp_r = static_cast<const float*>(iweights_r.GetValues());
cfa374cefe132be886c26a374c51454177c68868gracehoney      auto oup = static_cast<float*>(const_cast<void*>(oweights->GetValues()));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      if (iweights_l.count() != iweights_r.count()) {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney        // We only supports broadcast of RankZero
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        if (iweights_l.count() == 1) {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama          VLOG(2) << "I bet it is not working!" << (*inp_l);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama          std::transform(inp_r, inp_r + iweights_r.count(), oup,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                         binary_op.broadcast_l<float>(*inp_l));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        } else if (iweights_r.count() == 1) {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama          VLOG(2) << "I bet it is not working!" << (*inp_r);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama          std::transform(inp_l, inp_l + iweights_l.count(), oup,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                         binary_op.broadcast_r<float>(*inp_r));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        } else {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama          return tensorflow::errors::Unimplemented(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama              "Binary op with non-rankZero broadcast not supported");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      } else {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        std::transform(inp_l, inp_l + iweights_l.count(), inp_r, oup,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                       binary_op.binary<float>());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      break;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    default:
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      return tensorflow::errors::Unimplemented(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney          "Data type not supported: " +
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney          tensorflow::DataTypeString(iweights_l.type_));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return tensorflow::Status::OK();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatensorflow::Status ConstantFoldUnary(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    Converter& ctx, const tensorflow::NodeDef& node_def,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    std::vector<TRT_TensorOrWeights> const& inputs,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    std::vector<TRT_TensorOrWeights>* outputs) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TRT_ShapedWeights weights_input = inputs.at(0).weights();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Allocate output weights
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TRT_ShapedWeights weights_output = ctx.get_temp_weights_like(weights_input);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // FIXME assume type matches input weights
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Get trt type & shape
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Maybe this part has to be moved into the block of rsqrt later
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Check type consistency
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  CHECK_EQ(weights_input.type_,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama           TFAttrs(node_def).get<tensorflow::DataType>("T"));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // Maybe I should do a switch
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  LambdaFactory unary_op;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (node_def.op() == "Rsqrt") {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    // Compute rsqrt
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    unary_op.op = LambdaFactory::OP_CATEGORY::RSQRT;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    auto ret = UnaryCompute(weights_input, &weights_output, unary_op);
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    // PAss the output
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    if (ret == tensorflow::Status::OK()) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      outputs->push_back(TRT_TensorOrWeights(weights_output));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return ret;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  } else {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::Unimplemented("Binary op not supported: " +
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                             node_def.op());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama// TODO(jie,ben) broadcast is needed yet not implemented
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama// Let's get the simple stuff working first. Maybe we should fall bakc to TF
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama//   approach for constant folding
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatensorflow::Status ConstantFoldBinary(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    Converter& ctx, const tensorflow::NodeDef& node_def,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    std::vector<TRT_TensorOrWeights> const& inputs,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    std::vector<TRT_TensorOrWeights>* outputs) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TRT_ShapedWeights weights_input_l = inputs.at(0).weights();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TRT_ShapedWeights weights_input_r = inputs.at(1).weights();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Check type consistency
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  CHECK_EQ(weights_input_l.type_, weights_input_r.type_);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (weights_input_l.shape_.nbDims != weights_input_r.shape_.nbDims)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::Unimplemented(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        "Binary op implicit broadcast not supported: " + node_def.op());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // TODO(jie): constant fold should really fall back to TF.
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  int nb_dims = weights_input_l.shape_.nbDims;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::Dims output_shape;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  output_shape.nbDims = nb_dims;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  VLOG(2) << "nb_dims: " << nb_dims
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney          << ", the other: " << weights_input_r.shape_.nbDims;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  for (int i = 0; i < nb_dims; i++) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    if (weights_input_l.shape_.d[i] == weights_input_r.shape_.d[i]) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      output_shape.d[i] = weights_input_l.shape_.d[i];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    } else if (weights_input_l.shape_.d[i] == 1 ||
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama               weights_input_r.shape_.d[i] == 1) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      output_shape.d[i] =
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama          std::max(weights_input_l.shape_.d[i], weights_input_r.shape_.d[i]);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    } else {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      return tensorflow::errors::Unimplemented(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama          "Binary op with incompatible shape at, " + node_def.op());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama    VLOG(2) << "left: " << weights_input_l.shape_.d[i]
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama            << "right: " << weights_input_r.shape_.d[i]
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama            << "output: " << output_shape.d[i];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // FIXME assume type matches input weights
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Get trt type & shape
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TFAttrs attrs(node_def);
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Maybe this part has to be moved into the block of rsqrt later
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  tensorflow::DataType dtype = attrs.get<tensorflow::DataType>("T");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Allocate output weights
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TRT_ShapedWeights weights_output = ctx.get_temp_weights(dtype, output_shape);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // Maybe I should do a switch
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  LambdaFactory binary_op;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (node_def.op() == "Sub") {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    binary_op.op = LambdaFactory::OP_CATEGORY::SUB;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  } else if (node_def.op() == "Mul") {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    binary_op.op = LambdaFactory::OP_CATEGORY::MUL;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  } else if (node_def.op() == "Add") {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    binary_op.op = LambdaFactory::OP_CATEGORY::ADD;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  } else {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::Unimplemented("Binary op not supported: " +
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                             node_def.op());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto ret = BinaryCompute(weights_input_l, weights_input_r, &weights_output,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                           binary_op);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Pass the output
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (ret == tensorflow::Status::OK()) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    outputs->push_back(TRT_TensorOrWeights(weights_output));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return ret;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney// TODO(jie): broadcast is needed yet not implemented.
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney// Only implemented channel wise for the time being
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatensorflow::Status BinaryTensorOpWeight(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    Converter& ctx, const tensorflow::NodeDef& node_def,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    const nvinfer1::ITensor* tensor, TRT_ShapedWeights weights,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    std::vector<TRT_TensorOrWeights>* outputs) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // FIXME assume type matches input weights
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Get trt type & shape
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Maybe this part has to be moved into the block of rsqrt later
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Check type consistency
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto dtype = TFAttrs(node_def).get<nvinfer1::DataType>("T");
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  CHECK_EQ_TYPE(tensor->getType(), dtype);  // Cast to int for error messages
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::DataType ttype;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  TF_CHECK_OK(ConvertDType(weights.type_, &ttype));
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  CHECK_EQ_TYPE(ttype, dtype);  // Cast to int for error message
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Check scale mode
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto dims_w = weights.shape_;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto dims_t = tensor->getDimensions();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Default to channel-wise
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto scale_mode = nvinfer1::ScaleMode::kELEMENTWISE;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (weights.count() == 1) {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama    VLOG(2) << "UNIFORM";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    scale_mode = nvinfer1::ScaleMode::kUNIFORM;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  } else {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    // No broadcasting on Batch dimension;
e01844e65e0dbd2682a894946bec7f072d36fa27Jie    assert(dims_w.d[0] == 1);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    // Broadcasting on Channel dimension only allowed in kUNIFORM
e01844e65e0dbd2682a894946bec7f072d36fa27Jie    assert(dims_w.d[1] == dims_t.d[0]);
e01844e65e0dbd2682a894946bec7f072d36fa27Jie    assert(dims_w.nbDims == dims_t.nbDims);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    // Default is element;
e01844e65e0dbd2682a894946bec7f072d36fa27Jie    for (int i = 2; i < dims_w.nbDims; i++) {
e01844e65e0dbd2682a894946bec7f072d36fa27Jie      if (dims_w.d[i] != dims_t.d[i - 1]) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        scale_mode = nvinfer1::ScaleMode::kCHANNEL;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        break;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    if (scale_mode == nvinfer1::ScaleMode::kELEMENTWISE) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      scale_mode = nvinfer1::ScaleMode::kELEMENTWISE;
e01844e65e0dbd2682a894946bec7f072d36fa27Jie      for (int i = 2; i < dims_w.nbDims; i++) {
e01844e65e0dbd2682a894946bec7f072d36fa27Jie        if (dims_w.d[i] != 1)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama          return tensorflow::errors::InvalidArgument(
e01844e65e0dbd2682a894946bec7f072d36fa27Jie              "Weight shape not compatible at, " + node_def.name());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Prepare weights
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  TRT_ShapedWeights shift_weights(weights.type_);
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  TRT_ShapedWeights scale_weights(weights.type_);
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  TRT_ShapedWeights power_weights(weights.type_);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // Maybe I should do a switch
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (node_def.op() == "Sub") {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    TRT_ShapedWeights neg_weights = ctx.get_temp_weights_like(weights);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    LambdaFactory unary_op;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    unary_op.op = LambdaFactory::OP_CATEGORY::NEG;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    TF_RETURN_IF_ERROR(UnaryCompute(weights, &neg_weights, unary_op));
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    shift_weights = neg_weights;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  } else if (node_def.op() == "Mul") {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    scale_weights = weights;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  } else if (node_def.op() == "Add") {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    shift_weights = weights;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  } else {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::Unimplemented("Binary op not supported: " +
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                             node_def.op());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::IScaleLayer* layer = ctx.network()->addScale(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      *const_cast<nvinfer1::ITensor*>(tensor), scale_mode, shift_weights,
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      scale_weights, power_weights);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::ITensor* output_tensor = layer->getOutput(0);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Pass the output
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  outputs->push_back(TRT_TensorOrWeights(output_tensor));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return tensorflow::Status::OK();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatensorflow::Status BinaryTensorOpTensor(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    Converter& ctx, const tensorflow::NodeDef& node_def,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    const nvinfer1::ITensor* tensor_l, const nvinfer1::ITensor* tensor_r,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    std::vector<TRT_TensorOrWeights>* outputs) {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  static const std::unordered_map<string, nvinfer1::ElementWiseOperation> ops{
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      {"Add", nvinfer1::ElementWiseOperation::kSUM},
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      {"Mul", nvinfer1::ElementWiseOperation::kPROD},
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      // {"max", nvinfer1::ElementWiseOperation::kMAX},
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      // {"min", nvinfer1::ElementWiseOperation::kMIN},
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      {"Sub", nvinfer1::ElementWiseOperation::kSUB},
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      {"Div", nvinfer1::ElementWiseOperation::kDIV},
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  };
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // FIXME assume type matches input weights
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Get trt type & shape
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TFAttrs attrs(node_def);
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Maybe this part has to be moved into the block of rsqrt later
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::DataType dtype = attrs.get<nvinfer1::DataType>("T");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Check type consistency
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  CHECK_EQ_TYPE(tensor_l->getType(), dtype);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  CHECK_EQ_TYPE(tensor_r->getType(), dtype);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto op_pair = ops.find(node_def.op());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (op_pair == ops.end())
d7b4fe4d4322a3fdab8a1dedb93d37a1f800a559gracehoney    return tensorflow::errors::Unimplemented(
d7b4fe4d4322a3fdab8a1dedb93d37a1f800a559gracehoney        "binary op: " + node_def.op() +
d7b4fe4d4322a3fdab8a1dedb93d37a1f800a559gracehoney        " not supported at: " + node_def.name());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::IElementWiseLayer* layer = ctx.network()->addElementWise(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      *const_cast<nvinfer1::ITensor*>(tensor_l),
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      *const_cast<nvinfer1::ITensor*>(tensor_r), op_pair->second);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::ITensor* output_tensor = layer->getOutput(0);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Pass the output
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  outputs->push_back(TRT_TensorOrWeights(output_tensor));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return tensorflow::Status::OK();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatensorflow::Status ConvertPlaceholder(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    Converter& ctx, const tensorflow::NodeDef& node_def,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    std::vector<TRT_TensorOrWeights> const& inputs,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    std::vector<TRT_TensorOrWeights>* outputs) {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama  VLOG(2) << "Placeholder should have been replace already";
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  return tensorflow::errors::Unimplemented(", cannot convert Placeholder op");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // OK this make sense since we are supposed to replace it with input
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TFAttrs attrs(node_def);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::DataType dtype = attrs.get<nvinfer1::DataType>("dtype");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::Dims dims = attrs.get<nvinfer1::Dims>("shape");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  dims.nbDims--;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  for (int i = 0; i < dims.nbDims; i++) dims.d[i] = dims.d[i + 1];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::ITensor* output =
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      ctx.network()->addInput(node_def.name().c_str(), dtype, dims);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (!output) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::InvalidArgument("Failed to create Input layer");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  outputs->push_back(TRT_TensorOrWeights(output));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return tensorflow::Status::OK();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatensorflow::Status ConvertConv2D(Converter& ctx,
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney                                 const tensorflow::NodeDef& node_def,
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney                                 const std::vector<TRT_TensorOrWeights>& inputs,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                 std::vector<TRT_TensorOrWeights>* outputs) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::ITensor const* tensor = inputs.at(0).tensor();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // TODO(jie): handle NHWC/NCHW transpose;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TRT_ShapedWeights weights_rsck = inputs.at(1).weights();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TRT_ShapedWeights weights = ctx.get_temp_weights_like(weights_rsck);
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  ReorderRSCKToKCRS(weights_rsck, &weights);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TRT_ShapedWeights biases(weights.type_);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  int noutput = weights.shape_.d[0];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::DimsHW kernel_size;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  kernel_size.h() = weights.shape_.d[2];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  kernel_size.w() = weights.shape_.d[3];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TFAttrs attrs(node_def);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  int h_index = 2;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  int w_index = 3;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  auto data_format = attrs.get<string>("data_format");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (data_format == "NHWC") {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    tensor = ctx.TransposeTensor(const_cast<nvinfer1::ITensor*>(tensor),
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                 {0, 3, 1, 2});
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    h_index = 1;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    w_index = 2;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    // TODO(jie): transpose it
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
e01844e65e0dbd2682a894946bec7f072d36fa27Jie
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // TODO(jie): stride. (NHWC/NCHW)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto tf_stride = attrs.get<std::vector<int>>("strides");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::DimsHW stride(tf_stride[h_index], tf_stride[w_index]);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto tensor_dim = tensor->getDimensions();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  std::vector<std::pair<int, int>> padding;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // TODO(jie): padding.
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  if (attrs.get<string>("padding") == "SAME") {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    // This is NCHW tensor with no batch dimension.
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    //  1 -> h
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    //  2 -> w
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    padding = CreateSamePadding(
e01844e65e0dbd2682a894946bec7f072d36fa27Jie        stride, kernel_size,
e01844e65e0dbd2682a894946bec7f072d36fa27Jie        {static_cast<int>(tensor_dim.d[1]), static_cast<int>(tensor_dim.d[2])});
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  } else {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    padding = {{0, 0}, {0, 0}};
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (padding[0].first != padding[0].second ||
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      padding[1].first != padding[1].second) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    // TODO(jie): handle asymmetric padding
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    VLOG(2) << "Padding!!!: " << padding[0].first << padding[0].second
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama            << padding[1].first << padding[1].second;
24e17d8e2d5adfc2fc8b6fa94b7590006b4d21a9Jie
24e17d8e2d5adfc2fc8b6fa94b7590006b4d21a9Jie    auto dim_before = tensor->getDimensions();
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama    VLOG(2) << "TENSOR before: " << dim_before.d[0] << ", " << dim_before.d[1]
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama            << dim_before.d[2] << ", " << dim_before.d[3];
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    auto pad_layer = ctx.network()->addPadding(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        *const_cast<nvinfer1::ITensor*>(tensor),
24e17d8e2d5adfc2fc8b6fa94b7590006b4d21a9Jie        nvinfer1::DimsHW(padding[0].first, padding[1].first),
24e17d8e2d5adfc2fc8b6fa94b7590006b4d21a9Jie        nvinfer1::DimsHW(padding[0].second, padding[1].second));
24e17d8e2d5adfc2fc8b6fa94b7590006b4d21a9Jie    padding = {{0, 0}, {0, 0}};
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    tensor = pad_layer->getOutput(0);
24e17d8e2d5adfc2fc8b6fa94b7590006b4d21a9Jie    auto dim_after = tensor->getDimensions();
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama    VLOG(2) << "TENSOR after: " << dim_after.d[0] << ", " << dim_after.d[1]
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama            << dim_after.d[2] << ", " << dim_after.d[3];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::IConvolutionLayer* layer =
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      ctx.network()->addConvolution(*const_cast<nvinfer1::ITensor*>(tensor),
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                    noutput, kernel_size, weights, biases);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  layer->setStride(stride);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  layer->setPadding({padding[0].first, padding[1].first});
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  layer->setName(node_def.name().c_str());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::ITensor* output_tensor = layer->getOutput(0);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
24e17d8e2d5adfc2fc8b6fa94b7590006b4d21a9Jie  auto dim_after = output_tensor->getDimensions();
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama  VLOG(2) << "TENSOR out: " << dim_after.d[0] << ", " << dim_after.d[1]
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama          << dim_after.d[2] << ", " << dim_after.d[3];
24e17d8e2d5adfc2fc8b6fa94b7590006b4d21a9Jie
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (data_format == "NHWC") {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    // TODO(jie): transpose it back!
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    output_tensor = ctx.TransposeTensor(output_tensor, {0, 2, 3, 1});
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  } else {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama    VLOG(2) << "NCHW !!!!";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  outputs->push_back(TRT_TensorOrWeights(output_tensor));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return tensorflow::Status::OK();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatensorflow::Status ConvertPool(Converter& ctx,
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney                               const tensorflow::NodeDef& node_def,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                               std::vector<TRT_TensorOrWeights> const& inputs,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                               std::vector<TRT_TensorOrWeights>* outputs) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::ITensor const* tensor = inputs.at(0).tensor();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TFAttrs attrs(node_def);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  int h_index = 2;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  int w_index = 3;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  auto data_format = attrs.get<string>("data_format");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (data_format == "NHWC") {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    h_index = 1;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    w_index = 2;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    tensor = ctx.TransposeTensor(const_cast<nvinfer1::ITensor*>(tensor),
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                 {0, 3, 1, 2});
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  } else {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama    VLOG(2) << "NCHW !!!!";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::PoolingType type;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // TODO(jie): support other pooling type
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (node_def.op() == "MaxPool")
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    type = nvinfer1::PoolingType::kMAX;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  else
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    return tensorflow::errors::Unimplemented("Only supports Max pool");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // TODO(jie): NCHW
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto tf_stride = attrs.get<std::vector<int>>("strides");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::DimsHW stride(tf_stride[h_index], tf_stride[w_index]);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto tf_kernel = attrs.get<std::vector<int>>("ksize");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::DimsHW ksize(tf_kernel[h_index], tf_kernel[w_index]);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto tensor_dim = tensor->getDimensions();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  std::vector<std::pair<int, int>> padding;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // TODO(jie): padding.
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  if (attrs.get<string>("padding") == "SAME") {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    // This is NCHW tensor with no batch dimension.
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    //  1 -> h
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    //  2 -> w
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    padding = CreateSamePadding(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        stride, ksize,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        {static_cast<int>(tensor_dim.d[1]), static_cast<int>(tensor_dim.d[2])});
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  } else if (attrs.get<string>("padding") == "VALID") {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    // No padding for valid padding here
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    VLOG(2) << "No padding added for VALID padding in pool" << node_def.name();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    padding = {{0, 0}, {0, 0}};
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  } else {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::Unimplemented(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        "Current MaxPool cannot support padding other than SAME");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (padding[0].first != padding[0].second ||
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      padding[1].first != padding[1].second) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    // TODO(jie): handle asymmetric padding
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    VLOG(2) << "Padding!!!: " << padding[0].first << padding[0].second
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama            << padding[1].first << padding[1].second;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    auto pad_layer = ctx.network()->addPadding(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        *const_cast<nvinfer1::ITensor*>(tensor),
24e17d8e2d5adfc2fc8b6fa94b7590006b4d21a9Jie        nvinfer1::DimsHW(padding[0].first, padding[1].first),
24e17d8e2d5adfc2fc8b6fa94b7590006b4d21a9Jie        nvinfer1::DimsHW(padding[0].second, padding[1].second));
24e17d8e2d5adfc2fc8b6fa94b7590006b4d21a9Jie    padding = {{0, 0}, {0, 0}};
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    tensor = pad_layer->getOutput(0);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::IPoolingLayer* layer = ctx.network()->addPooling(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      *const_cast<nvinfer1::ITensor*>(tensor), type, ksize);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  layer->setStride(stride);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  layer->setPadding({padding[0].first, padding[1].first});
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  layer->setName(node_def.name().c_str());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::ITensor* output_tensor = layer->getOutput(0);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (data_format == "NHWC") {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    // TODO(jie): transpose it back!
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    output_tensor = ctx.TransposeTensor(output_tensor, {0, 2, 3, 1});
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  } else {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama    VLOG(2) << "NCHW !!!!";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  outputs->push_back(TRT_TensorOrWeights(output_tensor));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return tensorflow::Status::OK();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatensorflow::Status ConvertActivation(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    Converter& ctx, const tensorflow::NodeDef& node_def,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    std::vector<TRT_TensorOrWeights> const& inputs,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    std::vector<TRT_TensorOrWeights>* outputs) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::ITensor const* tensor = inputs.at(0).tensor();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::IActivationLayer* layer = ctx.network()->addActivation(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      *const_cast<nvinfer1::ITensor*>(tensor), nvinfer1::ActivationType::kRELU);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::ITensor* output_tensor = layer->getOutput(0);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  outputs->push_back(TRT_TensorOrWeights(output_tensor));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return tensorflow::Status::OK();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatensorflow::Status ConvertScale(Converter& ctx,
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney                                const tensorflow::NodeDef& node_def,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                std::vector<TRT_TensorOrWeights> const& inputs,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                std::vector<TRT_TensorOrWeights>* outputs) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (inputs.size() != 2 || !inputs.at(0).is_tensor() ||
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      !inputs.at(1).is_weights())
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::Unimplemented(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney        "Only supports tensor op weight for now, at " + node_def.name());
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Implement tensor binaryOp weight [channel wise] for now;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::ITensor const* tensor = inputs.at(0).tensor();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // TODO(jie): handle NHWC/NCHW transpose;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TRT_ShapedWeights weights = inputs.at(1).weights();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TRT_ShapedWeights empty_weights(weights.type_);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TFAttrs attrs(node_def);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Transpose NHWC
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  auto data_format = attrs.get<string>("data_format");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (data_format == "NHWC") {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    tensor = ctx.TransposeTensor(const_cast<nvinfer1::ITensor*>(tensor),
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                 {0, 3, 1, 2});
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    // TODO(jie): transpose it
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  } else {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama    VLOG(2) << "NCHW !!!!";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::IScaleLayer* layer = ctx.network()->addScale(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      *const_cast<nvinfer1::ITensor*>(tensor), nvinfer1::ScaleMode::kCHANNEL,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      weights, empty_weights, empty_weights);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::ITensor* output_tensor = layer->getOutput(0);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (data_format == "NHWC") {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    // TODO(jie): transpose it back!
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    output_tensor = ctx.TransposeTensor(output_tensor, {0, 2, 3, 1});
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  } else {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama    VLOG(2) << "NCHW !!!!";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  outputs->push_back(TRT_TensorOrWeights(output_tensor));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return tensorflow::Status::OK();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatensorflow::Status ConvertConst(Converter& ctx,
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney                                const tensorflow::NodeDef& node_def,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                std::vector<TRT_TensorOrWeights> const& inputs,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                std::vector<TRT_TensorOrWeights>* outputs) {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  const auto& weights_tensor = node_def.attr().at("value").tensor();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Get trt type & shape
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TFAttrs attrs(node_def);
cfa374cefe132be886c26a374c51454177c68868gracehoney  const tensorflow::DataType dtype = attrs.get<tensorflow::DataType>("dtype");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Create shaped weights as output
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  tensorflow::Tensor tensor;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (!tensor.FromProto(weights_tensor))
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    return tensorflow::errors::Internal("Cannot parse weight tensor proto: " +
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                        node_def.name());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TRT_ShapedWeights weights(dtype);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (!weights_tensor.float_val().empty()) {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama    VLOG(2) << "SCALAR!!!" << node_def.name();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    nvinfer1::Dims scalar_shape;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    if (tensor.dims() > 0) {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      VLOG(2) << "Dimensions: " << tensor.dims();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      weights = TRT_ShapedWeights(dtype, weights_tensor.float_val().data(),
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney                                  GetTensorShape(tensor));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    } else {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      VLOG(2) << "Dimensions: " << tensor.dims();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      scalar_shape.nbDims = 1;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      scalar_shape.d[0] = 1;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      scalar_shape.type[0] = nvinfer1::DimensionType::kSPATIAL;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      for (int i = 1; i < nvinfer1::Dims::MAX_DIMS; i++) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        scalar_shape.d[i] = 0;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        scalar_shape.type[i] = nvinfer1::DimensionType::kSPATIAL;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      weights = TRT_ShapedWeights(dtype, weights_tensor.float_val().data(),
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                  scalar_shape);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  } else if (!weights_tensor.tensor_content().empty()) {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama    VLOG(2) << "TENSOR!!!" << node_def.name();
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    const auto& content = weights_tensor.tensor_content();
cfa374cefe132be886c26a374c51454177c68868gracehoney
cfa374cefe132be886c26a374c51454177c68868gracehoney    std::vector<char> values;
cfa374cefe132be886c26a374c51454177c68868gracehoney    if (content.size() > 0) {
cfa374cefe132be886c26a374c51454177c68868gracehoney      const int dtype_size = tensorflow::DataTypeSize(dtype);
cfa374cefe132be886c26a374c51454177c68868gracehoney      CHECK_EQ(0, content.size() % dtype_size)
cfa374cefe132be886c26a374c51454177c68868gracehoney          << "Tensor content size (" << content.size()
cfa374cefe132be886c26a374c51454177c68868gracehoney          << ") is not a multiple of " << dtype_size;
cfa374cefe132be886c26a374c51454177c68868gracehoney      values.resize(content.size());
cfa374cefe132be886c26a374c51454177c68868gracehoney      port::CopyToArray(content, values.data());
cfa374cefe132be886c26a374c51454177c68868gracehoney    }
cfa374cefe132be886c26a374c51454177c68868gracehoney    weights =
cfa374cefe132be886c26a374c51454177c68868gracehoney        TRT_ShapedWeights(dtype, nullptr, GetTensorShape(tensor), &values);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  } else {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::Unimplemented(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney        "Not supported constant type, at " + node_def.name());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Pass the output
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  outputs->push_back(TRT_TensorOrWeights(weights));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return tensorflow::Status::OK();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatensorflow::Status ConvertIdentity(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    Converter& ctx, const tensorflow::NodeDef& node_def,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    std::vector<TRT_TensorOrWeights> const& inputs,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    std::vector<TRT_TensorOrWeights>* outputs) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  outputs->push_back(inputs.at(0));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return tensorflow::Status::OK();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatensorflow::Status ConvertBinary(Converter& ctx,
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney                                 const tensorflow::NodeDef& node_def,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                 std::vector<TRT_TensorOrWeights> const& inputs,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                 std::vector<TRT_TensorOrWeights>* outputs) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (inputs.size() != 2)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::FailedPrecondition(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        "Binary ops require two tensor input, at " + node_def.name());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (inputs.at(0).is_weights() && inputs.at(1).is_weights())
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return ConstantFoldBinary(ctx, node_def, inputs, outputs);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (inputs.at(0).is_tensor() && inputs.at(1).is_weights())
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return BinaryTensorOpWeight(ctx, node_def, inputs.at(0).tensor(),
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                inputs.at(1).weights(), outputs);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (inputs.at(0).is_weights() && inputs.at(1).is_tensor())
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return BinaryTensorOpWeight(ctx, node_def, inputs.at(1).tensor(),
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                inputs.at(0).weights(), outputs);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (inputs.at(0).is_tensor() && inputs.at(1).is_tensor())
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return BinaryTensorOpTensor(ctx, node_def, inputs.at(0).tensor(),
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                inputs.at(1).tensor(), outputs);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return tensorflow::errors::Unknown("Binary op input error, at " +
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                     node_def.name());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatensorflow::Status ConvertUnary(Converter& ctx,
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney                                const tensorflow::NodeDef& node_def,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                std::vector<TRT_TensorOrWeights> const& inputs,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                std::vector<TRT_TensorOrWeights>* outputs) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (inputs.size() != 1)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::FailedPrecondition(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        "Unary ops require single tensor input, at " + node_def.name());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (inputs.at(0).is_weights())
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return ConstantFoldUnary(ctx, node_def, inputs, outputs);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  else if (inputs.at(0).is_tensor())
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::Unimplemented(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        "Unary op for tensor not supported, at " + node_def.name());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return tensorflow::errors::Unknown("Binary op input error, at " +
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                     node_def.name());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatensorflow::Status ConvertReduce(Converter& ctx,
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney                                 const tensorflow::NodeDef& node_def,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                 std::vector<TRT_TensorOrWeights> const& inputs,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                 std::vector<TRT_TensorOrWeights>* outputs) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (inputs.size() != 2 || !inputs.at(0).is_tensor() ||
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      !inputs.at(1).is_weights())
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::InvalidArgument(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        "Input expects tensor and weights, at" + node_def.name());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Implement tensor binaryOp weight [channel wise] for now;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::ITensor const* tensor = inputs.at(0).tensor();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto dims = tensor->getDimensions();
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Restore implicit batch dimension
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  int nb_dims = dims.nbDims + 1;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TRT_ShapedWeights index_list = inputs.at(1).weights();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TFAttrs attrs(node_def);
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // TODO(jie): handle data type.
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Index type here is done through TF type, so I can leverage their
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // EnumToDataType for my cast
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto index_type = attrs.get<tensorflow::DataType>("Tidx");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // Only expect to handle INT32 as attributes for now
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (index_type != tensorflow::DataType::DT_INT32)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::Unimplemented("Tidx supports only DT_INT32");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto index_list_data =
cfa374cefe132be886c26a374c51454177c68868gracehoney      static_cast<int*>(const_cast<void*>(index_list.GetValues()));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Hack warning: have to fall back to pool layer since reduce is not in public
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // TRT yet.
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  if (nb_dims != 4)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::InvalidArgument(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        "TRT only support reduce on 4 dimensional tensors, at" +
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        node_def.name());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (index_list.count() > 2)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::InvalidArgument(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        "TRT cannot support reduce on more than 2 dimensions, at" +
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        node_def.name());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  std::set<int> idx_set;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // We cannot operate on Channel. permutation flag used to transpose tensor
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  int permuted_index = -1;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  for (int i = 0; i < index_list.count(); i++) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    if (index_list_data[i] == 0)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      return tensorflow::errors::InvalidArgument("TRT cannot reduce at 0, at" +
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                                 node_def.name());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    if (index_list_data[i] == 1) permuted_index = 1;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    idx_set.emplace(index_list_data[i]);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  std::vector<int> permutation_order(nb_dims);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::DimsHW pool_kernel;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (permuted_index == 1) {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    for (int i = 2; i < nb_dims; i++) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      if (idx_set.count(i)) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        permuted_index = i;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        break;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    for (int i = 0; i < nb_dims; i++) permutation_order[i] = i;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    permutation_order[permuted_index] = 1;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    permutation_order[1] = permuted_index;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    // Apply permutation before extracting dimension for pool_kernel
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    tensor = ctx.TransposeTensor(const_cast<nvinfer1::ITensor*>(tensor),
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                 permutation_order);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Apply permutation before extracting dimension for pool_kernel
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  pool_kernel.d[0] = (idx_set.count(2) || permuted_index == 2) ? dims.d[1] : 1;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  pool_kernel.d[1] = (idx_set.count(3) || permuted_index == 3) ? dims.d[2] : 1;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::ITensor* output_tensor;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (node_def.op() == "Mean") {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    nvinfer1::IPoolingLayer* layer =
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        ctx.network()->addPooling(*const_cast<nvinfer1::ITensor*>(tensor),
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                  nvinfer1::PoolingType::kAVERAGE, pool_kernel);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    output_tensor = layer->getOutput(0);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  } else {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::Unimplemented(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        "Op not supported " + node_def.op() + " , at " + node_def.name());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (permuted_index != -1) {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    // Apply permutation before extracting dimension for pool_kernel
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    output_tensor = ctx.TransposeTensor(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        const_cast<nvinfer1::ITensor*>(output_tensor), permutation_order);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return tensorflow::Status::OK();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatensorflow::Status ConvertPad(Converter& ctx,
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney                              const tensorflow::NodeDef& node_def,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                              std::vector<TRT_TensorOrWeights> const& inputs,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                              std::vector<TRT_TensorOrWeights>* outputs) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (inputs.size() != 2 || !inputs.at(0).is_tensor() ||
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      !inputs.at(1).is_weights())
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::InvalidArgument(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        "Input expects tensor and weights, at" + node_def.name());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Implement tensor binaryOp weight [channel wise] for now;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::ITensor const* tensor = inputs.at(0).tensor();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto dims = tensor->getDimensions();
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Restore implicit batch dimension
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  int nb_dims = dims.nbDims + 1;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TRT_ShapedWeights pads = inputs.at(1).weights();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  TFAttrs attrs(node_def);
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Padding type here is done through TF type
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  //   so I can leverage their EnumToDataType for my cast
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto padding_type = attrs.get<tensorflow::DataType>("Tpaddings");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // TODO(jie): handle data type conversion for TRT?
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  if (pads.shape_.d[0] != nb_dims || pads.shape_.d[1] != 2)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::InvalidArgument(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        "Pad only supports explicit padding on 4 dimensional tensor, at " +
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        node_def.name());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // Only expect to handle INT32 as attributes for now
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (padding_type != tensorflow::DataType::DT_INT32)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::Unimplemented(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        "Tpaddings supports only DT_INT32");
cfa374cefe132be886c26a374c51454177c68868gracehoney  auto pad_data = static_cast<int*>(const_cast<void*>(pads.GetValues()));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  std::vector<int32_t> pad_index;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  for (int i = 0; i < nb_dims; i++) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    if (pad_data[2 * i] != 0 || pad_data[2 * i + 1] != 0)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      pad_index.push_back(i);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // No padding at all, we should exit
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (pad_index.size() == 0) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    outputs->push_back(inputs.at(0));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::Status::OK();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Only supports padding on less than 2 axis GIE-2579
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (pad_index.size() > 2)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::InvalidArgument(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        "Padding layer does not support padding on > 2");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Padding on batch dimension is not supported
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (pad_index[0] == 0)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::InvalidArgument(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        "Padding layer does not support padding on batch dimension");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Not doing the legit thing here. ignoring padding on dim 1 and 3;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // TODO(jie): implement pad as uff parser
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (pad_index.size() == 2 && pad_index[0] == 0 && pad_index[1] == 3)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::Unimplemented(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        "Padding layer does not support padding on dimension 1 and 3 yet");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  bool legit_pad = true;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::DimsHW pre_padding(0, 0);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::DimsHW post_padding(0, 0);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  std::vector<int32_t> permuted_pad_index(pad_index);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (pad_index[0] == 1) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    legit_pad = false;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    tensor = ctx.TransposeTensor(const_cast<nvinfer1::ITensor*>(tensor),
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                 {0, 3, 2, 1});
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    permuted_pad_index[0] = 3;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  for (size_t i = 0; i < pad_index.size(); i++) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    int index = pad_index[i];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    if (permuted_pad_index[i] == 2) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      pre_padding.h() = pad_data[index * 2];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      post_padding.h() = pad_data[index * 2 + 1];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    } else if (permuted_pad_index[i] == 3) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      pre_padding.w() = pad_data[index * 2];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      post_padding.w() = pad_data[index * 2 + 1];
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::IPaddingLayer* layer = ctx.network()->addPadding(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      *const_cast<nvinfer1::ITensor*>(tensor), pre_padding, post_padding);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  nvinfer1::ITensor* output_tensor = layer->getOutput(0);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (!legit_pad)
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    output_tensor = ctx.TransposeTensor(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        const_cast<nvinfer1::ITensor*>(output_tensor), {0, 3, 2, 1});
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  outputs->push_back(TRT_TensorOrWeights(output_tensor));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return tensorflow::Status::OK();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamavoid Converter::register_op_converters() {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // vgg_16 slim implementation
cd63c718be123324b6c39e0f8fbe453319799746Jie  op_registry_["Placeholder"] = ConvertPlaceholder;
cd63c718be123324b6c39e0f8fbe453319799746Jie  op_registry_["Conv2D"] = ConvertConv2D;
cd63c718be123324b6c39e0f8fbe453319799746Jie  op_registry_["Relu"] = ConvertActivation;
cd63c718be123324b6c39e0f8fbe453319799746Jie  op_registry_["MaxPool"] = ConvertPool;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // This could be really handled as ConvertBinary
cd63c718be123324b6c39e0f8fbe453319799746Jie  op_registry_["BiasAdd"] = ConvertScale;
cd63c718be123324b6c39e0f8fbe453319799746Jie  op_registry_["Const"] = ConvertConst;
cd63c718be123324b6c39e0f8fbe453319799746Jie  // op_registry_["MatMul"] = ConvertFullyConnected;  // Not used in vgg
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // TODO(ben,jie): this is a temp hack.
cd63c718be123324b6c39e0f8fbe453319799746Jie  op_registry_["Identity"] = ConvertIdentity;  // Identity should be removed
cd63c718be123324b6c39e0f8fbe453319799746Jie  // op_registry_["AvgPool"] = ConvertPool;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // resnet_50_v1 slim implementation
cd63c718be123324b6c39e0f8fbe453319799746Jie  op_registry_["Add"] = ConvertBinary;
cd63c718be123324b6c39e0f8fbe453319799746Jie  op_registry_["Mul"] = ConvertBinary;
cd63c718be123324b6c39e0f8fbe453319799746Jie  op_registry_["Sub"] = ConvertBinary;
cd63c718be123324b6c39e0f8fbe453319799746Jie  op_registry_["Rsqrt"] = ConvertUnary;
cd63c718be123324b6c39e0f8fbe453319799746Jie  op_registry_["Mean"] = ConvertReduce;
cd63c718be123324b6c39e0f8fbe453319799746Jie  op_registry_["Pad"] = ConvertPad;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // TODO(ben,jie): Add more ops
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}  // namespace
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kamatensorflow::Status ConvertSubGraphToTensorRTNodeDef(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    const tensorflow::Graph& graph, const std::set<int>& subgraph_node_ids,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    const std::vector<std::pair<int, int>>& input_inds,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    const std::vector<std::pair<int, int>>& output_inds, size_t max_batch_size,
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama    size_t max_workspace_size_bytes,
68e17d497497119c24ad506dac4e34e127cf836cJie    const tensorflow::grappler::GraphProperties& graph_properties,
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    tensorflow::NodeDef* trt_node) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // Visit nodes in reverse topological order and construct the TRT network.
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // Toposort
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  std::vector<tensorflow::Node*> order_vec;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  tensorflow::GetPostOrder(graph, &order_vec);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // Select just the subgraph
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  std::list<tensorflow::Node*> order;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  for (tensorflow::Node* node : order_vec) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    if (subgraph_node_ids.count(node->id())) {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      // We want topological order to contstruct the
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      // network layer by layer
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      order.push_front(node);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  // Topological order is needed to build TRT network
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  tensorflow::tensorrt::Logger trt_logger;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto trt_builder = infer_object(nvinfer1::createInferBuilder(trt_logger));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (!trt_builder) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::Internal(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney        "Failed to create TensorRT builder object");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto trt_network = infer_object(trt_builder->createNetwork());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  if (!trt_network) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    return tensorflow::errors::Internal(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney        "Failed to create TensorRT network object");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // Build the network
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  Converter converter(trt_network.get());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  std::vector<string> input_names;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  std::vector<tensorflow::DataType> input_dtypes;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  for (std::pair<int, int> const& input : input_inds) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    int node_id = input.first;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    int output_idx = input.second;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    tensorflow::Node* node = graph.FindNodeId(node_id);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    auto node_name = node->name();
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    input_names.push_back(node_name);  // Insert original node name without port
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    // TODO(jie): alternative :)
68e17d497497119c24ad506dac4e34e127cf836cJie    if (!graph_properties.HasOutputProperties(node_name))
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      return tensorflow::errors::Internal("Failed to find input node: " +
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                          node_name);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
68e17d497497119c24ad506dac4e34e127cf836cJie    auto op_info_vec = graph_properties.GetOutputProperties(node_name);
68e17d497497119c24ad506dac4e34e127cf836cJie    if (static_cast<int>(op_info_vec.size()) < output_idx)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      return tensorflow::errors::Internal(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney          "Accessing output index of: " + std::to_string(output_idx) +
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney          ", at node: " + node_name + " with output entry from shape_map: " +
68e17d497497119c24ad506dac4e34e127cf836cJie          std::to_string(op_info_vec.size()));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
68e17d497497119c24ad506dac4e34e127cf836cJie    auto op_info = op_info_vec.at(output_idx);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
68e17d497497119c24ad506dac4e34e127cf836cJie    tensorflow::DataType tf_dtype = op_info.dtype();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    input_dtypes.push_back(tf_dtype);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    nvinfer1::DataType dtype(nvinfer1::DataType::kFLOAT);
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    TF_CHECK_OK(ConvertDType(tf_dtype, &dtype));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    VLOG(2) << "Accessing output index of: " << std::to_string(output_idx)
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama            << ", at node: " << node_name
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney            << " with output entry from shape_map: "
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama            << std::to_string(op_info_vec.size());
68e17d497497119c24ad506dac4e34e127cf836cJie
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    // TODO(ben,jie): update TRT input format/dimension
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    nvinfer1::DimsCHW input_dim_psuedo_chw;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    for (int i = 0; i < 3; i++) input_dim_psuedo_chw.d[i] = 1;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
68e17d497497119c24ad506dac4e34e127cf836cJie    for (int i = 1; i < op_info.shape().dim_size(); i++) {
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama      VLOG(2) << "dimension: " << i
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama              << " , size: " << op_info.shape().dim(i).size();
68e17d497497119c24ad506dac4e34e127cf836cJie      input_dim_psuedo_chw.d[i - 1] = op_info.shape().dim(i).size();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    // TODO(ben,jie): proper way to restore input tensor name?
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    auto input_tensor_name = node_name;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    if (output_idx != 0)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      input_tensor_name = node_name + ":" + std::to_string(output_idx);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    nvinfer1::ITensor* input_tensor = converter.network()->addInput(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        input_tensor_name.c_str(), dtype, input_dim_psuedo_chw);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    if (!input_tensor)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      return tensorflow::errors::InvalidArgument(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama          "Failed to create Input layer");
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    VLOG(2) << "Input tensor name :" << input_tensor_name;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    if (!converter.insert_input_tensor(input_tensor_name, input_tensor))
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      return tensorflow::errors::AlreadyExists(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney          "Output tensor already exists for op: " + input_tensor_name);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  VLOG(2) << "Finished sorting";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  for (const tensorflow::Node* node : order) {
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    const tensorflow::NodeDef& node_def = node->def();
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    VLOG(2) << "Converting node: " << node_def.name() << " , " << node_def.op();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    TF_RETURN_IF_ERROR(converter.convert_node(node_def));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  VLOG(2) << "Finished conversion";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // Gather output metadata
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  std::vector<string> output_names;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  std::vector<tensorflow::DataType> output_dtypes;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  for (std::pair<int, int> const& output : output_inds) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    int node_id = output.first;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    int output_idx = output.second;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    tensorflow::Node* node = graph.FindNodeId(node_id);
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    string op_name = node->name();
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    string tensor_name = op_name;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    if (output_idx != 0)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      tensor_name = tensor_name + ":" + std::to_string(output_idx);
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    VLOG(2) << "Output tensor name: " << tensor_name;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    output_names.push_back(tensor_name);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    auto tensor_or_weights = converter.get_tensor(tensor_name);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    if (!tensor_or_weights.is_tensor()) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      return tensorflow::errors::InvalidArgument(
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama          "Output node is weights not tensor");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    nvinfer1::ITensor* tensor = tensor_or_weights.tensor();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    if (!tensor) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama      return tensorflow::errors::NotFound("Output tensor not found: " +
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                                          tensor_name);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    converter.network()->markOutput(*tensor);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    tensorflow::DataType tf_dtype = node->output_type(output_idx);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    output_dtypes.push_back(tf_dtype);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    nvinfer1::DataType trt_dtype = nvinfer1::DataType::kFLOAT;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    TF_RETURN_IF_ERROR(ConvertDType(tf_dtype, &trt_dtype));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    tensor->setType(trt_dtype);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  VLOG(2) << "Finished output";
cd63c718be123324b6c39e0f8fbe453319799746Jie  // TODO(jie): static_id is not thread safe.
599eadc299ae680bfb569ace4278b2eb262ecc44Sami Kama  static int static_id = 0;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // Build the engine
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  trt_builder->setMaxBatchSize(max_batch_size);
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama  trt_builder->setMaxWorkspaceSize(max_workspace_size_bytes);
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  VLOG(0) << "Starting build engine " << static_id;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // TODO(ben,jie): half2 and int8 mode support
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  string engine_plan_string;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    auto trt_engine =
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        infer_object(trt_builder->buildCudaEngine(*converter.network()));
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    VLOG(0) << "Built network";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    auto engine_plan = infer_object(trt_engine->serialize());
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    VLOG(0) << "Serialized engine";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    const char* engine_plan_data =
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama        static_cast<const char*>(engine_plan->data());
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    engine_plan_string =
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney        string(engine_plan_data, engine_plan_data + engine_plan->size());
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  VLOG(0) << "Finished engine";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // Build the TRT op
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  // TODO(sami,ben,jie): proper naming!
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  tensorflow::NodeDefBuilder op_builder(
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney      tensorflow::strings::StrCat("my_trt_op", static_id++), "TRTEngineOp");
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  std::vector<tensorflow::NodeDefBuilder::NodeOut> income_edges;
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  for (size_t i = 0; i < input_names.size(); ++i) {
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    int output_idx = input_inds.at(i).second;
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    // We wired up the input here already, it is redundant to do it again in
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney    // ConvertSubGraphToTensorRT(convert_graph.cc)
e01844e65e0dbd2682a894946bec7f072d36fa27Jie    auto incoming_edge = tensorflow::NodeDefBuilder::NodeOut(
e01844e65e0dbd2682a894946bec7f072d36fa27Jie        input_names.at(i), output_idx, input_dtypes.at(i));
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama    income_edges.push_back(incoming_edge);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  }
e01844e65e0dbd2682a894946bec7f072d36fa27Jie  tensorflow::gtl::ArraySlice<tensorflow::NodeDefBuilder::NodeOut> input_list(
e01844e65e0dbd2682a894946bec7f072d36fa27Jie      income_edges);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  op_builder.Input(input_list);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
bfe8b85cad3be1a82234500fce3064c98dd20d09gracehoney  VLOG(0) << "Finished op preparation";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  auto status = op_builder.Attr("serialized_engine", engine_plan_string)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                    .Attr("input_nodes", input_names)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                    .Attr("output_nodes", output_names)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                    .Attr("OutT", output_dtypes)
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama                    .Finalize(trt_node);
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
f8b1986d67b1bcc352acb7644b642faf46ca79cbSami Kama  VLOG(0) << status.ToString() << " finished op building";
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama  return tensorflow::Status::OK();
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}  // namespace convert
825e7a32e9f4dbad21a9ddb9d8a34bd3e32b1d0eSami Kama}  // namespace tensorrt
6908cc233c679b8fe61d99a30d3828362caf47beSami Kama}  // namespace tensorflow
ae740a67bdc01b991ead6ac047c774bff4d7bc8fJie
e01844e65e0dbd2682a894946bec7f072d36fa27Jie#endif  // GOOGLE_TENSORRT
e01844e65e0dbd2682a894946bec7f072d36fa27Jie#endif  // GOOGLE_CUDA