lite/kernels/conv_test.cc

0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle/* Copyright 2017 The TensorFlow Authors. All Rights Reserved.
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew SelleLicensed under the Apache License, Version 2.0 (the "License");
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selleyou may not use this file except in compliance with the License.
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew SelleYou may obtain a copy of the License at
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle    http://www.apache.org/licenses/LICENSE-2.0
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew SelleUnless required by applicable law or agreed to in writing, software
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selledistributed under the License is distributed on an "AS IS" BASIS,
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew SelleWITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew SelleSee the License for the specific language governing permissions and
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Sellelimitations under the License.
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle==============================================================================*/
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle#include <cstdarg>
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle#include <gtest/gtest.h>
14e0e7fe1eafd286f3813ba839b5f3236394a0a1Anna R#include "absl/memory/memory.h"
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle#include "tensorflow/contrib/lite/interpreter.h"
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle#include "tensorflow/contrib/lite/kernels/register.h"
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle#include "tensorflow/contrib/lite/kernels/test_util.h"
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle#include "tensorflow/contrib/lite/model.h"
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Sellenamespace tflite {
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Lingnamespace ops {
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Lingnamespace builtin {
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng LingTfLiteRegistration* Register_CONVOLUTION_REF();
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng LingTfLiteRegistration* Register_CONVOLUTION_GENERIC_OPT();
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng LingTfLiteRegistration* Register_CONVOLUTION_MULTITHREADED_OPT();
1a92f45677ee66af24f2219c6b1cbaeee87056b7Yu-Cheng LingTfLiteRegistration* Register_CONVOLUTION_CBLAS_OPT();
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling}  // namespace builtin
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling}  // namespace ops
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Sellenamespace {
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selleusing ::testing::ElementsAreArray;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selleclass BaseConvolutionOpModel : public SingleOpModel {
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle public:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // TODO(ahentz): Also test different activation types, bias, padding types,
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // stride values.
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  BaseConvolutionOpModel(
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling      TfLiteRegistration* registration, const TensorData& input,
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling      const TensorData& filter, const TensorData& output, int stride_width = 2,
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling      int stride_height = 2, enum Padding padding = Padding_VALID,
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      enum ActivationFunctionType activation = ActivationFunctionType_NONE) {
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle    input_ = AddInput(input);
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle    filter_ = AddInput(filter);
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle    int bias_size = GetShape(filter_)[0];
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle    if (input.type == TensorType_FLOAT32) {
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      bias_ = AddInput({TensorType_FLOAT32, {bias_size}});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle    } else {
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      // This is a quantized version. The scale of 'bias' depends on the scales
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      // of input and filter. Supposedly this is correctly set during quantized
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      // training.
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      auto bias_scale = GetScale(input_) * GetScale(filter_);
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      TensorData bias{TensorType_INT32, {bias_size}, 0, 0, bias_scale};
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      bias_ = AddInput(bias);
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle    }
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle    output_ = AddOutput(output);
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle    if (input.type != TensorType_FLOAT32) {
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      // The following is required by quantized inference. It is the unittest's
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      // responsibility to make sure the output scale falls into the correct
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      // range.
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      CHECK_LT(GetScale(input_) * GetScale(filter_), GetScale(output_));
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle    }
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle    SetBuiltinOp(BuiltinOperator_CONV_2D, BuiltinOptions_Conv2DOptions,
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                 CreateConv2DOptions(builder_, padding, stride_width,
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                     stride_height, activation)
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                     .Union());
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling    resolver_ = absl::make_unique<SingleOpResolver>(BuiltinOperator_CONV_2D,
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling                                                    registration);
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle    BuildInterpreter({GetShape(input_), GetShape(filter_), GetShape(bias_)});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  }
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle protected:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  int input_;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  int filter_;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  int bias_;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  int output_;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle};
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selleclass ConvolutionOpModel : public BaseConvolutionOpModel {
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle public:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  using BaseConvolutionOpModel::BaseConvolutionOpModel;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  void SetFilter(std::initializer_list<float> f) { PopulateTensor(filter_, f); }
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  void SetBias(std::initializer_list<float> f) { PopulateTensor(bias_, f); }
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  void SetInput(std::initializer_list<float> data) {
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle    PopulateTensor(input_, data);
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  }
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  std::vector<float> GetOutput() { return ExtractVector<float>(output_); }
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle};
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Lingconst auto kKernelMap = new std::map<string, TfLiteRegistration*>({
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling    {"Reference", ops::builtin::Register_CONVOLUTION_REF()},
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling    {"GenericOptimized", ops::builtin::Register_CONVOLUTION_GENERIC_OPT()},
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling    {"MultithreadedOptimized",
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling     ops::builtin::Register_CONVOLUTION_MULTITHREADED_OPT()},
1a92f45677ee66af24f2219c6b1cbaeee87056b7Yu-Cheng Ling    {"CblasOptimized", ops::builtin::Register_CONVOLUTION_CBLAS_OPT()},
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling});
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Lingclass ConvolutionOpTest : public SingleOpTest {
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling protected:
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling  const std::map<string, TfLiteRegistration*>& GetKernelMap() override {
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling    return *kKernelMap;
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling  }
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling};
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng LingTEST_P(ConvolutionOpTest, SimpleTestFloat32) {
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling  ConvolutionOpModel m(GetRegistration(), {TensorType_FLOAT32, {2, 2, 4, 1}},
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                       {TensorType_FLOAT32, {3, 2, 2, 1}},
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                       {TensorType_FLOAT32, {}});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetInput({
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      // First batch
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      1, 1, 1, 1,  // row = 1
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      2, 2, 2, 2,  // row = 2
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      // Second batch
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      1, 2, 3, 4,  // row = 1
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      1, 2, 3, 4,  // row = 2
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  });
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetFilter({
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      1, 2, 3, 4,    // first 2x2 filter
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      -1, 1, -1, 1,  // second 2x2 filter
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      -1, -1, 1, 1,  // third 2x2 filter
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  });
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetBias({1, 2, 3});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.Invoke();
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  EXPECT_THAT(m.GetOutput(), ElementsAreArray({
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                 18, 2, 5,  // first batch, left
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                 18, 2, 5,  // first batch, right
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                 17, 4, 3,  // second batch, left
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                 37, 4, 3,  // second batch, right
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                             }));
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle}
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng LingTEST_P(ConvolutionOpTest, SimpleTestFloat32WithAnisotropicStrides) {
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling  ConvolutionOpModel m(GetRegistration(), {TensorType_FLOAT32, {1, 3, 6, 1}},
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                       {TensorType_FLOAT32, {1, 2, 2, 1}},
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                       {TensorType_FLOAT32, {}},
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                       /*stride_width=*/3, /*stride_height=*/1);
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetInput({
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      3, 2, 1, -1, -2, -3,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      4, 3, 2, -2, -3, -4,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      5, 4, 3, -3, -4, -5,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  });
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetFilter({
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      1, 2,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      3, 4,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  });
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetBias({-1});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.Invoke();
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  EXPECT_THAT(m.GetOutput(), ElementsAreArray({
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                 30, -24,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                 40, -34,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                             }));
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle}
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng LingTEST_P(ConvolutionOpTest, HandCalculatedFloat32) {
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int depth = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int image_width = 4;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int image_height = 3;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int image_batch_count = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int filter_size = 3;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int filter_count = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int stride_width = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int stride_height = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const Padding padding = Padding_SAME;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  ConvolutionOpModel m(
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling      GetRegistration(),
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      {TensorType_FLOAT32,
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle       {image_batch_count, image_height, image_width, depth}},
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      {TensorType_FLOAT32, {depth, filter_size, filter_size, filter_count}},
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      {TensorType_FLOAT32, {}}, stride_width, stride_height, padding);
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // The image matrix is:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  1 |  2 |  3 |  4 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  5 |  6 |  7 |  8 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  9 | 10 | 11 | 12 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetInput({1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // The filter matrix is:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // | 1 | 4 | 7 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // | 2 | 5 | 8 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // | 3 | 6 | 9 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetFilter({1, 4, 7, 2, 5, 8, 3, 6, 9});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // No bias for this test.
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetBias({0});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.Invoke();
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // We're sliding the 3x3 filter across the 3x4 image, with accesses outside
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // the input set to zero because we're using the 'SAME' padding mode.
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // The calculations behind the expected output are:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*0)+(4*0)+(7*0)+(2*0)+(5*1)+(8*2)+(3*0)+(6*5)+(9*6)=105
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*0)+(4*0)+(7*0)+(2*1)+(5*2)+(8*3)+(3*5)+(6*6)+(9*7)=150
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*0)+(4*0)+(7*0)+(2*2)+(5*3)+(8*4)+(3*6)+(6*7)+(9*8)=183
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*0)+(4*0)+(7*0)+(2*3)+(5*4)+(8*0)+(3*7)+(6*8)+(9*0)=95
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*0)+(4*1)+(7*2)+(2*0)+(5*5)+(8*6)+(3*0)+(6*9)+(9*10)=235
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*1)+(4*2)+(7*3)+(2*5)+(5*6)+(8*7)+(3*9)+(6*10)+(9*11)=312
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*2)+(4*3)+(7*4)+(2*6)+(5*7)+(8*8)+(3*10)+(6*11)+(9*12)=357
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*3)+(4*4)+(7*0)+(2*7)+(5*8)+(8*0)+(3*11)+(6*12)+(9*0)=178
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*0)+(4*5)+(7*6)+(2*0)+(5*9)+(8*10)+(3*0)+(6*0)+(9*0)=187
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*5)+(4*6)+(7*7)+(2*9)+(5*10)+(8*11)+(3*0)+(6*0)+(9*0)=234
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*6)+(4*7)+(7*8)+(2*10)+(5*11)+(8*12)+(3*0)+(6*0)+(9*0)=261
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*7)+(4*11)+(7*0)+(2*8)+(5*12)+(8*0)+(3*0)+(6*0)+(9*0)=121
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // This means we should end up with this matrix:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  105  |  150  |  183  |   95  |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  235  |  312  |  357  |  178  |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  187  |  234  |  261  |  121  |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  EXPECT_THAT(m.GetOutput(), ElementsAreArray({105, 150, 183, 95, 235, 312, 357,
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                               178, 187, 234, 261, 121}));
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle}
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng LingTEST_P(ConvolutionOpTest, HandCalculatedWithBiasFloat32) {
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int depth = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int image_width = 4;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int image_height = 3;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int image_batch_count = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int filter_size = 3;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int filter_count = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int stride_width = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int stride_height = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const Padding padding = Padding_SAME;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  ConvolutionOpModel m(
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling      GetRegistration(),
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      {TensorType_FLOAT32,
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle       {image_batch_count, image_height, image_width, depth}},
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      {TensorType_FLOAT32, {depth, filter_size, filter_size, filter_count}},
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      {TensorType_FLOAT32, {}}, stride_width, stride_height, padding);
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // The image matrix is:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  1 |  2 |  3 |  4 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  5 |  6 |  7 |  8 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  9 | 10 | 11 | 12 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetInput({1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // The filter matrix is:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // | 1 | 4 | 7 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // | 2 | 5 | 8 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // | 3 | 6 | 9 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetFilter({1, 4, 7, 2, 5, 8, 3, 6, 9});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // Bias is | 10 |.
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetBias({10});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.Invoke();
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // We're sliding the 3x3 filter across the 3x4 image, with accesses outside
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // the input set to zero because we're using the 'SAME' padding mode.
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // The calculations behind the expected output are:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*0)+(4*0)+(7*0)+(2*0)+(5*1)+(8*2)+(3*0)+(6*5)+(9*6)+10=115
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*0)+(4*0)+(7*0)+(2*1)+(5*2)+(8*3)+(3*5)+(6*6)+(9*7)+10=160
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*0)+(4*0)+(7*0)+(2*2)+(5*3)+(8*4)+(3*6)+(6*7)+(9*8)+10=193
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*0)+(4*0)+(7*0)+(2*3)+(5*4)+(8*0)+(3*7)+(6*8)+(9*0)+10=105
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*0)+(4*1)+(7*2)+(2*0)+(5*5)+(8*6)+(3*0)+(6*9)+(9*10)+10=245
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*1)+(4*2)+(7*3)+(2*5)+(5*6)+(8*7)+(3*9)+(6*10)+(9*11)+10=322
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*2)+(4*3)+(7*4)+(2*6)+(5*7)+(8*8)+(3*10)+(6*11)+(9*12)+10=367
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*3)+(4*4)+(7*0)+(2*7)+(5*8)+(8*0)+(3*11)+(6*12)+(9*0)+10=188
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*0)+(4*5)+(7*6)+(2*0)+(5*9)+(8*10)+(3*0)+(6*0)+(9*0)+10=197
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*5)+(4*6)+(7*7)+(2*9)+(5*10)+(8*11)+(3*0)+(6*0)+(9*0)+10=244
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*6)+(4*7)+(7*8)+(2*10)+(5*11)+(8*12)+(3*0)+(6*0)+(9*0)+10=271
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*7)+(4*11)+(7*0)+(2*8)+(5*12)+(8*0)+(3*0)+(6*0)+(9*0)+10=131
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // This means we should end up with this matrix:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  115  |  160  |  193  |  105  |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  245  |  322  |  367  |  188  |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  197  |  244  |  271  |  131  |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  EXPECT_THAT(m.GetOutput(), ElementsAreArray({115, 160, 193, 105, 245, 322,
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                               367, 188, 197, 244, 271, 131}));
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle}
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng LingTEST_P(ConvolutionOpTest, HandCalculatedWithReluFloat32) {
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int depth = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int image_width = 4;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int image_height = 3;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int image_batch_count = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int filter_size = 3;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int filter_count = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int stride_width = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int stride_height = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const Padding padding = Padding_SAME;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  ConvolutionOpModel m(
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling      GetRegistration(),
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      {TensorType_FLOAT32,
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle       {image_batch_count, image_height, image_width, depth}},
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      {TensorType_FLOAT32, {depth, filter_size, filter_size, filter_count}},
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      {TensorType_FLOAT32, {}}, stride_width, stride_height, padding,
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      ActivationFunctionType_RELU);
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // The image matrix is:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  1 |  2 |  3 |  4 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  5 |  6 |  7 |  8 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  9 | 10 | 11 | 12 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetInput({1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // The filter matrix is:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // | 1 | 4 | 7 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // | 2 | 5 | 8 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // | 3 | 6 | 9 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetFilter({1, 4, 7, 2, 5, 8, 3, 6, 9});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // Bias is | -200 |.
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetBias({-200});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.Invoke();
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // We're sliding the 3x3 filter across the 3x4 image, with accesses outside
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // the input set to zero because we're using the 'SAME' padding mode.
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // The calculations behind the expected output are:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*0)+(4*0)+(7*0)+(2*0)+(5*1)+(8*2)+(3*0)+(6*5)+(9*6)-200=-95
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*0)+(4*0)+(7*0)+(2*1)+(5*2)+(8*3)+(3*5)+(6*6)+(9*7)-200=-50
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*0)+(4*0)+(7*0)+(2*2)+(5*3)+(8*4)+(3*6)+(6*7)+(9*8)-200=-17
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*0)+(4*0)+(7*0)+(2*3)+(5*4)+(8*0)+(3*7)+(6*8)+(9*0)-200=-105
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*0)+(4*1)+(7*2)+(2*0)+(5*5)+(8*6)+(3*0)+(6*9)+(9*10)-200=35
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*1)+(4*2)+(7*3)+(2*5)+(5*6)+(8*7)+(3*9)+(6*10)+(9*11)-200=112
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*2)+(4*3)+(7*4)+(2*6)+(5*7)+(8*8)+(3*10)+(6*11)+(9*12)-200=157
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*3)+(4*4)+(7*0)+(2*7)+(5*8)+(8*0)+(3*11)+(6*12)+(9*0)-200=-22
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*0)+(4*5)+(7*6)+(2*0)+(5*9)+(8*10)+(3*0)+(6*0)+(9*0)-200=-13
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*5)+(4*6)+(7*7)+(2*9)+(5*10)+(8*11)+(3*0)+(6*0)+(9*0)-200=34
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*6)+(4*7)+(7*8)+(2*10)+(5*11)+(8*12)+(3*0)+(6*0)+(9*0)-200=61
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*7)+(4*11)+(7*0)+(2*8)+(5*12)+(8*0)+(3*0)+(6*0)+(9*0)-200=-79
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // All negative values are gated to zero by the Relu activation function.
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // This means we should end up with this matrix:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |   0 |   0 |   0 |   0 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  35 | 112 | 157 |   0 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |   0 |  34 |  61 |   0 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  EXPECT_THAT(m.GetOutput(),
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle              ElementsAreArray({0, 0, 0, 0, 35, 112, 157, 0, 0, 34, 61, 0}));
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle}
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng LingTEST_P(ConvolutionOpTest, HandCalculatedValidFloat32) {
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int depth = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int image_width = 4;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int image_height = 3;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int image_batch_count = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int filter_size = 3;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int filter_count = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int stride_width = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const int stride_height = 1;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  const Padding padding = Padding_VALID;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  ConvolutionOpModel m(
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling      GetRegistration(),
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      {TensorType_FLOAT32,
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle       {image_batch_count, image_height, image_width, depth}},
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      {TensorType_FLOAT32, {depth, filter_size, filter_size, filter_count}},
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      {TensorType_FLOAT32, {}}, stride_width, stride_height, padding);
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // The image matrix is:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  1 |  2 |  3 |  4 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  5 |  6 |  7 |  8 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  9 | 10 | 11 | 12 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetInput({1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // The filter matrix is:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // | 1 | 4 | 7 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // | 2 | 5 | 8 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // | 3 | 6 | 9 |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetFilter({1, 4, 7, 2, 5, 8, 3, 6, 9});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // No bias for this test.
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetBias({0});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.Invoke();
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // We're sliding the 3x3 filter across the 3x4 image, with no accesses outside
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // the input because we're using the 'VALID' padding mode, giving a 2x1
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // output.
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // The calculations behind the expected output are:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*1)+(4*2)+(7*3)+(2*5)+(5*6)+(8*7)+(3*9)+(6*10)+(9*11)=312
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // (1*2)+(4*3)+(7*4)+(2*6)+(5*7)+(8*8)+(3*10)+(6*11)+(9*12)=357
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // This means we should end up with this matrix:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // |  312  |  357  |
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  EXPECT_THAT(m.GetOutput(), ElementsAreArray({312, 357}));
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle}
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selleclass QuantizedConvolutionOpModel : public BaseConvolutionOpModel {
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle public:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  using BaseConvolutionOpModel::BaseConvolutionOpModel;
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  void SetInput(std::initializer_list<float> data) {
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle    QuantizeAndPopulate<uint8_t>(input_, data);
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  }
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  void SetFilter(std::initializer_list<float> data) {
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle    QuantizeAndPopulate<uint8_t>(filter_, data);
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  }
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  void SetBias(std::initializer_list<float> data) {
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle    QuantizeAndPopulate<int32_t>(bias_, data);
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  }
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  std::vector<uint8_t> GetOutput() { return ExtractVector<uint8_t>(output_); }
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  std::vector<float> GetDequantizedOutput() {
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle    return Dequantize<uint8_t>(ExtractVector<uint8_t>(output_),
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                               GetScale(output_), GetZeroPoint(output_));
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  }
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle};
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle// In this tests we set the input and output scales so that the results
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle// match exactly the 'non-quantized' version.
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng LingTEST_P(ConvolutionOpTest, SimpleTestQuantized) {
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling  QuantizedConvolutionOpModel m(GetRegistration(),
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling                                {TensorType_UINT8, {2, 2, 4, 1}, -63.5, 64},
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                {TensorType_UINT8, {3, 2, 2, 1}, -63.5, 64},
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                {TensorType_UINT8, {}, -127, 128});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetInput({
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      // First batch
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      1, 1, 1, 1,  // row = 1
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      2, 2, 2, 2,  // row = 2
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      // Second batch
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      1, 2, 3, 4,  // row = 1
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      1, 2, 3, 4,  // row = 2
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  });
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetFilter({
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      1, 2, 3, 4,    // first 2x2 filter
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      -1, 1, -1, 1,  // second 2x2 filter
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      -1, -1, 1, 1,  // third 2x2 filter
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  });
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetBias({1, 2, 3});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.Invoke();
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  EXPECT_THAT(m.GetDequantizedOutput(),
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle              ElementsAreArray(ArrayFloatNear(
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                  {
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                      18, 2, 5,  // first batch, left
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                      18, 2, 5,  // first batch, right
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                      17, 4, 3,  // second batch, left
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                      37, 4, 3,  // second batch, right
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                  },
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                  1e-5)));
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  // For good  measure, let's also verify the quantized values:
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  EXPECT_THAT(m.GetOutput(), ElementsAreArray({
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                 145, 129, 132,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                 145, 129, 132,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                 144, 131, 130,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                 164, 131, 130,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                             }));
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle}
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng LingTEST_P(ConvolutionOpTest, SimpleTestQuantizedWithAnisotropicStrides) {
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling  QuantizedConvolutionOpModel m(GetRegistration(),
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling                                {TensorType_UINT8, {1, 3, 6, 1}, -63.5, 64},
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                {TensorType_UINT8, {1, 2, 2, 1}, -63.5, 64},
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                {TensorType_UINT8, {}, -127, 128},
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                /*stride_width=*/3, /*stride_height=*/1);
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetInput({
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      3, 2, 1, -1, -2, -3,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      4, 3, 2, -2, -3, -4,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      5, 4, 3, -3, -4, -5,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  });
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetFilter({
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      1, 2,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle      3, 4,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  });
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.SetBias({-1});
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  m.Invoke();
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  EXPECT_THAT(m.GetDequantizedOutput(), ElementsAreArray(ArrayFloatNear({
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                            30, -24,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                            40, -34,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                        })));
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  EXPECT_THAT(m.GetOutput(), ElementsAreArray({
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                 157, 103,  //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                                 167, 93,   //
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle                             }));
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle}
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng LingINSTANTIATE_TEST_CASE_P(
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling    ConvolutionOpTest, ConvolutionOpTest,
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling    ::testing::ValuesIn(SingleOpTest::GetKernelTags(*kKernelMap)));
e8e33b0050e7e1ff686312bcbdafa270c2e29462Yu-Cheng Ling
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle}  // namespace
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle}  // namespace tflite
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selleint main(int argc, char** argv) {
00791693e4d32bed92fcfadf09da321c9f548babA. Unique TensorFlower  ::tflite::LogToStderr();
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  ::testing::InitGoogleTest(&argc, argv);
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle  return RUN_ALL_TESTS();
0b15439f8f0f2d4755587f4096c3ea04cb199d23Andrew Selle}