xla/service/transfer_manager.h

1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins/* Copyright 2017 The TensorFlow Authors. All Rights Reserved.
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter HawkinsLicensed under the Apache License, Version 2.0 (the "License");
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkinsyou may not use this file except in compliance with the License.
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter HawkinsYou may obtain a copy of the License at
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins    http://www.apache.org/licenses/LICENSE-2.0
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter HawkinsUnless required by applicable law or agreed to in writing, software
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkinsdistributed under the License is distributed on an "AS IS" BASIS,
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter HawkinsWITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter HawkinsSee the License for the specific language governing permissions and
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkinslimitations under the License.
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins==============================================================================*/
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins#ifndef TENSORFLOW_COMPILER_XLA_SERVICE_TRANSFER_MANAGER_H_
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins#define TENSORFLOW_COMPILER_XLA_SERVICE_TRANSFER_MANAGER_H_
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins#include <map>
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins#include <set>
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins#include <vector>
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
02ac85399d4fb35d5055ecf426632b9446a70041A. Unique TensorFlower#include "tensorflow/compiler/xla/literal_util.h"
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan#include "tensorflow/compiler/xla/service/shaped_buffer.h"
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins#include "tensorflow/compiler/xla/statusor.h"
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins#include "tensorflow/compiler/xla/types.h"
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins#include "tensorflow/compiler/xla/xla_data.pb.h"
99e1b19ceba32b8354dddc2841b81864c9ba96bbJacques Pienaar#include "tensorflow/core/lib/gtl/array_slice.h"
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins#include "tensorflow/core/platform/mutex.h"
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins#include "tensorflow/core/platform/stream_executor_no_cuda.h"
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins#include "tensorflow/core/platform/thread_annotations.h"
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins#include "tensorflow/core/platform/types.h"
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkinsnamespace xla {
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins// The TransferManager interface lets backends provide platform-specific
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins// mechanisms for constructing literals from given device memory handles.
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins// This lets each platform customize how literals are transferred to/from the
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins// device in terms of padding, leading dimension, etc.
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkinsclass TransferManager {
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins public:
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  virtual ~TransferManager() {}
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  // Returns the ID of the platform that this transfer manager acts on.
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  virtual perftools::gputools::Platform::Id PlatformId() const = 0;
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
0683cdbd8701e4e6a582db1e71d58fcad628e070A. Unique TensorFlower  // Returns the shape of the on-device representation for the given shape on
0683cdbd8701e4e6a582db1e71d58fcad628e070A. Unique TensorFlower  // the host. This is intended for use with ShapedBuffer where buffers are
0683cdbd8701e4e6a582db1e71d58fcad628e070A. Unique TensorFlower  // pre-allocated by the host, e.g. TransferLiteralToDevice, without the user
0683cdbd8701e4e6a582db1e71d58fcad628e070A. Unique TensorFlower  // needing to consider device-specific behaviors.
0683cdbd8701e4e6a582db1e71d58fcad628e070A. Unique TensorFlower  virtual Shape HostShapeToDeviceShape(const Shape& host_shape) const {
0683cdbd8701e4e6a582db1e71d58fcad628e070A. Unique TensorFlower    return host_shape;
0683cdbd8701e4e6a582db1e71d58fcad628e070A. Unique TensorFlower  }
0683cdbd8701e4e6a582db1e71d58fcad628e070A. Unique TensorFlower
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // Returns a literal containing the data held in the given ShapedBuffer.
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // using the provided executor. The optional literal_shape will be the shape
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // for the literal. The shape of the ShapedBuffer and
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // DeviceShape(literal_shape) must be compatible, but need not have the same
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // layout.
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan  virtual StatusOr<std::unique_ptr<Literal>> TransferLiteralFromDevice(
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan      perftools::gputools::StreamExecutor* executor,
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan      const ShapedBuffer& device_buffer) = 0;
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan  // Transfers the given literal into the previously allocated device memory
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // represented by the given ShapedBuffer using the given executor. The shape
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // of the ShapedBuffer and DeviceShape(literal.shape()) must be compatible,
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // but need not have the same layout
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan  virtual Status TransferLiteralToDevice(
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan      perftools::gputools::StreamExecutor* executor, const Literal& literal,
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan      const ShapedBuffer& device_buffer) = 0;
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // Convenience methods for transferring an array to or from the device at a
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // known address. This avoids having to construct a ShapedBuffer just to
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // transfer an array at a known address.
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  Status TransferArrayToDevice(
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower      perftools::gputools::StreamExecutor* executor, const Literal& literal,
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower      const perftools::gputools::DeviceMemoryBase& dest);
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  StatusOr<std::unique_ptr<Literal>> TransferArrayFromDevice(
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower      perftools::gputools::StreamExecutor* executor, const Shape& shape,
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower      const perftools::gputools::DeviceMemoryBase& source);
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  // Transfers the given literal into the Infeed interface of the device,
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  // using the given executor.
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  virtual Status TransferLiteralToInfeed(
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins      perftools::gputools::StreamExecutor* executor,
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins      const Literal& literal) = 0;
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
efc8f98d45df835bac2373e19f1da57e3a1ea2d0Jacques Pienaar  // Transfers the given literal from the Outfeed interface of the device,
efc8f98d45df835bac2373e19f1da57e3a1ea2d0Jacques Pienaar  // using the given executor.
efc8f98d45df835bac2373e19f1da57e3a1ea2d0Jacques Pienaar  virtual Status TransferLiteralFromOutfeed(
efc8f98d45df835bac2373e19f1da57e3a1ea2d0Jacques Pienaar      perftools::gputools::StreamExecutor* executor, const Shape& literal_shape,
efc8f98d45df835bac2373e19f1da57e3a1ea2d0Jacques Pienaar      Literal* literal) = 0;
efc8f98d45df835bac2373e19f1da57e3a1ea2d0Jacques Pienaar
99e1b19ceba32b8354dddc2841b81864c9ba96bbJacques Pienaar  // Resets the devices associated with this transfer manager.
99e1b19ceba32b8354dddc2841b81864c9ba96bbJacques Pienaar  virtual Status ResetDevices(
99e1b19ceba32b8354dddc2841b81864c9ba96bbJacques Pienaar      tensorflow::gtl::ArraySlice<perftools::gputools::StreamExecutor*>
99e1b19ceba32b8354dddc2841b81864c9ba96bbJacques Pienaar          executor) = 0;
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan  // Given an allocated ShapedBuffer, constructs the tuple index table(s) in
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan  // each buffer of the given ShapedBuffer corresponding to tuple shapes. If the
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan  // ShapedBuffer is array-shaped this method does nothing.
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan  Status WriteTupleIndexTables(perftools::gputools::StreamExecutor* executor,
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan                               const ShapedBuffer& device_buffer);
06deeea373c93ea36547648481c5daf4dc56126fMark Heffernan
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  // Determines the byte size requirement for the given shape on the underlying
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  // architecture. This will be used to allocate an appropriately sized memory
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  // region for a host-to-device transfer.
3f7d27ae53095a140994b3c0c00b12f7a6f5fd06A. Unique TensorFlower  virtual int64 GetByteSizeRequirement(const Shape& shape) const = 0;
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // Allocate a ShapedBuffer which can hold data with the given on-host
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // shape. The on-device shape may be different as indicated by
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // HostShapeToDeviceShape.
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  StatusOr<std::unique_ptr<ShapedBuffer>> AllocateShapedBuffer(
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower      const Shape& on_host_shape, DeviceMemoryAllocator* allocator,
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower      int device_ordinal);
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  StatusOr<std::unique_ptr<ScopedShapedBuffer>> AllocateScopedShapedBuffer(
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower      const Shape& on_host_shape, DeviceMemoryAllocator* allocator,
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower      int device_ordinal);
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  /////
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  // The TransferManager class also serves as a point to register objects for
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  // the various platforms.
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  // Registers the TransferManager singleton for the platform kind. This is
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  // assumed to be a singleton, so no ownership is transferred.
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  //
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  // Precondition: a platform kind must not be registered more than once.
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  typedef std::unique_ptr<TransferManager> (*TransferManagerCreationFunction)();
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  static void RegisterTransferManager(
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins      perftools::gputools::Platform::Id platform_id,
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins      TransferManagerCreationFunction transfer_manager);
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  // Returns the transfer manager singleton pointer if it is available for the
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  // given platform, or an error status if it is not.
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  static StatusOr<TransferManager*> GetForPlatform(
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins      const perftools::gputools::Platform* platform);
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan protected:
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // Transfer a memory block of the given size from 'source' buffer to the
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // Infeed interface of the device using the given executor.
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  //
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // size is the size to transfer from source in bytes.
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  //
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // source is the source data that must be in the target-dependent layout that
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // the Infeed HLO used in the computation expects.
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  virtual Status TransferBufferToInfeed(
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower      perftools::gputools::StreamExecutor* executor, int64 size,
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower      const void* source) = 0;
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan  // Transfer a memory block of the given size from the device source into the
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan  // 'destination' buffer.
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan  //
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan  // size is the size to transfer to destination in bytes.
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan  virtual Status TransferBufferFromDevice(
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan      perftools::gputools::StreamExecutor* executor,
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan      const perftools::gputools::DeviceMemoryBase& source, int64 size,
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan      void* destination);
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan  // Transfer a memory block of the given size from 'source' buffer to the given
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan  // destination of the device.
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan  //
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan  // size is the size to transfer from source in bytes.
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan  virtual Status TransferBufferToDevice(
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan      perftools::gputools::StreamExecutor* executor, int64 size,
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan      const void* source, perftools::gputools::DeviceMemoryBase* destination);
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan  // Writes the given device-memory pointers in 'elements' to the given region
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // to construct a tuple index table in the platform-specific tuple
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  // representation.
fc2526a8c1cf0bc2a93c8cc819ff7209eb4628c9A. Unique TensorFlower  virtual Status WriteSingleTupleIndexTable(
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan      perftools::gputools::StreamExecutor* executor,
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan      tensorflow::gtl::ArraySlice<perftools::gputools::DeviceMemoryBase>
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan          elements,
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan      const Shape& shape, perftools::gputools::DeviceMemoryBase* region) = 0;
22d948d2739ecaadfb4091302f2050ba9cf0d0c1Mark Heffernan
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins private:
b0bcf675a4b5d6217f3b58fd27b344f20e7bf25dSanjoy Das  // The mutex that guards the platform-to-transfer manager map.
b0bcf675a4b5d6217f3b58fd27b344f20e7bf25dSanjoy Das  static tensorflow::mutex platform_transfer_manager_mutex_;
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  // State kept for each kind of TransferManager.  Registration functions
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  // set up creation_function, and then we use that to lazily create
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  // "manager" the first time GetForPlatform is invoked for a particular id.
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  struct State {
8cb5e9867482a8e05f756fad35634e1674fe7f16A. Unique TensorFlower    std::unique_ptr<TransferManager> manager;
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins    TransferManagerCreationFunction creation_function = nullptr;
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  };
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  // Map from platform kind to transfer manager singleton.
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  static std::map<perftools::gputools::Platform::Id, State>*
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins  GetPlatformTransferManagers();
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins};
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins}  // namespace xla
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins
1e67c90e2caceeff82d09793d1ef5fa0300d219bPeter Hawkins#endif  // TENSORFLOW_COMPILER_XLA_SERVICE_TRANSFER_MANAGER_H_