python/ops/spectral_grad.py

b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan# Copyright 2017 The TensorFlow Authors. All Rights Reserved.
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan#
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan# Licensed under the Apache License, Version 2.0 (the "License");
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan# you may not use this file except in compliance with the License.
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan# You may obtain a copy of the License at
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan#
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan#     http://www.apache.org/licenses/LICENSE-2.0
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan#
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan# Unless required by applicable law or agreed to in writing, software
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan# distributed under the License is distributed on an "AS IS" BASIS,
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan# See the License for the specific language governing permissions and
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan# limitations under the License.
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan# ==============================================================================
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan"""Gradients for operators defined in spectral_ops.py."""
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryanfrom __future__ import absolute_import
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryanfrom __future__ import division
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryanfrom __future__ import print_function
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryanimport numpy as np
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryanfrom tensorflow.python.framework import dtypes
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryanfrom tensorflow.python.framework import ops
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryanfrom tensorflow.python.ops import array_ops
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryanfrom tensorflow.python.ops import math_ops
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryanfrom tensorflow.python.ops import spectral_ops
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryandef _FFTSizeForGrad(grad, rank):
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  return math_ops.reduce_prod(array_ops.shape(grad)[-rank:])
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan@ops.RegisterGradient("FFT")
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryandef _FFTGrad(_, grad):
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  size = math_ops.cast(_FFTSizeForGrad(grad, 1), dtypes.float32)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  return spectral_ops.ifft(grad) * math_ops.complex(size, 0.)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan@ops.RegisterGradient("IFFT")
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryandef _IFFTGrad(_, grad):
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  rsize = 1. / math_ops.cast(_FFTSizeForGrad(grad, 1), dtypes.float32)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  return spectral_ops.fft(grad) * math_ops.complex(rsize, 0.)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan@ops.RegisterGradient("FFT2D")
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryandef _FFT2DGrad(_, grad):
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  size = math_ops.cast(_FFTSizeForGrad(grad, 2), dtypes.float32)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  return spectral_ops.ifft2d(grad) * math_ops.complex(size, 0.)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan@ops.RegisterGradient("IFFT2D")
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryandef _IFFT2DGrad(_, grad):
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  rsize = 1. / math_ops.cast(_FFTSizeForGrad(grad, 2), dtypes.float32)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  return spectral_ops.fft2d(grad) * math_ops.complex(rsize, 0.)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan@ops.RegisterGradient("FFT3D")
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryandef _FFT3DGrad(_, grad):
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  size = math_ops.cast(_FFTSizeForGrad(grad, 3), dtypes.float32)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  return spectral_ops.ifft3d(grad) * math_ops.complex(size, 0.)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan@ops.RegisterGradient("IFFT3D")
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryandef _IFFT3DGrad(_, grad):
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  rsize = 1. / math_ops.cast(_FFTSizeForGrad(grad, 3), dtypes.float32)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  return spectral_ops.fft3d(grad) * math_ops.complex(rsize, 0.)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryandef _RFFTGradHelper(rank, irfft_fn):
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  """Returns a gradient function for an RFFT of the provided rank."""
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  # Can't happen because we don't register a gradient for RFFT3D.
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  assert rank in (1, 2), "Gradient for RFFT3D is not implemented."
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  def _Grad(op, grad):
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    """A gradient function for RFFT with the provided `rank` and `irfft_fn`."""
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    fft_length = op.inputs[1]
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    input_shape = array_ops.shape(op.inputs[0])
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    is_even = math_ops.cast(1 - (fft_length[-1] % 2), dtypes.complex64)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    def _TileForBroadcasting(matrix, t):
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      expanded = array_ops.reshape(
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan          matrix,
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan          array_ops.concat([
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan              array_ops.ones([array_ops.rank(t) - 2], dtypes.int32),
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan              array_ops.shape(matrix)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan          ], 0))
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      return array_ops.tile(
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan          expanded, array_ops.concat([array_ops.shape(t)[:-2], [1, 1]], 0))
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    def _MaskMatrix(length):
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      # TODO(rjryan): Speed up computation of twiddle factors using the
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      # following recurrence relation and cache them across invocations of RFFT.
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      #
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      # t_n = exp(sqrt(-1) * pi * n^2 / line_len)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      # for n = 0, 1,..., line_len-1.
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      # For n > 2, use t_n = t_{n-1}^2 / t_{n-2} * t_1^2
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      a = array_ops.tile(
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan          array_ops.expand_dims(math_ops.range(length), 0), (length, 1))
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      b = array_ops.transpose(a, [1, 0])
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      return math_ops.exp(-2j * np.pi * math_ops.cast(a * b, dtypes.complex64) /
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan                          math_ops.cast(length, dtypes.complex64))
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    def _YMMask(length):
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      """A sequence of [1+0j, -1+0j, 1+0j, -1+0j, ...] with length `length`."""
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      return math_ops.cast(1 - 2 * (math_ops.range(length) % 2),
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan                           dtypes.complex64)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    y0 = grad[..., 0:1]
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    if rank == 1:
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      ym = grad[..., -1:]
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      extra_terms = y0 + is_even * ym * _YMMask(input_shape[-1])
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    elif rank == 2:
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      # Create a mask matrix for y0 and ym.
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      base_mask = _MaskMatrix(input_shape[-2])
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      # Tile base_mask to match y0 in shape so that we can batch-matmul the
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      # inner 2 dimensions.
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      tiled_mask = _TileForBroadcasting(base_mask, y0)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      y0_term = math_ops.matmul(tiled_mask, math_ops.conj(y0))
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      extra_terms = y0_term
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      ym = grad[..., -1:]
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      ym_term = math_ops.matmul(tiled_mask, math_ops.conj(ym))
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      inner_dim = input_shape[-1]
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      ym_term = array_ops.tile(
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan          ym_term,
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan          array_ops.concat([
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan              array_ops.ones([array_ops.rank(grad) - 1], dtypes.int32),
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan              [inner_dim]
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan          ], 0)) * _YMMask(inner_dim)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan      extra_terms += is_even * ym_term
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    # The gradient of RFFT is the IRFFT of the incoming gradient times a scaling
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    # factor, plus some additional terms to make up for the components dropped
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    # due to Hermitian symmetry.
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    input_size = math_ops.to_float(_FFTSizeForGrad(op.inputs[0], rank))
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    irfft = irfft_fn(grad, fft_length)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    return 0.5 * (irfft * input_size + math_ops.real(extra_terms)), None
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  return _Grad
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryandef _IRFFTGradHelper(rank, rfft_fn):
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  """Returns a gradient function for an IRFFT of the provided rank."""
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  # Can't happen because we don't register a gradient for IRFFT3D.
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  assert rank in (1, 2), "Gradient for IRFFT3D is not implemented."
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  def _Grad(op, grad):
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    """A gradient function for IRFFT with the provided `rank` and `rfft_fn`."""
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    # Generate a simple mask like [1.0, 2.0, ..., 2.0, 1.0] for even-length FFTs
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    # and [1.0, 2.0, ..., 2.0] for odd-length FFTs. To reduce extra ops in the
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    # graph we special-case the situation where the FFT length and last
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    # dimension of the input are known at graph construction time.
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    fft_length = op.inputs[1]
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    is_odd = math_ops.mod(fft_length[-1], 2)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    input_last_dimension = array_ops.shape(op.inputs[0])[-1]
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    mask = array_ops.concat(
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan        [[1.0], 2.0 * array_ops.ones([input_last_dimension - 2 + is_odd]),
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan         array_ops.ones([1 - is_odd])], 0)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    rsize = math_ops.reciprocal(math_ops.to_float(_FFTSizeForGrad(grad, rank)))
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    # The gradient of IRFFT is the RFFT of the incoming gradient times a scaling
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    # factor and a mask. The mask scales the gradient for the Hermitian
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    # symmetric components of the RFFT by a factor of two, since these
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    # components are de-duplicated in the RFFT.
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    rfft = rfft_fn(grad, fft_length)
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan    return rfft * math_ops.cast(rsize * mask, dtypes.complex64), None
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan  return _Grad
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryan
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryanops.RegisterGradient("RFFT")(_RFFTGradHelper(1, spectral_ops.irfft))
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryanops.RegisterGradient("IRFFT")(_IRFFTGradHelper(1, spectral_ops.rfft))
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryanops.RegisterGradient("RFFT2D")(_RFFTGradHelper(2, spectral_ops.irfft2d))
b03a72c804d2e6ececcbe4fe4cd603edc9f8049dRJ Ryanops.RegisterGradient("IRFFT2D")(_IRFFTGradHelper(2, spectral_ops.rfft2d))