stochastic_linear_ranker/native/stochastic_linear_ranker.cpp

6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua/*
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua * Copyright (C) 2012 The Android Open Source Project
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua *
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua * Licensed under the Apache License, Version 2.0 (the "License");
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua * you may not use this file except in compliance with the License.
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua * You may obtain a copy of the License at
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua *
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua *      http://www.apache.org/licenses/LICENSE-2.0
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua *
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua * Unless required by applicable law or agreed to in writing, software
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua * distributed under the License is distributed on an "AS IS" BASIS,
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua * See the License for the specific language governing permissions and
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua * limitations under the License.
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua */
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua#include <algorithm>
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua#include <stdlib.h>
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua#include "stochastic_linear_ranker.h"
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Huanamespace learning_stochastic_linear {
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Huatemplate<class Key, class Hash>
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Huavoid StochasticLinearRanker<Key, Hash>::UpdateSubGradient(
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    const SparseWeightVector<Key, Hash> &positive,
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    const SparseWeightVector<Key, Hash> &negative,
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    const double learning_rate,
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    const double positive_score,
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    const double negative_score,
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    const int32 gradient_l0_norm) {
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  SparseWeightVector<Key, Hash> gradient;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  double final_learning_rate;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  gradient.AdditiveWeightUpdate(1.0, positive, 0.0);
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  gradient.AdditiveWeightUpdate(-1.0, negative, 0.0);
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  if (update_type_ == FULL_CS || update_type_ == REG_CS) {
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    const double loss = std::max(0.0, (1 - positive_score + negative_score));
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    const double gradient_norm = gradient.L2Norm();
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    const double kMinGradientNorm = 1e-8;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    const double kMaxGradientNorm = 1e8;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    if (gradient_norm < kMinGradientNorm || gradient_norm > kMaxGradientNorm)
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua      return;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    if (update_type_ == FULL_CS)
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua      final_learning_rate =
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua          std::min(lambda_, loss / (gradient_norm * gradient_norm));
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    else
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua      final_learning_rate =
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua          loss / (gradient_norm * gradient_norm + 1 / (2 * lambda_));
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  } else {
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    gradient.AdditiveWeightUpdate(-lambda_, weight_, 0.0);
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    final_learning_rate = learning_rate;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  }
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  if (gradient_l0_norm > 0) {
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    gradient.ReprojectL0(gradient_l0_norm);
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  }
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  if (gradient.IsValid())
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    weight_.AdditiveWeightUpdate(final_learning_rate, gradient, 0.0);
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua}
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Huatemplate<class Key, class Hash>
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Huaint StochasticLinearRanker<Key, Hash>::UpdateClassifier(
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    const SparseWeightVector<Key, Hash> &positive,
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    const SparseWeightVector<Key, Hash> &negative) {
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  // Create a backup of the weight vector in case the iteration results in
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  // unbounded weights.
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  SparseWeightVector<Key, Hash> weight_backup;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  weight_backup.CopyFrom(weight_);
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  const double positive_score = ScoreSample(positive);
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  const double negative_score = ScoreSample(negative);
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  if ((positive_score - negative_score) < 1) {
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    ++mini_batch_counter_;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    if ((mini_batch_counter_ % mini_batch_size_ == 0) ||
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua        (iteration_num_ == 0)) {
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua      ++iteration_num_;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua      mini_batch_counter_ = 0;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    }
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    learning_rate_controller_.IncrementSample();
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    double learning_rate = learning_rate_controller_.GetLearningRate();
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    if (rank_loss_type_ == PAIRWISE) {
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua      UpdateSubGradient(positive, negative, learning_rate,
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua                        positive_score, negative_score,
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua                        gradient_l0_norm_);
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    } else if (rank_loss_type_ == RECIPROCAL_RANK) {
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua      const double current_negative_score = ScoreSample(current_negative_);
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua      if ((negative_score > current_negative_score) ||
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua          ((rand()/RAND_MAX) < acceptence_probability_)) {
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua        UpdateSubGradient(positive, negative, learning_rate,
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua                          positive_score, negative_score,
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua                          gradient_l0_norm_);
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua        current_negative_.Clear();
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua        current_negative_.LoadWeightVector(negative);
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua      } else {
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua        UpdateSubGradient(positive, current_negative_, learning_rate,
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua                          positive_score, negative_score,
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua                          gradient_l0_norm_);
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua      }
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    } else {
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua      ALOGE("Unknown rank loss type: %d", rank_loss_type_);
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    }
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    int return_code;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    if ((mini_batch_counter_ == 0) && (update_type_ == SL)) {
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua      return_code = 1;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua      switch (regularization_type_) {
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua        case L1:
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua          weight_.ReprojectL1(norm_constraint_);
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua          break;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua        case L2:
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua          weight_.ReprojectL2(norm_constraint_);
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua          break;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua        case L0:
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua          weight_.ReprojectL0(norm_constraint_);
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua          break;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua        default:
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua          ALOGE("Unsupported optimization type specified");
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua          return_code = -1;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua      }
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    } else if (update_type_ == SL) {
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua      return_code = 2;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    } else {
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua      return_code = 1;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    }
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    if (!weight_.IsValid())
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua      weight_.CopyFrom(weight_backup);
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua    return return_code;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  }
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua  return 0;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua}
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua
a08525ea290ff4edc766eda1ec80388be866a79eDan Alberttemplate class StochasticLinearRanker<std::string, std::unordered_map<std::string, double> >;
a08525ea290ff4edc766eda1ec80388be866a79eDan Alberttemplate class StochasticLinearRanker<int, std::unordered_map<int, double> >;
a08525ea290ff4edc766eda1ec80388be866a79eDan Alberttemplate class StochasticLinearRanker<uint64, std::unordered_map<uint64, double> >;
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua
6b4eebc73439cbc3ddfb547444a341d1f9be7996Wei Hua}  // namespace learning_stochastic_linear