!8106 add cpu adam delta

Merge pull request !8106 from kisnwang/add-cpu-adam-delta
2020-11-06 17:30:24 +08:00 · 2020-11-06 17:30:24 +08:00 · 073d991de4
parent afd58ab5d8 cbece74a23
commit 073d991de4
4 changed files with 324 additions and 0 deletions
--- a/mindspore/ccsrc/backend/kernel_compiler/cpu/adam_delta_cpu_kernel.cc
+++ b/mindspore/ccsrc/backend/kernel_compiler/cpu/adam_delta_cpu_kernel.cc
@ -0,0 +1,174 @@
+/**
+ * Copyright 2020 Huawei Technologies Co., Ltd
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ * http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#include "backend/kernel_compiler/cpu/adam_delta_cpu_kernel.h"
+#include <thread>
+#include <vector>
+#include <string>
+#include <memory>
+#include "backend/kernel_compiler/common_utils.h"
+#include "runtime/device/cpu/cpu_device_address.h"
+
+namespace mindspore {
+namespace kernel {
+constexpr size_t kAdamDeltaInputSize = 9;
+constexpr size_t kUsedThreadNum = 23;
+namespace {
+struct ComputeParam {
+  float *delta_{nullptr};
+  float *m_{nullptr};
+  float *v_{nullptr};
+  float *grad_{nullptr};
+  float beta1_{0};
+  float beta2_{0};
+  float epsilon_{0};
+  float lr_{0};
+  bool use_nesterov_{0};
+};
+
+void ComputeWeightDelta(const std::shared_ptr<ComputeParam> &input_params, size_t start, size_t end) {
+  MS_EXCEPTION_IF_NULL(input_params);
+  MS_EXCEPTION_IF_NULL(input_params->delta_);
+  MS_EXCEPTION_IF_NULL(input_params->m_);
+  MS_EXCEPTION_IF_NULL(input_params->v_);
+  MS_EXCEPTION_IF_NULL(input_params->grad_);
+  auto delta = input_params->delta_;
+  auto m = input_params->m_;
+  auto v = input_params->v_;
+  auto lr = input_params->lr_;
+  auto beta1 = input_params->beta1_;
+  auto beta2 = input_params->beta2_;
+  auto epsilon = input_params->epsilon_;
+  auto use_nesterov = input_params->use_nesterov_;
+  auto grad = input_params->grad_;
+  for (size_t i = start; i < end; ++i) {
+    m[i] *= beta1;
+    v[i] *= beta2;
+    m[i] += (1 - beta1) * grad[i];
+    v[i] += (1 - beta2) * grad[i] * grad[i];
+    if (use_nesterov) {
+      delta[i] = -lr * (m[i] * beta1 + (1 - beta1) * grad[i]) / (std::sqrt(v[i]) + epsilon);
+    } else {
+      delta[i] = -lr * m[i] / (std::sqrt(v[i]) + epsilon);
+    }
+  }
+}
+}  // namespace
+
+void AdamDeltaCPUKernel::InitKernel(const CNodePtr &kernel_node) {
+  MS_EXCEPTION_IF_NULL(kernel_node);
+  std::vector<size_t> delta_shape = AnfAlgo::GetOutputDeviceShape(kernel_node, 0);
+  std::vector<size_t> m_shape = AnfAlgo::GetInputDeviceShape(kernel_node, 0);
+  std::vector<size_t> v_shape = AnfAlgo::GetInputDeviceShape(kernel_node, 1);
+  std::vector<size_t> grad_shape = AnfAlgo::GetInputDeviceShape(kernel_node, 8);
+  if (!IsSameShape(delta_shape, m_shape)) {
+    MS_LOG(EXCEPTION) << "Delta and m should have the same shape";
+  }
+  if (!IsSameShape(delta_shape, v_shape)) {
+    MS_LOG(EXCEPTION) << "Delta and v should have the same shape";
+  }
+  if (!IsSameShape(delta_shape, grad_shape)) {
+    MS_LOG(EXCEPTION) << "Delta and grad should have the same shape";
+  }
+  if (delta_shape.empty()) {
+    MS_LOG(EXCEPTION) << "Delta must be at least 1D";
+  }
+  elem_num_ = 1;
+  for (size_t i = 0; i < delta_shape.size(); ++i) {
+    elem_num_ *= delta_shape[i];
+  }
+  if (elem_num_ < 1) {
+    MS_LOG(EXCEPTION) << "Invalid delta shape";
+  }
+  if (AnfAlgo::HasNodeAttr(USE_NESTEROV, kernel_node)) {
+    use_nesterov_ = AnfAlgo::GetNodeAttr<bool>(kernel_node, "use_nesterov");
+  }
+}
+
+void AdamDeltaCPUKernel::CheckParams(const std::vector<kernel::AddressPtr> &inputs,
+                                     const std::vector<kernel::AddressPtr> &workspace,
+                                     const std::vector<kernel::AddressPtr> &outputs) const {
+  if (inputs.size() != kAdamDeltaInputSize) {
+    MS_LOG(EXCEPTION) << "Error input size!";
+  }
+  size_t elem_size = elem_num_ * 4;
+  std::vector<size_t> expect_sizes = {elem_size, elem_size, 4, 4, 4, 4, 4, 4, elem_size};
+  std::vector<std::string> input_names = {"m",     "v",     "beta1_power", "beta2_power", "lr",
+                                          "beta1", "beta2", "epsilon",     "grad"};
+  for (size_t i = 0; i < kAdamDeltaInputSize; ++i) {
+    if (inputs[i]->size != expect_sizes[i]) {
+      MS_LOG(EXCEPTION) << "Error input " << input_names[i] << " size!";
+    }
+  }
+  if (outputs.size() < 1 || outputs[0]->size != elem_size) {
+    MS_LOG(EXCEPTION) << "Error output delta size!";
+  }
+}
+
+bool AdamDeltaCPUKernel::Launch(const std::vector<kernel::AddressPtr> &inputs,
+                                const std::vector<kernel::AddressPtr> &workspace,
+                                const std::vector<kernel::AddressPtr> &outputs) {
+  CheckParams(inputs, workspace, outputs);
+  auto m = reinterpret_cast<float *>(inputs[0]->addr);
+  auto v = reinterpret_cast<float *>(inputs[1]->addr);
+  auto beta1_power = reinterpret_cast<float *>(inputs[2]->addr)[0];
+  if (beta1_power == 1) {
+    MS_LOG(EXCEPTION) << "The beta1_power should not be 1";
+  }
+  auto beta2_power = reinterpret_cast<float *>(inputs[3]->addr)[0];
+  auto lr = reinterpret_cast<float *>(inputs[4]->addr)[0];
+  auto beta1 = reinterpret_cast<float *>(inputs[5]->addr)[0];
+  auto beta2 = reinterpret_cast<float *>(inputs[6]->addr)[0];
+  auto epsilon = reinterpret_cast<float *>(inputs[7]->addr)[0];
+  auto grad = reinterpret_cast<float *>(inputs[8]->addr);
+  auto delta = reinterpret_cast<float *>(outputs[0]->addr);
+  lr = lr * std::sqrt(1 - beta2_power) / (1 - beta1_power);
+  size_t thread_num = kUsedThreadNum;
+  if (elem_num_ < thread_num) {
+    thread_num = elem_num_;
+  }
+  std::vector<std::thread> threads;
+  std::vector<std::shared_ptr<ComputeParam>> thread_params;
+  threads.reserve(thread_num);
+
+  size_t end = 0;
+  size_t offset = elem_num_ / thread_num;
+  size_t left = elem_num_ % thread_num;
+  for (size_t i = 0; i < thread_num; ++i) {
+    auto params = std::make_shared<ComputeParam>();
+    params->delta_ = delta;
+    params->m_ = m;
+    params->v_ = v;
+    params->grad_ = grad;
+    params->beta1_ = beta1;
+    params->beta2_ = beta2;
+    params->use_nesterov_ = use_nesterov_;
+    params->lr_ = lr;
+    params->epsilon_ = epsilon;
+    size_t start = end;
+    end = start + offset;
+    if (i < left) {
+      end += 1;
+    }
+    threads.emplace_back(std::thread(ComputeWeightDelta, params, start, end));
+    thread_params.emplace_back(params);
+  }
+  for (size_t i = 0; i < thread_num; ++i) {
+    threads[i].join();
+  }
+  return true;
+}
+}  // namespace kernel
+}  // namespace mindspore
--- a/mindspore/ccsrc/backend/kernel_compiler/cpu/adam_delta_cpu_kernel.h
+++ b/mindspore/ccsrc/backend/kernel_compiler/cpu/adam_delta_cpu_kernel.h
@ -0,0 +1,56 @@
+/**
+ * Copyright 2020 Huawei Technologies Co., Ltd
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ * http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#ifndef MINDSPORE_CCSRC_BACKEND_KERNEL_COMPILER_CPU_ADAM_DELTA_CPU_KERNEL_H_
+#define MINDSPORE_CCSRC_BACKEND_KERNEL_COMPILER_CPU_ADAM_DELTA_CPU_KERNEL_H_
+#include <vector>
+#include "backend/kernel_compiler/cpu/cpu_kernel.h"
+#include "backend/kernel_compiler/cpu/cpu_kernel_factory.h"
+
+namespace mindspore {
+namespace kernel {
+class AdamDeltaCPUKernel : public CPUKernel {
+ public:
+  AdamDeltaCPUKernel() = default;
+  ~AdamDeltaCPUKernel() override = default;
+  void InitKernel(const CNodePtr &kernel_node) override;
+  bool Launch(const std::vector<AddressPtr> &inputs, const std::vector<AddressPtr> &workspace,
+              const std::vector<AddressPtr> &outputs) override;
+
+ protected:
+  void CheckParams(const std::vector<AddressPtr> &inputs, const std::vector<AddressPtr> &workspace,
+                   const std::vector<AddressPtr> &outputs) const;
+  bool use_nesterov_{false};
+  size_t elem_num_{0};
+};
+
+MS_REG_CPU_KERNEL(AdamDelta,
+                  KernelAttr()
+                    .AddInputAttr(kNumberTypeFloat32)
+                    .AddInputAttr(kNumberTypeFloat32)
+                    .AddInputAttr(kNumberTypeFloat32)
+                    .AddInputAttr(kNumberTypeFloat32)
+                    .AddInputAttr(kNumberTypeFloat32)
+                    .AddInputAttr(kNumberTypeFloat32)
+                    .AddInputAttr(kNumberTypeFloat32)
+                    .AddInputAttr(kNumberTypeFloat32)
+                    .AddInputAttr(kNumberTypeFloat32)
+                    .AddInputAttr(kNumberTypeFloat32)
+                    .AddOutputAttr(kNumberTypeFloat32),
+                  AdamDeltaCPUKernel);
+}  // namespace kernel
+}  // namespace mindspore
+
+#endif  // MINDSPORE_CCSRC_BACKEND_KERNEL_COMPILER_CPU_ADAM_DELTA_CPU_KERNEL_H_
--- a/tests/ut/cpp/CMakeLists.txt
+++ b/tests/ut/cpp/CMakeLists.txt
@ -110,6 +110,7 @@ file(GLOB_RECURSE MINDSPORE_SRC_LIST RELATIVE ${CMAKE_CURRENT_SOURCE_DIR}
        "../../../mindspore/ccsrc/backend/kernel_compiler/cpu/sparse_apply_proximal_adagrad_cpu_kernel.cc"
        "../../../mindspore/ccsrc/backend/kernel_compiler/cpu/unique_cpu_kernel.cc"
        "../../../mindspore/ccsrc/backend/kernel_compiler/cpu/unique_with_pad_cpu_kernel.cc"
+        "../../../mindspore/ccsrc/backend/kernel_compiler/cpu/adam_delta_cpu_kernel.cc"
        "../../../mindspore/ccsrc/backend/kernel_compiler/akg/*.cc"
        "../../../mindspore/ccsrc/backend/kernel_compiler/rts/*.cc"
        "../../../mindspore/ccsrc/backend/kernel_compiler/hccl/*.cc"
--- a/tests/ut/cpp/kernel/cpu/adam_delta_cpu_kernel_test.cc
+++ b/tests/ut/cpp/kernel/cpu/adam_delta_cpu_kernel_test.cc
@ -0,0 +1,93 @@
+/**
+ * Copyright 2020 Huawei Technologies Co., Ltd
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ * http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include <vector>
+#include "common/common_test.h"
+#define private public
+#define protected public
+#include "backend/kernel_compiler/cpu/adam_delta_cpu_kernel.h"
+#undef private
+#undef protected
+
+namespace mindspore {
+namespace kernel {
+class AdamDeltaCpuKernelTest : public UT::Common {
+ public:
+  AdamDeltaCpuKernelTest() : adam_delta_(std::make_shared<AdamDeltaCPUKernel>()) {}
+
+  void SetUp() override {
+    delta_.clear();
+    m_.clear();
+    v_.clear();
+    grad_.clear();
+    inputs_.clear();
+    workspace_.clear();
+    outputs_.clear();
+  }
+
+  AddressPtr CreateKernelAddress(void *addr, size_t elem_num) {
+    auto kernel_addr = std::make_shared<Address>();
+    kernel_addr->addr = addr;
+    kernel_addr->size = elem_num * 4;
+    return kernel_addr;
+  }
+
+  void CreateAddress() {
+    inputs_.push_back(CreateKernelAddress(m_.data(), elem_num_));
+    inputs_.push_back(CreateKernelAddress(v_.data(), elem_num_));
+    inputs_.push_back(CreateKernelAddress(&beta1_power_, 1));
+    inputs_.push_back(CreateKernelAddress(&beta2_power_, 1));
+    inputs_.push_back(CreateKernelAddress(&lr_, 1));
+    inputs_.push_back(CreateKernelAddress(&beta1_, 1));
+    inputs_.push_back(CreateKernelAddress(&beta2_, 1));
+    inputs_.push_back(CreateKernelAddress(&epsilon_, 1));
+    inputs_.push_back(CreateKernelAddress(grad_.data(), elem_num_));
+    outputs_.push_back(CreateKernelAddress(delta_.data(), elem_num_));
+  }
+
+  std::vector<float> delta_;
+  std::vector<float> m_;
+  std::vector<float> v_;
+  std::vector<float> grad_;
+  std::vector<AddressPtr> inputs_;
+  std::vector<AddressPtr> workspace_;
+  std::vector<AddressPtr> outputs_;
+  std::shared_ptr<AdamDeltaCPUKernel> adam_delta_;
+  float beta1_power_ = 0.9;
+  float beta2_power_ = 0.999;
+  float lr_ = 0.001;
+  float beta1_ = 0.9;
+  float beta2_ = 0.999;
+  float epsilon_ = 1e-8;
+  size_t elem_num_ = 27;
+};
+
+TEST_F(AdamDeltaCpuKernelTest, compute_test) {
+  for (size_t i = 0; i < elem_num_; ++i) {
+    delta_.push_back(1.0);
+    m_.push_back(1.0);
+    v_.push_back(1.0);
+    grad_.push_back(1.0);
+  }
+  adam_delta_->elem_num_ = elem_num_;
+  CreateAddress();
+  adam_delta_->Launch(inputs_, workspace_, outputs_);
+  for (size_t i = 0; i < elem_num_; ++i) {
+    EXPECT_TRUE(std::fabs(delta_[i] + 0.000316) < 1e-6);
+  }
+}
+}  // namespace kernel
+}  // namespace mindspore