!49816 AICPU SequenceAddN

Merge pull request !49816 from VectorSL/add-sequence-addn-aicpu
2023-03-08 07:57:50 +00:00 · 2023-03-08 07:57:50 +00:00 · 45068d436d
parent 5c287b6496 679cfdb85b
commit 45068d436d
8 changed files with 204 additions and 1 deletions
--- a/mindspore/ccsrc/plugin/device/ascend/kernel/aicpu/aicpu_ops/CMakeLists.txt
+++ b/mindspore/ccsrc/plugin/device/ascend/kernel/aicpu/aicpu_ops/CMakeLists.txt
@ -45,6 +45,7 @@ if(EXISTS ${CMAKE_C_COMPILER} AND EXISTS ${CMAKE_CXX_COMPILER})
        ${CMAKE_CURRENT_SOURCE_DIR}/concat_offset_kernel.cc
        ${CMAKE_CURRENT_SOURCE_DIR}/drop_out_gen_mask_kernels.cc
        ${CMAKE_CURRENT_SOURCE_DIR}/sequence_add.cc
+        ${CMAKE_CURRENT_SOURCE_DIR}/sequence_addn.cc
        ${CMAKE_CURRENT_SOURCE_DIR}/sequence_add_offset.cc
        ${CMAKE_CURRENT_SOURCE_DIR}/slice_grad_kernel.cc
        ${CMAKE_CURRENT_SOURCE_DIR}/random_shuffle_kernel.cc
--- a/mindspore/ccsrc/plugin/device/ascend/kernel/aicpu/aicpu_ops/sequence_addn.cc
+++ b/mindspore/ccsrc/plugin/device/ascend/kernel/aicpu/aicpu_ops/sequence_addn.cc
@ -0,0 +1,117 @@
+/**
+ * Copyright 2023 Huawei Technologies Co., Ltd
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ * http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#include "plugin/device/ascend/kernel/aicpu/aicpu_ops/sequence_addn.h"
+#include <string>
+#include <thread>
+#include <complex>
+#include "proto/aicpu_tensor.pb.h"
+#include "common/atomic_op.h"
+#include "utils/eigen_tensor.h"
+#include "aicpu_sharder/aicpu_sharder.h"
+
+namespace aicpu {
+namespace {
+std::vector<int64_t> GetShape(const ::aicpuops::TensorShape &shape) {
+  std::vector<int64_t> res;
+  for (int i = 0; i < shape.dim_size(); ++i) {
+    res.push_back(shape.dim(i).size());
+  }
+  return res;
+}
+}  // namespace
+constexpr size_t kSequenceAddNInputNum = 1;
+constexpr size_t kSequenceAddNOutputNum = 1;
+constexpr auto kDim0 = 0;
+constexpr auto kDim1 = 1;
+
+uint32_t SequenceAddNKernel::ParseKernelParam() {
+  if (node_def_.inputs_size() != kSequenceAddNInputNum) {
+    AICPU_LOGE("For 'SequenceAddN', input number must be 1, but got %d", node_def_.inputs_size());
+    return kAicpuKernelStateInvalid;
+  }
+
+  if (node_def_.outputs_size() != kSequenceAddNOutputNum) {
+    AICPU_LOGE("For 'SequenceAddN', output number must be 1, but got %d", node_def_.outputs_size());
+    return kAicpuKernelStateInvalid;
+  }
+  aicpuops::Tensor input_tensor = node_def_.inputs(0);
+  input_data_type_ = static_cast<aicpuops::DataType>(input_tensor.tensor_type());
+  auto input_shape = GetShape(input_tensor.tensor_shape());
+  input_shapes_.push_back(input_shape);
+  input_data_size_ = GetTensorMemSizeByShape(node_def_.inputs(kDim0));
+  output_data_size_ = GetTensorMemSizeByShape(node_def_.outputs(kDim0));
+  return kAicpuKernelStateSucess;
+}
+
+template <typename T>
+uint32_t SequenceAddNKernel::SequenceAddNTask() {
+  const auto inputs_addr = reinterpret_cast<T *>(io_addrs_[kDim0]);
+  auto output_addr = reinterpret_cast<T *>(io_addrs_[kDim1]);
+  auto element_num = LongToSize(input_shapes_[0][0]);
+  auto element_size = output_data_size_ / sizeof(T);
+  auto cp_ret = memset_s(output_addr, output_data_size_, 0x0, output_data_size_);
+  if (cp_ret != EOK) {
+    AICPU_LOGE("For 'SequenceAddN',  memset for output error, errorno: %d, size: %d.", cp_ret, output_data_size_);
+    return kAicpuKernelStateInvalid;
+  }
+  auto input_x_addr = inputs_addr;
+  auto sequence_add_n = [this, &output_addr, &input_x_addr](size_t start, size_t end) {
+    for (size_t id = start; id < end; id++) {
+      AtomicAdd<T>(output_addr + id, input_x_addr[id]);
+    }
+  };
+  const int64_t per_unit_size = element_size / std::thread::hardware_concurrency();
+  for (size_t i = 0; i < element_num; i++) {
+    input_x_addr = inputs_addr + i * element_size;
+    ParallelFor(element_size, per_unit_size, sequence_add_n);
+  }
+
+  return kAicpuKernelStateSucess;
+}
+
+uint32_t SequenceAddNKernel::DoCompute() {
+  switch (input_data_type_) {
+    case aicpuops::DataType::MS_INT32:
+      return SequenceAddNTask<int>();
+    case aicpuops::DataType::MS_INT64:
+      return SequenceAddNTask<int64_t>();
+    case aicpuops::DataType::MS_FLOAT32:
+      return SequenceAddNTask<float>();
+    case aicpuops::DataType::MS_FLOAT64:
+      return SequenceAddNTask<double>();
+    case aicpuops::DataType::MS_UINT32:
+      return SequenceAddNTask<uint32_t>();
+    case aicpuops::DataType::MS_UINT64:
+      return SequenceAddNTask<uint64_t>();
+    case aicpuops::DataType::MS_FLOAT16:
+      return SequenceAddNTask<Eigen::half>();
+    case aicpuops::DataType::MS_COMPLEX64:
+      return SequenceAddNTask<std::complex<std::float_t>>();
+    case aicpuops::DataType::MS_COMPLEX128:
+      return SequenceAddNTask<std::complex<std::double_t>>();
+    default:
+      AICPU_LOGE("SequenceAddN kernel data type [%s] not support.", input_data_type_);
+      return kAicpuKernelStateInvalid;
+  }
+}
+}  // namespace aicpu
+
+extern "C" {
+__attribute__((visibility("default"))) uint32_t SequenceAddN(void *param) {
+  aicpu::SequenceAddNKernel sequence_addn_kernel;
+  return sequence_addn_kernel.Compute(param);
+}
+}
--- a/mindspore/ccsrc/plugin/device/ascend/kernel/aicpu/aicpu_ops/sequence_addn.h
+++ b/mindspore/ccsrc/plugin/device/ascend/kernel/aicpu/aicpu_ops/sequence_addn.h
@ -0,0 +1,41 @@
+/**
+ * Copyright 2023 Huawei Technologies Co., Ltd
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ * http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#ifndef AICPU_OPS_SEQUENCE_ADDN_KERNEL_H_
+#define AICPU_OPS_SEQUENCE_ADDN_KERNEL_H_
+
+#include <vector>
+#include <random>
+#include "common/kernel_base.h"
+
+namespace aicpu {
+class SequenceAddNKernel : public KernelBase {
+ public:
+  SequenceAddNKernel() : KernelBase("SequenceAddN") {}
+  ~SequenceAddNKernel() = default;
+
+ protected:
+  uint32_t ParseKernelParam() override;
+  uint32_t DoCompute() override;
+  template <typename T>
+  uint32_t SequenceAddNTask();
+
+  aicpuops::DataType input_data_type_{aicpuops::DataType::MS_UNKNOWN};
+  size_t input_data_size_{0};
+  size_t output_data_size_{0};
+  std::vector<std::vector<int64_t>> input_shapes_;
+};
+}  // namespace aicpu
+#endif  // AICPU_OPS_SEQUENCE_ADDN_KERNEL_H_
--- a/mindspore/ccsrc/plugin/device/ascend/kernel/aicpu/aicpu_util.h
+++ b/mindspore/ccsrc/plugin/device/ascend/kernel/aicpu/aicpu_util.h
@ -107,6 +107,7 @@ constexpr auto kKLDivLoss = "KLDivLoss";
 constexpr auto kKLDivLossGrad = "KLDivLossGrad";
 constexpr auto kSampleDistortedBoundingBoxV2 = "SampleDistortedBoundingBoxV2";
 constexpr auto kSequenceAdd = "SequenceAdd";
+constexpr auto kSequenceAddN = "SequenceAddN";
 constexpr auto kSequenceAddOffset = "SequenceAddOffset";
 constexpr auto kSparseToDenseV2 = "SparseToDenseV2";
 constexpr auto kSparseSoftmaxCrossEntropyWithLogitsV2 = "SparseSoftmaxCrossEntropyWithLogitsV2";
@ -297,6 +298,7 @@ const std::set<std::string> kCpuKernelBaseOps{kDropoutGenMaskOpName,
                                              kGatherDGradV2,
                                              kConcatOffset,
                                              kSequenceAdd,
+                                              kSequenceAddN,
                                              kSequenceAddOffset,
                                              kSliceGrad,
                                              kRandomShuffle,
--- a/mindspore/ccsrc/plugin/device/ascend/optimizer/mindir/aicpu_lib_select.cc
+++ b/mindspore/ccsrc/plugin/device/ascend/optimizer/mindir/aicpu_lib_select.cc
@ -1,5 +1,5 @@
 /**
- * Copyright 2022 Huawei Technologies Co., Ltd
+ * Copyright 2022-2023 Huawei Technologies Co., Ltd
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
@ -42,6 +42,7 @@ bool AICpuLibSelectPass::Process(const AnfNodePtr &node) const {
                                                      kGatherDGradV2OpName,
                                                      kConcatOffsetOpName,
                                                      kSequenceAddOpName,
+                                                      kSequenceAddNOpName,
                                                      kSequenceAddOffsetOpName,
                                                      kSliceGradOpName,
                                                      kRandomShuffleOpName,
--- a/mindspore/python/mindspore/ops/_op_impl/aicpu/init.py
+++ b/mindspore/python/mindspore/ops/_op_impl/aicpu/init.py
@ -423,3 +423,4 @@ from .sparse_to_dense_v2 import _sparse_to_dense_v2_aicpu
 from .bernoulli import _bernoulli_aicpu
 from .glu_grad import _glu_grad_aicpu
 from .sspaddmm import _sspaddmm_aicpu
+from .sequence_addn import _sequence_addn_aicpu
--- a/mindspore/python/mindspore/ops/_op_impl/aicpu/sequence_addn.py
+++ b/mindspore/python/mindspore/ops/_op_impl/aicpu/sequence_addn.py
@ -0,0 +1,38 @@
+# Copyright 2023 Huawei Technologies Co., Ltd
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# ============================================================================
+
+"""SequenceAddN op"""
+from mindspore.ops.op_info_register import op_info_register, AiCPURegOp, DataType
+
+sequence_addn_op_info = AiCPURegOp("SequenceAddN") \
+    .fusion_type("OPAQUE") \
+    .input(0, "input_0", "required") \
+    .output(0, "output_data", "required") \
+    .dtype_format(DataType.U32_Default_Tuple, DataType.U32_Default) \
+    .dtype_format(DataType.U64_Default_Tuple, DataType.U64_Default) \
+    .dtype_format(DataType.I64_Default_Tuple, DataType.I64_Default) \
+    .dtype_format(DataType.I32_Default_Tuple, DataType.I32_Default) \
+    .dtype_format(DataType.F64_Default_Tuple, DataType.F64_Default) \
+    .dtype_format(DataType.F32_Default_Tuple, DataType.F32_Default) \
+    .dtype_format(DataType.F16_Default_Tuple, DataType.F16_Default) \
+    .dtype_format(DataType.C64_Default_Tuple, DataType.C64_Default) \
+    .dtype_format(DataType.C128_Default_Tuple, DataType.C128_Default) \
+    .get_op_info()
+
+
+@op_info_register(sequence_addn_op_info)
+def _sequence_addn_aicpu():
+    """SequenceAddN AiCPU register"""
+    return
--- a/mindspore/python/mindspore/ops/op_info_register.py
+++ b/mindspore/python/mindspore/ops/op_info_register.py
@ -1331,3 +1331,5 @@ class DataType:

    C64_Default = ("complex64", "DefaultFormat")
    C128_Default = ("complex128", "DefaultFormat")
+    C64_Default_Tuple = ("complex64", "DefaultFormat", "tuple")
+    C128_Default_Tuple = ("complex128", "DefaultFormat", "tuple")