!12844 Add float64 support to Absgrad and SqrtGrad

From: @peilin-wang Reviewed-by: @tom__chen,@robingrosman Signed-off-by: @robingrosman
2021-03-05 02:38:58 +08:00 · 2021-03-05 02:38:58 +08:00 · 504f45566b
parent 7104e42304 a0645c41fe
commit 504f45566b
4 changed files with 27 additions and 1 deletions
--- a/mindspore/ccsrc/backend/kernel_compiler/gpu/cuda_impl/unary_op_grad_impl.cu
+++ b/mindspore/ccsrc/backend/kernel_compiler/gpu/cuda_impl/unary_op_grad_impl.cu
@ -170,6 +170,23 @@ void ReciprocalGrad(const T *input, const T *dout, T *output, const size_t count
  return;
 }
 template void SqrtGrad<double>(const double *input, const double *dout, double *output, const size_t count,
                               cudaStream_t cuda_stream);
 template void RsqrtGrad<double>(const double *input, const double *dout, double *output, const size_t count,
                                cudaStream_t cuda_stream);
 template void AsinGrad<double>(const double *input, const double *dout, double *output, const size_t count,
                               cudaStream_t cuda_stream);
 template void ACosGrad<double>(const double *input, const double *dout, double *output, const size_t count,
                               cudaStream_t cuda_stream);
 template void AtanGrad<double>(const double *input, const double *dout, double *output, const size_t count,
                               cudaStream_t cuda_stream);
 template void AsinhGrad<double>(const double *input, const double *dout, double *output, const size_t count,
                                cudaStream_t cuda_stream);
 template void AcoshGrad<double>(const double *input, const double *dout, double *output, const size_t count,
                                cudaStream_t cuda_stream);
 template void ReciprocalGrad<double>(const double *input, const double *dout, double *output, const size_t count,
                                     cudaStream_t cuda_stream);
 template void SqrtGrad<float>(const float *input, const float *dout, float *output, const size_t count,
                              cudaStream_t cuda_stream);
 template void RsqrtGrad<float>(const float *input, const float *dout, float *output, const size_t count,
--- a/mindspore/ccsrc/backend/kernel_compiler/gpu/math/broadcast_gpu_kernel.cc
+++ b/mindspore/ccsrc/backend/kernel_compiler/gpu/math/broadcast_gpu_kernel.cc
@ -31,6 +31,10 @@ MS_REG_GPU_KERNEL_ONE(
 MS_REG_GPU_KERNEL_ONE(
  Div, KernelAttr().AddInputAttr(kNumberTypeFloat64).AddInputAttr(kNumberTypeFloat64).AddOutputAttr(kNumberTypeFloat64),
  BroadcastOpGpuKernel, double)
 MS_REG_GPU_KERNEL_ONE(
  AbsGrad,
  KernelAttr().AddInputAttr(kNumberTypeFloat64).AddInputAttr(kNumberTypeFloat64).AddOutputAttr(kNumberTypeFloat64),
  BroadcastOpGpuKernel, double)
 // fp32
 MS_REG_GPU_KERNEL_ONE(
--- a/mindspore/ccsrc/backend/kernel_compiler/gpu/math/unary_op_grad_gpu_kernel.cc
+++ b/mindspore/ccsrc/backend/kernel_compiler/gpu/math/unary_op_grad_gpu_kernel.cc
@ -18,6 +18,10 @@
 namespace mindspore {
 namespace kernel {
 MS_REG_GPU_KERNEL_ONE(
  SqrtGrad,
  KernelAttr().AddInputAttr(kNumberTypeFloat64).AddInputAttr(kNumberTypeFloat64).AddOutputAttr(kNumberTypeFloat64),
  UnaryGradOpGpuKernel, double)
 MS_REG_GPU_KERNEL_ONE(
  SqrtGrad,
  KernelAttr().AddInputAttr(kNumberTypeFloat32).AddInputAttr(kNumberTypeFloat32).AddOutputAttr(kNumberTypeFloat32),
--- a/mindspore/ops/operations/_grad_ops.py
+++ b/mindspore/ops/operations/_grad_ops.py
@ -183,7 +183,8 @@ class SqrtGrad(PrimitiveWithInfer):
    def infer_dtype(self, x_dtype, dout_dtype):
        args = {"x": x_dtype, "dout": dout_dtype}
-        validator.check_tensors_dtypes_same_and_valid(args, [mstype.float16, mstype.float32], self.name)
+        valid_types = [mstype.float16, mstype.float32, mstype.float64]
        validator.check_tensors_dtypes_same_and_valid(args, valid_types, self.name)
        return x_dtype