update api cn

This commit is contained in:
yingchen 2021-11-23 14:23:43 +08:00
parent 821aba8907
commit 6f7a104e7c
4 changed files with 200 additions and 65 deletions

View File

@ -17,45 +17,43 @@
- **name** (str)参数的名称。默认值None。
- **requires_grad** (bool)是否需要微分求梯度。默认值True。
- **layerwise_parallel** (bool):在数据/混合并行模式下, `layerwise_parallel` 配置为True时参数广播和梯度聚合时会过滤掉该参数。默认值False。
- **parallel_optimizer** (bool):用于在"semi_auto_parallel"或"auto_parallel"并行模式下区分参数是否进行优化器切分。仅在 `mindspore.context.set_auto_parallel_context()` 并行配置模块中设置 `enable_parallel_optimizer` 启用优化器并行时有效。默认值True。
- **parallel_optimizer** (bool):用于在 `semi_auto_parallel``auto_parallel` 并行模式下区分参数是否进行优化器切分。仅在 `mindspore.context.set_auto_parallel_context()` 并行配置模块中设置 `enable_parallel_optimizer` 启用优化器并行时有效。默认值True。
**样例:**
.. code-block::
>>> import numpy as np
>>> from mindspore import Parameter, Tensor
>>> import mindspore.ops as ops
>>> import mindspore.nn as nn
>>> import mindspore
>>>
>>> class Net(nn.Cell)
... def __init__(self)
... super(Net, self).__init__()
... self.matmul = ops.MatMul()
... self.weight = Parameter(Tensor(np.ones((1, 2)), mindspore.float32), name="w", requires_grad=True)
...
... def construct(self, x)
... out = self.matmul(self.weight, x)
... return out
>>> net = Net()
>>> x = Tensor(np.ones((2, 1)), mindspore.float32)
>>> print(net(x))
[[2.]]
>>> net.weight.set_data(Tensor(np.zeros((1, 2)), mindspore.float32))
>>> print(net(x))
[[0.]]
>>> import numpy as np
>>> from mindspore import Parameter, Tensor
>>> import mindspore.ops as ops
>>> import mindspore.nn as nn
>>> import mindspore
>>>
>>> class Net(nn.Cell)
... def __init__(self)
... super(Net, self).__init__()
... self.matmul = ops.MatMul()
... self.weight = Parameter(Tensor(np.ones((1, 2)), mindspore.float32), name="w", requires_grad=True)
...
... def construct(self, x)
... out = self.matmul(self.weight, x)
... return out
>>> net = Net()
>>> x = Tensor(np.ones((2, 1)), mindspore.float32)
>>> print(net(x))
[[2.]]
>>> net.weight.set_data(Tensor(np.zeros((1, 2)), mindspore.float32))
>>> print(net(x))
[[0.]]
.. py:method:: cache_enable
:property:
返回该参数是否开启缓存功能。
表示该参数是否开启缓存功能。
.. py:method:: cache_shape
:property:
如果开启缓存,则返回对应参数的缓存形状
如果使用缓存则返回对应参数的缓存shape
.. py:method:: clone(init='same')
@ -63,20 +61,19 @@
**参数:**
- **init** (Union[Tensor, str, numbers.Number]):初始化参数的形状和数据类型。如果 `init``Tensor``numbers.Number` ,则克隆一个具有相同数值、形状和数据类型的新参数。 如果 `init``str` ,则 `init` 将继承 `Initializer` 模块中对应的同名的类。例如,如果 `init` 是'same',则克隆一个具有相同数据、形状和数据类型的新参数。默认值:'same'。
**init** (Union[Tensor, str, numbers.Number]):初始化参数的形状和数据类型。如果 `init``Tensor``numbers.Number` ,则克隆一个具有相同数值、形状和数据类型的新参数。 如果 `init``str` ,则 `init` 将继承 `Initializer` 模块中对应的同名的类。例如,如果 `init` 是'same',则克隆一个具有相同数据、形状和数据类型的新参数。默认值:'same'。
**返回:**
`Parameter` ,返回克隆的新参数。
`Parameter` ,返回克隆的新参数。
.. py:method:: comm_fusion
:property:
获取和设置与此参数对应的通信算子的融合类型int
获取此参数的通信算子的融合类型int
在"auto_parallel"和"semi_auto_parallel"模式下,一些用于参数或梯度聚合的通信算子将自动插入,此属性表示当前参数对应通信算子的融合类型。 `comm_fusion` 的值必须大于等于0。当 `comm_fusion` 的值为0时算子不融合。
仅在Ascend环境的图模式下使用。
`AUTO_PARALLEL``SEMI_AUTO_PARALLEL` 模式下一些用于参数或梯度聚合的通信算子将自动插入。fusion的值必须大于等于0。当fusion的值为0时算子不会融合在一起。
.. py:method:: data
@ -90,27 +87,28 @@
**参数:**
- **layout** (Union[None, tuple(list(int))]):参数切片。
- **layout** [dev_mat, tensor_map, slice_shape]默认值None。
- **layout** (Union[None, tuple])参数的layout信息。layout[dev_mat, tensor_map, slice_shape, filed_size, uniform_split, opt_shard_group]默认值None。仅在 `SEMI_AUTO_PARALLEL``AUTO_PARALLEL` 模式下layout不是None。
- **dev_mat** (list(int)):设备矩阵。
- **tensor_map** (list(int)):张量映射。
- **slice_shape** (list(int)):切片形状。
- **dev_mat** (list(int)):该参数的设备矩阵。
- **tensor_map** (list(int)):该参数的张量映射。
- **slice_shape** (list(int))该参数的切片shape。
- **filed_size** (int):该权重的行数。
- **uniform_split** (bool):该参数是否进行均匀切分。
- **opt_shard_group** (str)该参数进行优化器切分时的group。
- **set_sliced** (bool)参数初始化时被设定为分片则为True。默认值False。
- **set_sliced** (bool)参数初始化时被设定为分片则为True。默认值False。
**异常:**
**RuntimeError** 参数使用 `Initializer` 模块进行初始化,初始化后并行模式发生更改。
- **RuntimeError** 参数使用 `Initializer` 模块进行初始化,初始化后并行模式发生更改。
**ValueError** `layout` 长度小于3
**TypeError** `layout` 不是元组。
- **ValueError** `layout` 长度小于6
- **TypeError** `layout` 不是元组。
**返回:**
初始化数据后的 `Parameter` 。如果当前 `Parameter` 已初始化,则更新 `Parameter` 数据。
初始化数据后的 `Parameter` 。如果当前 `Parameter` 已初始化,则更新 `Parameter` 数据。
.. py:method:: is_init
@ -124,7 +122,9 @@
.. py:method:: layerwise_parallel
:property:
在"data_parallel"或"hybrid_parallel"并行模式下,如果"layerwise_parallel"为True参数广播和梯度聚合将不会应用到参数。
获取此参数的逐层并行状态bool
`DATA_PARALLEL``HYBRID_PARALLEL` 模式下,如果 `layerwise_parallel` 为True则广播和gradients通信将不会应用到参数。
.. py:method:: name
@ -135,21 +135,21 @@
.. py:method:: parallel_optimizer
:property:
用于在"semi_auto_parallel"或"auto_parallel"并行模式下区分参数是否进行优化器切分。仅在 `mindspore.context.set_auto_parallel_context()` 并行配置模块中设置 `enable_parallel_optimizer` 启用优化器并行时有效。默认值True。
获取此参数的优化器并行状态bool
用于在 `AUTO_PARALLEL``SEMI_AUTO_PARALLEL` 模式下过滤权重切分操作。当在 `mindspore.context.set_auto_parallel_context()` 中启用优化器并行时,它才有效。
.. py:method:: parallel_optimizer_comm_recompute
:property:
在优化器并行场景下,是否重新计算与此参数对应的通信算子
获取此参数的优化器并行通信重计算状态bool
"auto_parallel"和"semi_auto_parallel"模式下使用优化器并行时,若参数被切分分布在不同卡上,框架会自动插入 :class:`mindspore.ops.AllGather` 通信算子用于参数汇聚。该接口用于控制 :class:`mindspore.ops.AllGather` 算子的二次计算属性。
`AUTO_PARALLEL``SEMI_AUTO_PARALLEL` 模式下,当使用并行优化器时,会自动插入一些 :class:`mindspore.ops.AllGather` 算子,用于参数聚合。它用于控制这些 :class:`mindspore.ops.AllGather` 算子的重计算属性。
.. note::
仅支持Ascend下的Graph模式。
优化器并行场景下生成的 :class:`mindspore.ops.AllGather` 算子,建议使用 `cell.recompute(parallel_optimizer_comm_recompute=True/False)` 接口配置,不推荐直接使用本接口。
- 仅支持 `Graph` 模式。
- 建议使用(cell.recompute(parallel_optimizer_comm_recompute=True/False)去配置由优化器并行生成的 :class:`mindspore.ops.AllGather` 算子,而不是直接使用该接口。
.. py:method:: requires_grad
@ -163,42 +163,40 @@
**参数:**
- **data** (Union[Tensor, int, float]):新数据。
- **slice_shape** (bool):如果`slice_shape`设为True则不检查 `data` 和当前参数shape的一致性。默认值False。
- **data** (Union[Tensor, int, float]):新数据。
- **slice_shape** (bool):如果 `slice_shape` 设为True则不检查 `data` 和当前参数shape的一致性。默认值False。
**返回:**
完成数据设置的新参数。
完成数据设置的新参数。
.. py:method:: set_param_fl(push_to_server=False, pull_from_server=False, requires_aggr=True)
设置参数和服务器的互方式。
设置参数和服务器的互方式。
**参数:**
- **push_to_server** (bool)表示是否将参数推送到服务器。默认值False。
- **pull_from_server** (bool)表示是否应从服务器中拉取参数。默认值False。
- **requires_aggr** (bool)表示是否应在服务器中聚合参数。默认值True。
- **push_to_server** (bool)表示是否将参数推送到服务器。默认值False。
- **pull_from_server** (bool)表示是否应从服务器中拉取参数。默认值False。
- **requires_aggr** (bool)表示是否应在服务器中聚合参数。默认值True。
.. py:method:: set_param_ps(init_in_server=False)
在Parameter Server模式下表示训练参数是否在Server端初始化以及是否由Server更新
表示可训练参数是否由参数服务器更新,以及可训练参数是否在服务器上初始化
.. note::在Parameter Server模式下有效。
.. note::当运行的任务处于参数服务器模式下有效。
**参数:**
- **init_in_server** (bool)表示训练参数初始化位置是否为Server端以及是否通过Server进行更新。默认值False。
**init_in_server** (bool)表示参数服务器更新的可训练参数是否在服务器上初始化。默认值False。
.. py:method:: sliced
:property:
获取参数的切片状态。
.. py:method:: unique
:property:

View File

@ -0,0 +1,20 @@
mindspore.build_searched_strategy
==================================
.. py:method:: mindspore.build_searched_strategy(strategy_filename)
构建网络中每个参数的策略,用于分布式推理。关于它的使用细节,请参考:`保存和加载模型HyBrid Parallel模式 <https://www.mindspore.cn/docs/programming_guide/zh-CN/master/save_load_model_hybrid_parallel.html>`_
**参数:**
**strategy_filename** (str):策略文件的名称。
**返回:**
Dictkey为参数名value为该参数的切片策略。
**异常:**
- **ValueError** 策略文件不正确。
- **TypeError** `strategy_filename` 不是str。

View File

@ -0,0 +1,40 @@
mindspore.merge_sliced_parameter
=================================
.. py:method:: mindspore.merge_sliced_parameter(sliced_parameters, strategy=None)
将参数切片合并为一个完整的参数,用于分布式推理。关于它的细节,请参考:`保存和加载模型HyBrid Parallel模式 <https://www.mindspore.cn/docs/programming_guide/zh-CN/master/save_load_model_hybrid_parallel.html>`_
**参数:**
- **sliced_parameters** (list[Parameter])参数切片按rank id进行排列。
- **strategy** (Optional[dict])参数切片策略key为参数名称value为该参数的切片策略。如果strategy为None则只需按0轴顺序合并参数切片。默认值None。
**返回:**
合并后的参数,包含所有数据。
**异常:**
- **ValueError** 合并失败。
- **TypeError** `sliced_parameters` 不正确或strategy不是dict。
- **KeyError** 参数名称不在策略的key中。
**样例:**
>>> import numpy as np
>>> from mindspore import Tensor, merge_sliced_parameter, Parameter
>>>
>>> sliced_parameters = [
... Parameter(Tensor(np.array([0.00023915, 0.00013939, -0.00098059])),
... "network.embedding_table"),
... Parameter(Tensor(np.array([0.00015815, 0.00015458, -0.00012125])),
... "network.embedding_table"),
... Parameter(Tensor(np.array([0.00042165, 0.00029692, -0.00007941])),
... "network.embedding_table"),
... Parameter(Tensor(np.array([0.00084451, 0.00089960, -0.00010431])),
... "network.embedding_table")]
>>> merged_parameter = merge_sliced_parameter(sliced_parameters)
>>> print(merged_parameter)
Parameter (name=network.embedding_table, shape=(12,), dtype=Float64, requires_grad=True)

View File

@ -0,0 +1,77 @@
mindspore.Model
================
.. py:method:: infer_predict_layout(*predict_data)
`AUTO_PARALLEL``SEMI_AUTO_PARALLEL` 模式下为预测网络生成参数layout数据可以是单个或多个张量。
.. note:: 同一批次数据应放在一个张量中。
**参数**
**predict_data** (`Tensor`) 单个或多个张量的预测数据。
**返回**
Dict用于加载分布式checkpoint的参数layout字典。它总是作为 `load_distributed_checkpoint()` 函数的一个入参。
**异常** :
**RuntimeError** 如果不是图模式GRAPH_MODE
**样例:**
>>> # 该例子需要在多设备上运行。请参考mindpore.cn上的教程 > 分布式训练。
>>> import numpy as np
>>> import mindspore as ms
>>> from mindspore import Model, context, Tensor
>>> from mindspore.context import ParallelMode
>>> from mindspore.communication import init
>>>
>>> context.set_context(mode=context.GRAPH_MODE)
>>> init()
>>> context.set_auto_parallel_context(full_batch=True, parallel_mode=ParallelMode.SEMI_AUTO_PARALLEL)
>>> input_data = Tensor(np.random.randint(0, 255, [1, 1, 32, 32]), ms.float32)
>>> model = Model(Net())
>>> model.infer_predict_layout(input_data)
.. py:method:: infer_train_layout(train_dataset, dataset_sink_mode=True, sink_size=-1)
`AUTO_PARALLEL``SEMI_AUTO_PARALLEL` 模式下为训练网络生成参数layout当前只有数据下沉模式可支持使用。
.. warning:: 这是一个实验性的原型,可能会被改变和/或删除。
.. note:: 这是一个预编译函数。参数必须与model.train()函数相同。
**参数**
- **train_dataset** (`Dataset`) 一个训练数据集迭代器。如果没有损失函数loss_fn返回一个包含多个数据的元组data1, data2, data3, ...并传递给网络。否则返回一个元组data, label数据和标签将被分别传递给网络和损失函数。
- **dataset_sink_mode** (`bool`) 决定是否以数据集下沉模式进行训练。默认值True。配置项是PyNative模式或CPU时训练模型流程使用的是数据不下沉non-sink模式。默认值True。
- **sink_size** (`int`) 控制每次数据下沉的数据量,如果 `sink_size` =-1则每一次epoch下沉完整数据集。如果 `sink_size` >0则每一次epoch下沉数据量为 `sink_size` 的数据集。如果 `dataset_sink_mode` 为False则设置 `sink_size` 为无效。默认值:-1。
**返回**
Dict用于加载分布式checkpoint的参数layout字典。
**样例:**
>>> # 该例子需要在多设备上运行。请参考mindpore.cn上的教程 > 分布式训练。
>>> import numpy as np
>>> import mindspore as ms
>>> from mindspore import Model, context, Tensor, nn, FixedLossScaleManager
>>> from mindspore.context import ParallelMode
>>> from mindspore.communication import init
>>>
>>> context.set_context(mode=context.GRAPH_MODE)
>>> init()
>>> context.set_auto_parallel_context(parallel_mode=ParallelMode.SEMI_AUTO_PARALLEL)
>>>
>>> # 如何构建数据集,请参考官方网站上关于【数据集】的章节。
>>> dataset = create_custom_dataset()
>>> net = Net()
>>> loss = nn.SoftmaxCrossEntropyWithLogits()
>>> loss_scale_manager = FixedLossScaleManager()
>>> optim = nn.Momentum(params=net.trainable_params(), learning_rate=0.1, momentum=0.9)
>>> model = Model(net, loss_fn=loss, optimizer=optim, metrics=None, loss_scale_manager=loss_scale_manager)
>>> layout_dict = model.infer_train_layout(dataset)