diff --git a/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomResizeWithBBox.rst b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomResizeWithBBox.rst new file mode 100644 index 00000000000..f73d1c87929 --- /dev/null +++ b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomResizeWithBBox.rst @@ -0,0 +1,10 @@ +mindspore.dataset.vision.c_transforms.RandomResizeWithBBox +========================================================== + +.. py:class:: mindspore.dataset.vision.c_transforms.RandomResizeWithBBox(size) + + 使用随机选择的插值模式来调整输入图像的大小,并相应地调整边界框的大小。 + + **参数:** + + - **size** (Union[int, sequence]) - 调整后图像的输出大小。如果 `size` 是一个整数,图像的短边将被调整为`size`大小,并依据短边的调整比例相应调整图像长边的大小。如果 `size` 是一个长度为2的序列,其输入格式应该为 (height, width)。 diff --git a/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomResizedCrop.rst b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomResizedCrop.rst new file mode 100644 index 00000000000..b42588c0916 --- /dev/null +++ b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomResizedCrop.rst @@ -0,0 +1,23 @@ +mindspore.dataset.vision.c_transforms.RandomResizedCrop +======================================================= + +.. py:class:: mindspore.dataset.vision.c_transforms.RandomResizedCrop(size, scale=(0.08, 1.0), ratio=(3. / 4., 4. / 3.), interpolation=Inter.BILINEAR, max_attempts=10) + + 对输入图像进行随机裁剪,并使用指定的插值模式调整裁剪后的图像为指定的大小。 + + .. note:: 如果输入图像不止一张,需要保证输入的多张图像大小一致。 + + **参数:** + + - **size** (Union[int, sequence]) - 图像的输出大小。 如果 `size` 是整数,则返回大小为 (size, size) 的正方形图像。 如果 `size` 是一个长度为2的序列,其输入格式应该为 (height, width)。 + - **scale** (list, tuple, optional) - 裁剪子图的大小相对原图比例的随机选取范围,需要在[min, max)区间,默认值:(0.08, 1.0)。 + - **ratio** (list, tuple, optional) - 裁剪子图的宽高比的随机选取范围,需要在[min, max)区间,默认值:(3./4., 4./3.)。 + - **interpolation** (Inter mode, optional) - 调整大小采用的的图像插值模式。它可以是 [Inter.BILINEAR, Inter.NEAREST, Inter.BICUBIC, Inter.PILCUBIC] 中的任何一个,默认值:Inter.BILINEAR。 + + - Inter.BILINEAR,双线性插值。 + - Inter.NEAREST,最近邻插值。 + - Inter.BICUBIC,双三次插值。 + - Inter.AREA,像素区域插值。 + - Inter.PILCUBIC,与 `pillow` 中实现的双三次插值效果一致,输入应为3通道格式。 + + - **max_attempts** (int, optional): 生成随机裁剪位置的最大尝试次数,超过该次数时将使用中心裁剪,默认值:10。 diff --git a/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomResizedCropWithBBox.rst b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomResizedCropWithBBox.rst new file mode 100644 index 00000000000..1d7e738b94c --- /dev/null +++ b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomResizedCropWithBBox.rst @@ -0,0 +1,19 @@ +mindspore.dataset.vision.c_transforms.RandomResizedCropWithBBox +================================================= + +.. py:class:: mindspore.dataset.vision.c_transforms.RandomResizedCropWithBBox(size, scale=(0.08, 1.0), ratio=(3. / 4., 4. / 3.), interpolation=Inter.BILINEAR, max_attempts=10) + + 对输入图像进行随机裁剪且随机调整纵横比,并将处理后的图像调整为指定的大小,并相应地调整边界框。 + + **参数:** + + - **size** (Union[int, sequence]) - 图像的输出大小。 如果 `size` 是整数,则返回大小为 (size, size) 的正方形图像。 如果 `size` 是一个长度为2的序列,其输入格式应该为 (height, width)。 + - **scale** (list, tuple, optional) - 裁剪子图的大小相对原图比例的随机选取范围,需要在[min, max)区间,默认值:(0.08, 1.0)。 + - **ratio** (list, tuple, optional) - 裁剪子图的宽高比的随机选取范围,需要在[min, max)区间,默认值:(3./4., 4./3.)。 + - **interpolation** (Inter, optional) - 调整大小采用的的图像插值模式。它可以是 [Inter.BILINEAR, Inter.NEAREST, Inter.BICUBIC] 中的任何一个,默认值:Inter.BILINEAR。 + + - Inter.BILINEAR,双线性插值。 + - Inter.NEAREST,最近邻插值。 + - Inter.BICUBIC,双三次插值。 + + - **max_attempts** (int, optional): 生成随机裁剪位置的最大尝试次数,超过该次数时将使用中心裁剪,默认值:10。 diff --git a/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomRotation.rst b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomRotation.rst new file mode 100644 index 00000000000..081b46b1080 --- /dev/null +++ b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomRotation.rst @@ -0,0 +1,19 @@ +mindspore.dataset.vision.c_transforms.RandomRotation +================================================= + +.. py:class:: mindspore.dataset.vision.c_transforms.RandomRotation(degrees, resample=Inter.NEAREST, expand=False, center=None, fill_value=0) + + 在指定的角度范围内,随机旋转输入图像。 + + **参数:** + + - **degrees** (Union[int, float, sequence]) - 旋转角度的随机选取范围。若输入单个数字,则从(-degrees, degrees)中随机生成旋转角度;若输入2元素序列,需按(min, max)顺序排列。 + - **resample** (Inter mode, optional) - 插值方式。 它可以是 [Inter.BILINEAR, Inter.NEAREST, Inter.BICUBIC] 中的任何一个,默认值:Inter.NEAREST。 + + - Inter.BILINEAR,双线性插值。 + - Inter.NEAREST,最近邻插值。 + - Inter.BICUBIC,双三次插值。 + + - **expand** (bool, optional) - 图像大小拓宽标志,若为True,将扩展图像大小使其足以容纳整个旋转图像;若为False或未指定,则保持输出图像与输入图像大小一致。请注意,扩展时将假设图像为中心旋转且未进行平移,默认值:False。 + - **center** (tuple, optional) - 可选的旋转中心,以图像左上角为原点,旋转中心的位置按照 (width, height) 格式指定。默认值:None,表示中心旋转。 + - **fill_value** (Union[int, tuple], optional) - 旋转图像之外区域的像素填充值。若输入3元素元组,将分别用于填充R、G、B通道;若输入整型,将以该值填充RGB通道。 `fill_value` 值必须在 [0, 255] 范围内,默认值:0。 diff --git a/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomSelectSubpolicy.rst b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomSelectSubpolicy.rst new file mode 100644 index 00000000000..7c1426e06ab --- /dev/null +++ b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomSelectSubpolicy.rst @@ -0,0 +1,10 @@ +mindspore.dataset.vision.c_transforms.RandomSelectSubpolicy +=========================================================== + +.. py:class:: mindspore.dataset.vision.c_transforms.RandomSelectSubpolicy(policy) + + 从策略列表中选择一个随机子策略以应用于输入图像。 + + **参数:** + + - **policy** (list(list(tuple(TensorOp, prob (float))))) - 可供选择的子策略列表。 子策略是一系列 (op, prob) 格式的元组组成的列表,其中 `op` 是针对 Tensor 的操作, `prob` 是应用此操作的概率, `prob` 值必须在 [0, 1] 范围内。 一旦选择了子策略,子策略中的每个操作都将根据其概率依次应用。 diff --git a/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomSharpness.rst b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomSharpness.rst new file mode 100644 index 00000000000..3d15e78a551 --- /dev/null +++ b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomSharpness.rst @@ -0,0 +1,16 @@ +mindspore.dataset.vision.c_transforms.RandomSharpness +===================================================== + +.. py:class:: mindspore.dataset.vision.c_transforms.RandomSharpness(degrees=(0.1, 1.9)) + + 在给定的范围随机内地调整输入图像的锐度。调节系数为0.0时将返回模糊图像;调节系数为1.0时将返回原始图像;调节系数为2.0时将返回锐化图像。 + + **参数:** + + - **degrees** (Union[list, tuple], optional) - 锐度调节系数的随机选取范围,按照(min, max)顺序排列。如果 min=max,那么它是一个单一的固定锐度调整操作,默认值:(0.1, 1.9)。 + + **异常:** + + - **TypeError** - 如果 `degree` 不是列表或元组。 + - **ValueError** - 如果 `degree` 为负数。 + - **ValueError** - 如果 `degree` 采用 (max, min) 格式而不是 (min, max)。 diff --git a/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomSolarize.rst b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomSolarize.rst new file mode 100644 index 00000000000..08c65cd128e --- /dev/null +++ b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomSolarize.rst @@ -0,0 +1,10 @@ +mindspore.dataset.vision.c_transforms.RandomSolarize +==================================================== + +.. py:class:: mindspore.dataset.vision.c_transforms.RandomSolarize(threshold=(0, 255)) + + 从给定阈值范围内随机选择一个子范围,并对像素值位于给定子范围内的像素,将其值设置为(255 - 原本像素值)。 + + **参数:** + + - **threshold** (tuple, optional) - 随机曝光的阈值范围,默认值:(0, 255)。`threshold` 输入格式应该为 (min, max),其中 `min` 和 `max` 是 (0, 255) 范围内的整数,并且 min <= max。 如果 min=max,则反转所有高于 min(或max) 的像素值。 diff --git a/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomVerticalFlip.rst b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomVerticalFlip.rst new file mode 100644 index 00000000000..86ccf7eb3cd --- /dev/null +++ b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomVerticalFlip.rst @@ -0,0 +1,16 @@ +mindspore.dataset.vision.c_transforms.RandomVerticalFlip +================================================= + +.. py:class:: mindspore.dataset.vision.c_transforms.RandomVerticalFlip(prob=0.5) + + 以给定的概率对输入图像在垂直方向进行随机翻转。 + + **参数:** + + - **prob** (float, optional) - 图像被翻转的概率,默认值:0.5。 + + **异常:** + + - **TypeError** - 如果 `prob` 不是float类型。 + - **ValueError** - 如果 `prob` 不在 [0, 1] 范围。 + - **RuntimeError** - 如果输入的Tensor不是 格式。 \ No newline at end of file diff --git a/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomVerticalFlipWithBBox.rst b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomVerticalFlipWithBBox.rst new file mode 100644 index 00000000000..54093fae155 --- /dev/null +++ b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.RandomVerticalFlipWithBBox.rst @@ -0,0 +1,16 @@ +mindspore.dataset.vision.c_transforms.RandomVerticalFlipWithBBox +================================================= + +.. py:class:: mindspore.dataset.vision.c_transforms.RandomVerticalFlipWithBBox(prob=0.5) + + 以给定的概率对输入图像和边界框在垂直方向进行随机翻转。 + + **参数:** + + - **prob** (float, optional) - 图像被翻转的概率,默认值:0.5。 + + **异常:** + + - **TypeError** - 如果 `prob` 不是float类型。 + - **ValueError** - 如果 `prob` 不在 [0, 1] 范围。 + - **RuntimeError** - 如果输入的Tensor不是 格式。 diff --git a/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.Rescale.rst b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.Rescale.rst new file mode 100644 index 00000000000..fa26c01f4cf --- /dev/null +++ b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.Rescale.rst @@ -0,0 +1,12 @@ +mindspore.dataset.vision.c_transforms.Rescale +================================================= + +.. py:class:: mindspore.dataset.vision.c_transforms.Rescale(rescale, shift) + + 基于给定的缩放和平移因子调整图像的大小。输出图像的大小为:output = image * rescale + shift。 + + **参数:** + + - **rescale** (float) - 缩放因子。 + - **shift** (float) - 平移因子。 + diff --git a/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.Resize.rst b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.Resize.rst new file mode 100644 index 00000000000..ac8a7ecf4d5 --- /dev/null +++ b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.Resize.rst @@ -0,0 +1,24 @@ +mindspore.dataset.vision.c_transforms.Resize +============================================ + +.. py:class:: mindspore.dataset.vision.c_transforms.Resize(size, interpolation=Inter.LINEAR) + + 使用给定的插值模式将输入图像调整为给定的大小。 + + **参数:** + + - **size** (Union[int, sequence]) - 图像的输出大小。如果 `size` 是整数,将调整图像的较短边长度为 `size`,且保持图像的宽高比不变;若输入是2元素组成的序列,其输入格式需要是 (height, width) 。 + - **interpolation** (Inter mode, optional) - 图像插值模式。它可以是 [Inter.LINEAR, Inter.NEAREST, Inter.BICUBIC, Inter.PILCUBIC] 中的任何一个,默认值:Inter.LINEAR。 + + - Inter.LINEAR,双线性插值。 + - Inter.NEAREST,最近邻插值。 + - Inter.BICUBIC,双三次插值。 + - Inter.AREA,像素区域插值。 + - Inter.PILCUBIC,与 `pillow` 中实现的双三次插值效果一致,输入应为3通道格式。 + + **异常:** + + - **TypeError** - 当 `size` 的类型不为整型或整型序列。 + - **TypeError** - 当 `interpolation` 的类型不为 :class:`Inter` 。 + - **ValueError** - 当 `size` 不为正数。 + - **RuntimeError** - 如果输入的Tensor不是 格式。 diff --git a/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.ResizeWithBBox.rst b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.ResizeWithBBox.rst new file mode 100644 index 00000000000..7ed72b1b42f --- /dev/null +++ b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.ResizeWithBBox.rst @@ -0,0 +1,22 @@ +mindspore.dataset.vision.c_transforms.ResizeWithBBox +==================================================== + +.. py:class:: mindspore.dataset.vision.c_transforms.ResizeWithBBox(size, interpolation=Inter.LINEAR) + + 将输入图像调整为给定的大小并相应地调整边界框的大小。 + + **参数:** + + - **size** (Union[int, sequence]) - 图像的输出大小。如果 `size` 是整数,将调整图像的较短边长度为 `size`,且保持图像的宽高比不变;若输入是2元素组成的序列,其输入格式需要是 (height, width) 。 + - **interpolation** (Inter mode, optional) - 图像插值模式。它可以是 [Inter.LINEAR, Inter.NEAREST, Inter.BICUBIC, Inter.PILCUBIC] 中的任何一个,默认值:Inter.LINEAR。 + + - Inter.LINEAR,双线性插值。 + - Inter.NEAREST,最近邻插值。 + - Inter.BICUBIC,双三次插值。 + + **异常:** + + - **TypeError** - 当 `size` 的类型不为整型或整型序列。 + - **TypeError** - 当 `interpolation` 的类型不为 :class:`Inter` 。 + - **ValueError** - 当 `size` 不为正数。 + - **RuntimeError** - 如果输入的Tensor不是 格式。 diff --git a/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.Rotate.rst b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.Rotate.rst new file mode 100644 index 00000000000..70f8b165777 --- /dev/null +++ b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.Rotate.rst @@ -0,0 +1,19 @@ +mindspore.dataset.vision.c_transforms.Rotate +============================================ + +.. py:class:: mindspore.dataset.vision.c_transforms.Rotate(degrees, resample=Inter.NEAREST, expand=False, center=None, fill_value=0) + + 将输入图像旋转指定的度数。 + + **参数:** + + - **degrees** (Union[int, float]) - 旋转角度。 + - **resample** (Inter mode, optional) - 插值方式。 它可以是 [Inter.BILINEAR, Inter.NEAREST, Inter.BICUBIC] 中的任何一个,默认值:Inter.NEAREST。 + + - Inter.BILINEAR,双线性插值。 + - Inter.NEAREST,最近邻插值。 + - Inter.BICUBIC,双三次插值。 + + - **expand** (bool, optional) - 图像大小拓宽标志,若为True,将扩展图像大小使其足以容纳整个旋转图像;若为False或未指定,则保持输出图像与输入图像大小一致。请注意,扩展时将假设图像为中心旋转且未进行平移,默认值:False。 + - **center** (tuple, optional) - 可选的旋转中心,以图像左上角为原点,旋转中心的位置按照 (width, height) 格式指定。默认值:None,表示中心旋转。 + - **fill_value** (Union[int, tuple], optional) - 旋转图像之外区域的像素填充值。若输入3元素元组,将分别用于填充R、G、B通道;若输入整型,将以该值填充RGB通道。 `fill_value` 值必须在 [0, 255] 范围内,默认值:0。 diff --git a/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.SlicePatches.rst b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.SlicePatches.rst new file mode 100644 index 00000000000..c0ed3da837a --- /dev/null +++ b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.SlicePatches.rst @@ -0,0 +1,24 @@ +mindspore.dataset.vision.c_transforms.SlicePatches +================================================= + +.. py:class:: mindspore.dataset.vision.c_transforms.SlicePatches(num_height=1, num_width=1, slice_mode=SliceMode.PAD, fill_value=0) + + 在水平和垂直方向上将Tensor切片为多个块。适合于Tensor高宽较大的使用场景。如果将 `num_height` 和 `num_width` 都设置为 1,则Tensor将保持不变。输出Tensor的数量等于 num_height*num_width。 + + **参数:** + + - **num_height** (int, optional) - 垂直方向的切块数量,默认值:1。 + - **num_width** (int, optional) - 水平方向的切块数量,默认值:1。 + - **slice_mode** (Inter mode, optional) - 表示填充或丢弃,它可以是 [SliceMode.PAD, SliceMode.DROP] 中的任何一个,默认值:SliceMode.PAD。 + - **fill_value** (int, optional) - 如果 `slice_mode` 取值为 SliceMode.PAD,该值表示在右侧和底部方向上的填充的边界宽度(以像素数计),默认值:0。 + + **异常:** + + - **TypeError** - 当 `num_height` 不是整型。 + - **TypeError** - 当 `num_width` 不是整型。 + - **TypeError** - 当 `slice_mode` 不是整型。 + - **TypeError** - 当 `fill_value` 不是整型。 + - **ValueError** - 当 `num_height` 不为正数。 + - **ValueError** - 当 `num_width` 不为正数。 + - **ValueError** - 当 `fill_value` 不在 [0, 255]范围内。 + - **RuntimeError** - 如果输入的Tensor不是 格式。 diff --git a/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.SoftDvppDecodeRandomCropResizeJpeg.rst b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.SoftDvppDecodeRandomCropResizeJpeg.rst new file mode 100644 index 00000000000..df7a757387d --- /dev/null +++ b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.SoftDvppDecodeRandomCropResizeJpeg.rst @@ -0,0 +1,26 @@ +mindspore.dataset.vision.c_transforms.SoftDvppDecodeRandomCropResizeJpeg +======================================================================== + +.. py:class:: mindspore.dataset.vision.c_transforms.SoftDvppDecodeRandomCropResizeJpeg(size, scale=(0.08, 1.0), ratio=(3. / 4., 4. / 3.), max_attempts=10) + + 使用Ascend系列芯片DVPP模块的模拟算法组合了 `Crop` 、 `Decode` 和 `Resize` 。 + 使用场景与数据增强算子 `SoftDvppDecodeResizeJpeg` 一致。 输入图像大小应在 [32*32, 8192*8192] 范围内。图像长度和宽度的缩小和放大倍数应在 [1/32, 16] 范围内。使用该算子只能输出具有均匀分辨率的图像,不支持奇数分辨率的输出。 + + **参数:** + + - **size** (Union[int, sequence]) - 输出图像的大小。如果 `size` 是整数,则返回大小为 (size, size) 的正方形图像。 如果 `size` 是一个长度为2的序列,其输入格式应该为 (height, width)。 + - **scale** (list, tuple, optional) - 裁剪子图的大小相对原图比例的随机选取范围,需要在[min, max)区间,默认值:(0.08, 1.0)。 + - **ratio** (list, tuple, optional) - 裁剪子图的宽高比的随机选取范围,需要在[min, max)区间,默认值:(3./4., 4./3.)。 + - **max_attempts** (int, optional) - 生成随机裁剪位置的最大尝试次数,超过该次数时将使用中心裁剪,默认值:10。 + + **异常:** + + - **TypeError** - 当 `size` 不是整型或不是整型序列。 + - **TypeError** - 当 `scale` 不是元组类型。 + - **TypeError** - 当 `ratio` 不是元组类型。 + - **TypeError** - 当 `max_attempts` 不是整型。 + - **ValueError** - 当 `size` 不为正数。 + - **ValueError** - 当 `scale` 是负数。 + - **ValueError** - 当 `ratio` 是负数。 + - **ValueError** - 当 `max_attempts` 不为正数。 + - **RuntimeError** - 如果输入的Tensor不是一个一维序列。 diff --git a/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.SoftDvppDecodeResizeJpeg.rst b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.SoftDvppDecodeResizeJpeg.rst new file mode 100644 index 00000000000..75750e033d5 --- /dev/null +++ b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.SoftDvppDecodeResizeJpeg.rst @@ -0,0 +1,18 @@ +mindspore.dataset.vision.c_transforms.SoftDvppDecodeResizeJpeg +================================================= + +.. py:class:: mindspore.dataset.vision.c_transforms.SoftDvppDecodeResizeJpeg(size) + + 使用Ascend系列芯片DVPP模块的仿真算法对JPEG图像进行解码和缩放。 + + 建议在以下场景使用该算法:训练时不使用Ascend芯片的DVPP模块,推理时使用Ascend芯片的DVPP模块,推理的准确率低于训练的准确率; 并且输入图像大小应在 [32*32, 8192*8192] 范围内。 图像长度和宽度的缩小和放大倍数应在 [1/32, 16] 范围内。使用该算子只能输出具有均匀分辨率的图像,不支持奇数分辨率的输出。 + + **参数:** + + - **size (Union[int, sequence]) - 图像的输出大小。如果 `size` 是整数,将调整图像的较短边长度为 `size`,且保持图像的宽高比不变;若输入是2元素组成的序列,其输入格式需要是 (height, width) 。 + + **异常:** + + - **TypeError** - 当 `size` 不是整型或不是整型序列。 + - **ValueError** - 当 `size` 不为正数。 + - **RuntimeError** - 如果输入的Tensor不是一个一维序列。 diff --git a/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.UniformAugment.rst b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.UniformAugment.rst new file mode 100644 index 00000000000..4bb5a08a115 --- /dev/null +++ b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.UniformAugment.rst @@ -0,0 +1,17 @@ +mindspore.dataset.vision.c_transforms.UniformAugment +==================================================== + +.. py:class:: mindspore.dataset.vision.c_transforms.UniformAugment(transforms, num_ops=2) + + 对输入图像执行随机选取的数据增强操作。 + + **参数:** + + - **transforms** - C++ 操作列表(不接受Python操作)。 + - **num_ops** (int, optional) - 要选择和执行的操作数量,默认值:2。 + + **异常:** + + - **TypeError** - 当 `transforms` 包含不可调用的Python对象。 + - **TypeError** - 当 `num_ops` 不是整数。 + - **ValueError** - 当 `num_ops` 不为正数。 diff --git a/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.VerticalFlip.rst b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.VerticalFlip.rst new file mode 100644 index 00000000000..dc20772aa01 --- /dev/null +++ b/docs/api/api_python/dataset_vision/mindspore.dataset.vision.c_transforms.VerticalFlip.rst @@ -0,0 +1,10 @@ +mindspore.dataset.vision.c_transforms.VerticalFlip +================================================= + +.. py:class:: mindspore.dataset.vision.c_transforms.VerticalFlip + + 对输入图像进行垂直翻转。 + + **异常:** + + - **RuntimeError** - 如果输入的Tensor不是 格式。 diff --git a/mindspore/python/mindspore/dataset/vision/c_transforms.py b/mindspore/python/mindspore/dataset/vision/c_transforms.py index 8486c79fd6a..f299949d381 100644 --- a/mindspore/python/mindspore/dataset/vision/c_transforms.py +++ b/mindspore/python/mindspore/dataset/vision/c_transforms.py @@ -1627,8 +1627,7 @@ class RandomPosterize(ImageTensorOperation): class RandomResizedCrop(ImageTensorOperation): """ - Crop the input image to a random size and aspect ratio. This operator will crop the input image randomly, and - resize the cropped image using a selected interpolation mode. + This operator will crop the input image randomly, and resize the cropped image using a selected interpolation mode. Note: If the input image is more than one, then make sure that the image size is the same.