Skip to content

Latest commit

 

History

History
160 lines (135 loc) · 10.2 KB

Overview_cn.rst

File metadata and controls

160 lines (135 loc) · 10.2 KB

paddle.vision

paddle.vision 目录是飞桨在视觉领域的高层 API。具体如下:

内置数据集相关 API

API 名称 API 功能
:ref:`Cifar10 <cn_api_vision_datasets_Cifar10>`
Cifar10 数据集
:ref:`Cifar100 <cn_api_vision_datasets_Cifar100>`
Cifar100 数据集
:ref:`FashionMNIST <cn_api_vision_datasets_FashionMNIST>`
FashionMNIST 数据集
:ref:`Flowers <cn_api_vision_datasets_Flowers>`
Flowers 数据集
:ref:`MNIST <cn_api_vision_datasets_MNIST>`
MNIST 数据集
:ref:`VOC2012 <cn_api_vision_datasets_VOC2012>`
VOC2012 数据集

内置模型相关 API

API 名称 API 功能
:ref:`LeNet <cn_api_paddle_vision_models_LeNet>`
LeNet 模型
:ref:`AlexNet <cn_api_paddle_vision_models_AlexNet>`
AlexNet 模型
:ref:`alexnet <cn_api_paddle_vision_models_alexnet>`
AlexNet 模型
:ref:`MobileNetV1 <cn_api_paddle_vision_models_MobileNetV1>`
MobileNetV1 模型
:ref:`mobilenet_v1 <cn_api_paddle_vision_models_mobilenet_v1>`
MobileNetV1 模型
:ref:`MobileNetV2 <cn_api_paddle_vision_models_MobileNetV2>`
MobileNetV2 模型
:ref:`mobilenet_v2 <cn_api_paddle_vision_models_mobilenet_v2>`
MobileNetV2 模型
:ref:`MobileNetV3Small <cn_api_paddle_vision_models_MobileNetV3Small>`
MobileNetV3Small 模型
:ref:`MobileNetV3Large <cn_api_paddle_vision_models_MobileNetV3Large>`
MobileNetV3Large 模型
:ref:`mobilenet_v3_small <cn_api_paddle_vision_models_mobilenet_v3_small>`
MobileNetV3Small 模型
:ref:`mobilenet_v3_large <cn_api_paddle_vision_models_mobilenet_v3_large>`
MobileNetV3Large 模型
:ref:`ResNet <cn_api_paddle_vision_models_ResNet>`
ResNet 模型
:ref:`resnet18 <cn_api_paddle_vision_models_resnet18>`
18 层的 ResNet 模型
:ref:`resnet34 <cn_api_paddle_vision_models_resnet34>`
34 层的 ResNet 模型
:ref:`resnet50 <cn_api_paddle_vision_models_resnet50>`
50 层的 ResNet 模型
:ref:`resnet101 <cn_api_paddle_vision_models_resnet101>`
101 层的 ResNet 模型
:ref:`resnet152 <cn_api_paddle_vision_models_resnet152>`
152 层的 ResNet 模型
:ref:`wide_resnet50_2 <cn_api_paddle_vision_models_wide_resnet50_2>`
50 层的 WideResNet 模型
:ref:`wide_resnet101_2 <cn_api_paddle_vision_models_wide_resnet101_2>`
101 层的 WideResNet 模型
:ref:`resnext50_32x4d <cn_api_paddle_vision_models_resnext50_32x4d>`
ResNeXt-50 32x4d 模型
:ref:`resnext50_64x4d <cn_api_paddle_vision_models_resnext50_64x4d>`
ResNeXt-50 64x4d 模型
:ref:`resnext101_32x4d <cn_api_paddle_vision_models_resnext101_32x4d>`
ResNeXt-101 32x4d 模型
:ref:`resnext101_64x4d <cn_api_paddle_vision_models_resnext101_64x4d>`
ResNeXt-101 64x4d 模型
:ref:`resnext152_32x4d <cn_api_paddle_vision_models_resnext152_32x4d>`
ResNeXt-152 32x4d 模型
:ref:`resnext152_64x4d <cn_api_paddle_vision_models_resnext152_64x4d>`
ResNeXt-152 64x4d 模型
:ref:`VGG <cn_api_paddle_vision_models_VGG>`
VGG 模型
:ref:`vgg11 <cn_api_paddle_vision_models_vgg11>`
11 层的 VGG 模型
:ref:`vgg13 <cn_api_paddle_vision_models_vgg13>`
13 层的 VGG 模型
:ref:`vgg16 <cn_api_paddle_vision_models_vgg16>`
16 层的 VGG 模型
:ref:`vgg19 <cn_api_paddle_vision_models_vgg19>`
19 层的 VGG 模型
:ref:`DenseNet <cn_api_paddle_vision_models_DenseNet>`
DenseNet 模型
:ref:`densenet121 <cn_api_paddle_vision_models_densenet121>`
121 层的 DenseNet 模型
:ref:`densenet161 <cn_api_paddle_vision_models_densenet161>`
161 层的 DenseNet 模型
:ref:`densenet169 <cn_api_paddle_vision_models_densenet169>`
169 层的 DenseNet 模型
:ref:`densenet201 <cn_api_paddle_vision_models_densenet201>`
201 层的 DenseNet 模型
:ref:`densenet264 <cn_api_paddle_vision_models_densenet264>`
264 层的 DenseNet 模型
:ref:`InceptionV3 <cn_api_paddle_vision_models_InceptionV3>`
InceptionV3 模型
:ref:`inception_v3 <cn_api_paddle_vision_models_inception_v3>`
InceptionV3 模型
:ref:`GoogLeNet <cn_api_paddle_vision_models_GoogLeNet>`
GoogLeNet 模型
:ref:`googlenet <cn_api_paddle_vision_models_googlenet>`
GoogLeNet 模型
:ref:`SqueezeNet <cn_api_paddle_vision_models_SqueezeNet>`
SqueezeNet 模型
:ref:`squeezenet1_0 <cn_api_paddle_vision_models_squeezenet1_0>`
squeezenet1_0 模型
:ref:`squeezenet1_1 <cn_api_paddle_vision_models_squeezenet1_1>`
squeezenet1_1 模型
:ref:`ShuffleNetV2 <cn_api_paddle_vision_models_ShuffleNetV2>`
ShuffleNetV2 模型
:ref:`shufflenet_v2_x0_25 <cn_api_paddle_vision_models_shufflenet_v2_x0_25>`
输出通道缩放比例为 0.25 的 ShuffleNetV2 模型
:ref:`shufflenet_v2_x0_33 <cn_api_paddle_vision_models_shufflenet_v2_x0_33>`
输出通道缩放比例为 0.33 的 ShuffleNetV2 模型
:ref:`shufflenet_v2_x0_5 <cn_api_paddle_vision_models_shufflenet_v2_x0_5>`
输出通道缩放比例为 0.5 的 ShuffleNetV2 模型
:ref:`shufflenet_v2_x1_0 <cn_api_paddle_vision_models_shufflenet_v2_x1_0>`
输出通道缩放比例为 1.0 的 ShuffleNetV2 模型
:ref:`shufflenet_v2_x1_5 <cn_api_paddle_vision_models_shufflenet_v2_x1_5>`
输出通道缩放比例为 1.5 的 ShuffleNetV2 模型
:ref:`shufflenet_v2_x2_0 <cn_api_paddle_vision_models_shufflenet_v2_x2_0>`
输出通道缩放比例为 2.0 的 ShuffleNetV2 模型
:ref:`shufflenet_v2_swish <cn_api_paddle_vision_models_shufflenet_v2_swish>`
使用 swish 进行激活的 ShuffleNetV2 模型

视觉操作相关 API

API 名称 API 功能
:ref:`deform_conv2d <cn_api_paddle_vision_ops_deform_conv2d>`
计算 2-D 可变形卷积
:ref:`DeformConv2D <cn_api_paddle_vision_ops_DeformConv2D>`
计算 2-D 可变形卷积
:ref:`yolo_box <cn_api_vision_ops_yolo_box>`
生成 YOLO 检测框
:ref:`yolo_loss <cn_api_vision_ops_yolo_loss>`
计算 YOLO 损失

数据处理相关 API

API 名称 API 功能
:ref:`adjust_brightness <cn_api_vision_transforms_adjust_brightness>`
调整图像亮度
:ref:`adjust_contrast <cn_api_vision_transforms_adjust_contrast>`
调整图像对比度
:ref:`adjust_hue <cn_api_vision_transforms_adjust_hue>`
调整图像色调
:ref:`BaseTransform <cn_api_vision_transforms_BaseTransform>`
图像处理的基类,用于自定义图像处理
:ref:`BrightnessTransform <cn_api_vision_transforms_BrightnessTransform>`
调整图像亮度
:ref:`center_crop <cn_api_vision_transforms_center_crop>`
对图像进行中心裁剪
:ref:`CenterCrop <cn_api_vision_transforms_CenterCrop>`
对图像进行中心裁剪
:ref:`ColorJitter <cn_api_vision_transforms_ColorJitter>`
随机调整图像的亮度,对比度,饱和度和色调
:ref:`Compose <cn_api_vision_transforms_Compose>`
以列表的方式将数据集预处理的接口进行组合
:ref:`ContrastTransform <cn_api_vision_transforms_ContrastTransform>`
调整图像对比度
:ref:`crop <cn_api_vision_transforms_crop>`
对图像进行裁剪
:ref:`Grayscale <cn_api_vision_transforms_Grayscale>`
对图像进行灰度化
:ref:`hflip <cn_api_vision_transforms_hflip>`
水平翻转图像
:ref:`HueTransform <cn_api_vision_transforms_HueTransform>`
调整图像色调
:ref:`Normalize <cn_api_vision_transforms_Normalize>`
对图像进行归一化
:ref:`normalize <cn_api_vision_transforms_normalize>`
对图像进行归一化
:ref:`Pad <cn_api_vision_transforms_Pad>`
对图像进行填充
:ref:`pad <cn_api_vision_transforms_pad>`
对图像进行填充
:ref:`RandomCrop <cn_api_vision_transforms_RandomCrop>`
对图像随机裁剪
:ref:`RandomHorizontalFlip <cn_api_vision_transforms_RandomHorizontalFlip>`
基于概率水平翻转图像
:ref:`RandomResizedCrop <cn_api_vision_transforms_RandomResizedCrop>`
基于概率随机按照大小和长宽比对图像进行裁剪
:ref:`RandomRotation <cn_api_vision_transforms_RandomRotation>`
对图像随机旋转
:ref:`RandomVerticalFlip <cn_api_vision_transforms_RandomVerticalFlip>`
基于概率垂直翻转图像
:ref:`Resize <cn_api_vision_transforms_Resize>`
对图像调整大小
:ref:`resize <cn_api_vision_transforms_resize>`
对图像调整大小
:ref:`rotate <cn_api_vision_transforms_rotate>`
对图像随机旋转
:ref:`SaturationTransform <cn_api_vision_transforms_SaturationTransform>`
调整图像饱和度
:ref:`to_grayscale <cn_api_vision_transforms_to_grayscale>`
对图像进行灰度化
:ref:`to_tensor <cn_api_vision_transforms_to_tensor>`
将`PIL.Image`或`numpy.ndarray`转为`paddle.Tensor`
:ref:`ToTensor <cn_api_vision_transforms_ToTensor>`
将`PIL.Image`或`numpy.ndarray`转为`paddle.Tensor`
:ref:`Transpose <cn_api_vision_transforms_Transpose>`
将输入的图像数据更改为目标格式
:ref:`vflip <cn_api_vision_transforms_vflip>`
垂直翻转图像

其他 API

API 名称 API 功能
:ref:`get_image_backend <cn_api_vision_image_get_image_backend>`
获取用于加载图像的模块名称
:ref:`image_load <cn_api_vision_image_image_load>`
读取一个图像
:ref:`set_image_backend <cn_api_vision_image_set_image_backend>`
指定用于加载图像的后端