In [None]:
# 张量（Tensor）是MindSpore网络运算中的基本数据结构。张量中的数据类型可参考dtype。
# 不同维度的张量分别表示不同的数据，0维张量表示标量，1维张量表示向量，2维张量表示矩阵，3维张量可以表示彩色图像的RGB三通道等等。
# MindSpore张量支持不同的数据类型，包含int8、int16、int32、int64、uint8、uint16、uint32、uint64、float16、float32、float64、bool_，与NumPy的数据类型一一对应。
# 在MindSpore的运算处理流程中，Python中的int数会被转换为定义的int64类型，float数会被转换为定义的float32类型。

In [None]:
%matplotlib inline
# 导入 MindSpore
import mindspore
from mindspore import dtype 
from mindspore import Tensor
# cell 同时输出多行
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

In [None]:
#指定数据类型
a=1
type(a)
b = Tensor(a, dtype.float64)
b.dtype

In [None]:
# 构造张量时，支持传入Tensor、float、int、bool、tuple、list和NumPy.array类型，其中tuple和list里只能存放float、int、bool类型数据。
# Tensor初始化时，可指定dtype。如果没有指定dtype，初始值int、float、bool分别生成数据类型为mindspore.int32、mindspore.float32、mindspore.bool_的0维Tensor， 
# 初始值tuple和list生成的1维Tensor数据类型与tuple和list里存放的数据类型相对应，如果包含多种不同类型的数据，则按照优先级：bool < int < float，
# 选择相对优先级最高类型所对应的mindspore数据类型。
# 如果初始值是Tensor，则生成的Tensor数据类型与其一致；如果初始值是NumPy.array，则生成的Tensor数据类型与之对应。

In [None]:
import numpy as npfrom mindspore import Tensor
#用数组创建张量
x = Tensor(np.array([[1, 2], [3, 4]]), dtype.int32)

In [None]:
# 用数值创建张量 
y = Tensor(1.0, dtype.int32) 
z = Tensor(2, dtype.int32)

In [None]:
# 用Bool创建张量 
m = Tensor(True, dtype.bool_) 

In [None]:
# 用tuple创建张量 
n = Tensor((1, 2, 3), dtype.int16)

In [None]:
# 用list创建张量
p = Tensor([4.0, 5.0, 6.0], dtype.float64)

In [None]:
# 用常量创建张量 
q = Tensor(1, dtype.float64)

In [None]:
# 张量的属性包括形状 (shape) 和数据类型 (dtype)
# 形状: Tensor的 shape，是一个 tuple。数据类型: Tensor的 dtype，是 MindSpore 的一个数据类型

In [None]:
x = Tensor(np.array([[1, 2], [3, 4]]), dtype.int32) 
x.shape # 形状 x.dtype # 数据类型 x.ndim # 维度 x.size # 大小

In [None]:
# 张量的方法
# asnumpy():将 Tensor 转换为 NumPy的 array。
y = Tensor(np.array([[True, True], [False, False]]), dtype.bool_) 
# 将Tensor数据类型转换成NumPy 
y_array = y.asnumpy()

In [None]:
# 数据集介绍:
# MNIST 数据集来自美国国家标准与技术研究所，National lnstitute of standards andTechnology(NIST),
# 数据集由来自 250 个不同人手写的数字构成，其中 50%是高中学生50%来自人门普查局 (the Census Bureau) 的工作人员
# 训练集: 60000，测试集: 10000
# 下载MNIST数据集：https://zhuanyejianshe.obs.cn-north-4.myhuaweicloud.com/chuangxinshijianke/cv-nlp/MNIST.zip

In [None]:
import os 
import mindspore.dataset as ds # 数据集的载入 
import matplotlib.pyplot as plt
dataset_dir = "./MNIST/train" # 数据集路径 #
从mnist dataset读取3张图片 mnist_dataset = ds.MnistDataset(dataset_dir=dataset_dir, num_samples=3) 
# 设置图像大小 
plt.figure(figsize=(8,8)) i = 1 
# 打印3张子图 
for dic in mnist_dataset.create_dict_iterator(output_numpy=True): 
    plt.subplot(3,3,i) 
    plt.imshow(dic['image'][:,:,0]) 
    plt.axis('off') 
    i +=1 
plt.show()
# MindSpore还支持加载多种数据存储格式下的数据集，用户可以直接使用mindspore.dataset中对应的类加载磁盘中的数据文件。

In [None]:
# 数据预处理在众多深度学习算法中都起着重要作用，数据预处理可以提高模型精度，加快模型收敛速度，提升模型性能，
# 这里主要介绍 MindSpore 常用的数据预处理方式。数据是深度学习的基础，良好的数据输入可以对整个深度神经网络训练起到非常积极的作用。
# 在训练前对已加载的数据集进行数据处理，可以解决诸如数据量过大、样本分布不均等问题从而获得更加优化的数据输入。
# 定义数据预处理函数，函数功能包括
# 加载MNIST 数据集
# 读取数据集 MnistDataset(data path)
# 打乱数据集 shuffle
# 对数据集进行混洗，随机打乱数据顺序。设定的 buffer size 越大，混洗程度越大，但时间、计算资源消耗也会更大
# 专换图像通道 HWC2CHW
# 寄存储的图像由原来的(高，宽，通道数)转换为(通道数，高，宽).比量输出数据 Batch
# 寄数据集分批，分别输入到训练系统中进行训练，可以减少训练轮次，达到加速训练过程的目的。
# 重复 Repeat
# 对数据集进行重复，达到扩充数据量的目的。

In [None]:
import mindspore.dataset.transforms.c_transforms as C # 常用转化算子 
import mindspore.dataset.vision.c_transforms as CV # 图像转化算子 
from mindspore.common import dtype as mstype # 数据形态转换
from mindspore.common.initializer import Normal # 参数初始化 
def create_dataset(data_path, batch_size=32): 
    """ 数据预处理与批量输出的函数 Args: data_path: 数据路径 batch_size: 批量大小
    """
    # 加载数据集 
    data = ds.MnistDataset(data_path) 
    # 打乱数据集 
    data = data.shuffle(buffer_size=10000) 
    # 数据标准化参数 # MNIST数据集的 mean = 33.3285，std = 78.5655
    mean, std = 33.3285, 78.5655 
    # 定义算子 
    nml_op = lambda x : np.float32((x-mean)/std) 
    # 数据标准化，image = (image-mean)/std 
    hwc2chw_op = CV.HWC2CHW() # 通道前移（为配适网络，CHW的格式可最佳发挥昇腾芯片算力） 
    type_cast_op = C.TypeCast(mstype.int32) # 原始数据的标签是unint，计算损失需要int
    # 算子运算 
    data = data.map(operations=type_cast_op, input_columns='label') 
    data = data.map(operations=nml_op, input_columns='image') 
    data = data.map(operations=hwc2chw_op, input_columns='image')
    # 批处理 
    data = data.batch(batch_size) # 重复 
    data = data.repeat(1) 
    return data
train_path = os.path.join('MNIST','train') # 训练集路径 
train_data = create_dataset(train_path) # 定义训练数据集 
test_path = os.path.join('MNIST','test') # 测试集路径 
test_data = create_dataset(test_path) # 定义测试数据集

In [None]:
# 步骤1全连接神经网络
# 全连接层
# mindspore.nn.Dense
# in_channels: 输入通道
# out channels: 输出通道
# weight init: 权重初始化，Default 'normal'
import mindspore.nn as nn 
from mindspore import Tensor 
# 构造输入张量 
input = Tensor(np.array([[1, 1, 1], [2, 2, 2]]), mindspore.float32) 
print(input) 
# 构造全连接网络，输入通道为3，输出通道为3 
net = nn.Dense(in_channels=3, out_channels=3, weight_init=1) 
output = net(input) 
print(output)

In [None]:
# 步骤2 卷积神经网络
# 卷积层
# mindspore.nn.Conv2d
# in channels: 输入通道
# out channels: 输出通道
# kernel_size : 核大小
# stride : 步长
# pad mode : padding 方式 (“same", “valid”,“pad”) . Default: “same”.
# Padding: padding 补产数字
# has bias: 是否有偏置项 Default: False.
# weight init: 权重初始化 Default: normal.
# bias init: 偏置项初始化 Default:'zeros'
# data_format：数据形状（ ‘NHWC’ or ‘NCHW’ ）. Default: ‘NCHW’

In [None]:
import mindspore 
import mindspore.nn as nn 
from mindspore import Tensor
# mindspore.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, pad_mode='same', padding=0, dilation=1,
#                         group=1, has_bias=False, weight_init='normal', bias_init='zeros', data_format='NCHW')
# 图片数，通道数，图像高，图像宽 input = Tensor(np.ones([1, 3, 1080, 960]), mindspore.float32) 
# 输入通道数为3，输出通道数为24， 卷积核大小为5， 步长为1，padding方式same，有偏置项，权重初始化为normal 
net = nn.Conv2d(in_channels=3, out_channels=24, kernel_size=5, stride=1, pad_mode='same', has_bias=True, weight_init='normal')
# 图片数，通道数，图像高，图像宽 
output = net(input).shape 
print(output)

In [None]:
# 步骤3矫正线性单元激活函数
# mindspore.nn.ReLU
input_x = Tensor(np.array([-1, 2, -3, 2, -1]), mindspore.float16) 
relu = nn.ReLU() 
output = relu(input_x) 
print(output)


In [None]:
# 步骤4 池化层
# 2 维数据最大池化
# mindspore.nn.MaxPool2d
# kernel size : 池化大小 Default: 1.
# Stride : 池化步长 Default: 1.
# pad mode: padding 万式 (“same” or “valid”) . Default: “valid”.
# data format: 数据形式 (NHWc'or NCHW’) .Default: NCHW
input_x = np.random.randint(0, 10, [1, 2, 4, 4]) 
print(input_x) 
print("-----------------------------------")
# 最大池化，池化大小2x2， 步长为2 
pool = nn.MaxPool2d(kernel_size=2, stride=2) 
output = pool(Tensor(input_x, mindspore.float32)) 
print(output)

In [None]:
# 步骤 5 Flatten 层
# mindspore.nn.Flatten
# Flatten 层可以把多维的输入一维化，常用在卷积层到全连接层的过渡。
from mindspore import Tensor 
import mindspore 
import mindspore.nn as nn 
input = Tensor(np.array([[[1, 1], [2, 2]], [[3, 3], [4, 4]]]), mindspore.float32) 
print(input) 
print("-----------------------------------") 
net = nn.Flatten() 
output = net(input) 
print(output)

In [None]:
# 步骤6搭建模型 (LeNet-5)
# 所有神经网络的基类
# mindspore.nn.Cell
# 1. INPUT (输入层): 输入 28*28 的图片
# c1 (卷积层): 选取 6个 5*5 卷积核(不包含偏置)，得到 6 个特征图，每个特征图的一个2.
# 边为 28-5+1=24。
# s2 (池化层) : 池化层是一个下采样层，输出 12*12*6 的特征图3选取 16 个大小为 5*5 积核，得到特征图大小为 8*8*16C3 (卷积层) :S4 (池化层) : 窗口大小为 2*2，输出 4*4*16 的特征图。
# F5 (全连接层) : 120 个神经元
# F6 (全连接层) : 84 个神经元
# OUTPUT (输出层) : 10 个神经元，10 分类问题

In [None]:
import mindspore.nn as nn # 各类网络层都在 nn 里面
class LeNet5(nn.Cell):
# 定义算子
    def__init_self, num_class=10, num_channel=1):
        super(LeNet5, self)._init__()
        # 卷积层
        self.conv1 = nn.Conv2d(num channel, 6, 5, pad mode='valid')self.conv2 = nn.Conv2d(6, 16, 5, pad mode='valid')
        #全连接层
        self.fc1 = nn.Dense(4 * 4 * 16, 120, weight init=Normal(0.02))
        self.fc2 = nn.Dense(120, 84, weight init=Normal(0.02))
        self.fc3 = nn.Dense(84, num class, weight init=Normal(0.02))
        # 活函数
        self.relu = nn.ReLU()
        #最大池化成
        self.max_pool2d = nn.MaxPool2d(kernel size=2, stride=2)
        #网络展开
        self.flatten = nn.Flatten()
    # 建构网络
    def construct(self, x):
        x = self.conv1(x)
        x = self.relu(x)
        x = self.max_pool2d(x)
        x = self.conv2(x)
        x = self.relu(x)
        x = self.max_pool2d(x)
        x = self.flatten(x)
        x = self.fc1(x)
        x = self.relu(x) 
        x = self.fc2(x) 
        x = self.relu(x) 
        x = self.fc3(x) 
        return x
# 定义神经网络 
lenet = LeNet5()

In [None]:
# 模型训练与评估
# 步骤 1 损失函数
# 交叉损失函数，用于分类模型。当标签数据不是 one-hot 编码形式时，:需要输入参数 sparse为 True。
# mindspore.nn.SoftmaxCrossEntropyWithLogits代码:
#定义交叉损失函数
net loss = nn.SoftmaxCrossEntropyWithLogits(sparse=True)


# 步骤2 优化器
# 深度学习优化算法大概常用的有 SGD、Adam、Ftrl、lazyadam、Momentum、RMSprop、LarsProximal ada grad 和 lamb 这几种
# 动量优化器
# mindspore.nn.Momentum
# 代码:
# 定义优化器
Ir = 0.01
momentum = 0.9
net opt = nn.Momentum(lenet.trainable params(), Ir, momentum)

# 步骤3 模型编译
# mindspore.Modelnetwork: 神经网络loss fn: 损失函数optimizer: 优化器metrics: 评估指标
from mindspore import Model 
# 承载网络结构 
from mindspore.nn.metrics import Accuracy 
# 测试模型用 
# 模型编译 
model = Model(lenet, net_loss, net_opt, metrics={'accuracy': Accuracy()})

# 步骤4模型训练
# model.train
# epoch: 训练次数train dataset : 训练集
#设定loss监控 f
rom mindspore.train.callback import LossMonitor 
loss_cb = LossMonitor(per_print_times=train_data.get_dataset_size()) 
# 训练模型 
model.train(3, train_data, loss_cb) # 训练3个epoch

# 步骤 5 模型评估
# model.eval
# 评估模型 
model.eval(test_data) # 测试网络

In [None]:
# 本实验介绍了MindSpore的数据结构与类型，以及MindSpore搭建神经网络用到的基础模块，
# 让学员学会如何加载数据集，搭建神经网络，训练和评估模型等，
# 从易到难，由浅入深，让学员熟悉MindSpore的基础用法，掌握MindSpore开发的简单流程。