## 什么是tensorflow

TensorFlow 这个名字还是很有意思的，翻译过来是“张量流动”，这非常准确地表达了它的基本原理，就是根据深度学习模型架构构建一个有向图，让数据以张量的形式在其中流动起来。

张量（Tensor）其实是指向量的高维扩展，比如向量可以看作是张量的一维形式，矩阵可以看作张量在二维空间上的特例。

## 基础例子

tf手写识别 https://tensorflow.google.cn/tutorials/quickstart/beginner?hl=zh_cn

In [2]:
import tensorflow as tf

2024-04-15 18:21:11.442158: I tensorflow/core/platform/cpu_feature_guard.cc:182] This TensorFlow binary is optimized to use available CPU instructions in performance-critical operations.
To enable the following instructions: SSE4.1 SSE4.2 AVX AVX2 FMA, in other operations, rebuild TensorFlow with the appropriate compiler flags.


In [11]:

## 加载数据集
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
 ## 归一化处理，，每个像素的值是0到255之间的整数，代表了不同的灰度级别。通过将像素值除以255.0，我们将数据范围从[0, 255]缩放到[0, 1]之间
x_train, x_test = x_train / 255.0, x_test / 255.0 

print("x_train 的维度:", x_train.shape)

x_train 的维度: (60000, 28, 28)


In [13]:
## 构建网络结构

model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(input_shape=(28, 28)), ## 扁平化
  tf.keras.layers.Dense(128, activation='relu'),
  tf.keras.layers.Dropout(0.2),
  tf.keras.layers.Dense(10)
])


* Flatten层。它将输入图像从二维的28x28像素展平为一维的784（28*28）像素。
  这样做是为了将二维图像转换为一维数组，以便后续的全连接层（Dense层）可以处理。
  input_shape=(28, 28)参数指定了模型输入数据的形状。

* Dense层，一个全连接（Dense）层。它有128个神经元，使用ReLU（Rectified Linear Unit）作为激活函数。
  全连接层的每个神经元都与前一层的所有输出连接，可以学习输入数据的非线性特征。

* Dropout层。Dropout是一种正则化技术，用于防止神经网络过拟合,20%的输出特征被随机丢弃

* 这是模型的最后一层，又一个全连接（Dense）层。它有10个神经元，对应于10个类别的输出（MNIST数据集中的数字0-9）。
  这一层没有指定激活函数，通常用于输出层，后续可以结合softmax激活函数来计算每个类别的概率。

In [18]:
loss_fn = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)

2.3236065

In [22]:
##  定义模型的优化方法(adam)，损失函数(sparse_categorical_crossentropy)和评估指标(accuracy)
model.compile(optimizer='adam',
              loss=loss_fn,
              metrics=['accuracy'])

In [20]:
## 训练模型，进行5轮迭代更新(epochs=5）
model.fit(x_train, y_train, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x105631410>

In [21]:
## 评估模型
model.evaluate(x_test,  y_test, verbose=2)

313/313 - 1s - loss: 0.0767 - accuracy: 0.9779 - 639ms/epoch - 2ms/step


[0.07667092978954315, 0.9779000282287598]