# 识别手写数字（0-9）

## 通过255-img_arr 处理图片背景

In [None]:
from PIL import Image
import numpy as np
import tensorflow as tf

# 指定断点续训的路径
model_save_path = './checkpoint/mnist.ckpt'

model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

# 加载断点续训的模型参数
model.load_weights(model_save_path)

# 让用户输入测试图片的数量
preNum = int(input("input the number of test pictures:"))

base_path = './mnist/'
for i in range(preNum):
    # 输入测试图片的路径
    image_path = input("input the image path ")
    img = Image.open(base_path + image_path)
    # 将图片resize成28*28的尺寸，以符合模型的输入要求
    img = img.resize((28, 28), Image.Resampling.LANCZOS)
    # 将图片转换为灰度图
    img_arr = np.array(img.convert('L'))
    
    # 翻转图像的颜色，原图是白底黑字，训练集是黑底白字，所以这里需要翻转一下
    img_arr = 255 - img_arr
    # 将图片像素值归一化，将像素值从0-255归一化到0-1，神经网络通常在输入图像时期期望数据处于0-1之间，这样有助于加快收敛速度
    img_arr = img_arr / 255.0
    
    # 添加一个新的轴，拓展图像数组的纬度，使之变成(1,28,28)
    x_predict = img_arr[tf.newaxis, ...]
    
    # 预测
    result = model.predict(x_predict)
    
    # 获取概率最大的元素的索引
    pred = tf.argmax(result, axis=1)
    
    print('\n')
    tf.print(pred)
    



## 通过遍历处理背景颜色

In [None]:
from PIL import Image
import numpy as np
import tensorflow as tf

# 指定断点续训的路径
model_save_path = './checkpoint/mnist.ckpt'

model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

# 加载断点续训的模型参数
model.load_weights(model_save_path)

# 让用户输入测试图片的数量
preNum = int(input("input the number of test pictures:"))
base_path = './mnist/'
for i in range(preNum):
    # 输入测试图片的路径
    image_path = input("input the image path ")
    img = Image.open(base_path + image_path)
    # 将图片resize成28*28的尺寸，以符合模型的输入要求
    img = img.resize((28, 28), Image.Resampling.LANCZOS)
    # 将图片转换为灰度图
    img_arr = np.array(img.convert('L'))
    
    # 翻转图像的颜色，原图是白底黑字，训练集是黑底白字，所以这里需要翻转一下
    for i in range(28):
        for j in range(28):
            if img_arr[i][j] < 200:
                img_arr[i][j] = 255
            else:
                img_arr[i][j] = 0    


    # 将图片像素值归一化，将像素值从0-255归一化到0-1，神经网络通常在输入图像时期期望数据处于0-1之间，这样有助于加快收敛速度
    img_arr = img_arr / 255.0
    
    # 添加一个新的轴，拓展图像数组的纬度，使之变成(1,28,28)
    x_predict = img_arr[tf.newaxis, ...]
    
    # 预测
    result = model.predict(x_predict)
    
    # 获取概率最大的元素的索引
    pred = tf.argmax(result, axis=1)
    
    print('\n')
    tf.print(f'{image_path} ==> {pred}')
    