## 如何从TensorFlow的mnist数据集导出手写体数字图片

In [2]:
import os  
import tensorflow as tf  
from tensorflow.examples.tutorials.mnist import input_data  
  
from PIL import Image  

In [3]:
# 声明图片宽高  
rows = 28  
cols = 28  
  
# 要提取的图片数量  
images_to_extract = 8000  
  
# 当前路径下的保存目录  
save_dir = "./mnist_digits_images"  
  
# 读入mnist数据  
mnist = input_data.read_data_sets("MNIST_data/", one_hot=False)  

Successfully downloaded train-images-idx3-ubyte.gz 9912422 bytes.
Extracting MNIST_data/train-images-idx3-ubyte.gz
Successfully downloaded train-labels-idx1-ubyte.gz 28881 bytes.
Extracting MNIST_data/train-labels-idx1-ubyte.gz
Successfully downloaded t10k-images-idx3-ubyte.gz 1648877 bytes.
Extracting MNIST_data/t10k-images-idx3-ubyte.gz
Successfully downloaded t10k-labels-idx1-ubyte.gz 4542 bytes.
Extracting MNIST_data/t10k-labels-idx1-ubyte.gz


In [4]:
# 创建会话  
sess = tf.Session()  
  
# 获取图片总数  
shape = sess.run(tf.shape(mnist.train.images))  
images_count = shape[0]  
pixels_per_image = shape[1]  
  
# 获取标签总数  
shape = sess.run(tf.shape(mnist.train.labels))  
labels_count = shape[0]  
  
# mnist.train.labels是一个二维张量，为便于后续生成数字图片目录名，有必要一维化(后来发现只要把数据集的one_hot属性设为False，mnist.train.labels本身就是一维)  
#labels = sess.run(tf.argmax(mnist.train.labels, 1))  
labels = mnist.train.labels  
  
# 检查数据集是否符合预期格式  
if (images_count == labels_count) and (shape.size == 1):  
    print ("数据集总共包含 %s 张图片，和 %s 个标签" % (images_count, labels_count))  
    print ("每张图片包含 %s 个像素" % (pixels_per_image))  
    print ("数据类型：%s" % (mnist.train.images.dtype))  

# mnist图像数据的数值范围是[0,1]，需要扩展到[0,255]，以便于人眼观看  
    if mnist.train.images.dtype == "float32":  
        print ("准备将数据类型从[0,1]转为binary[0,255]...")  
        for i in range(0,images_to_extract):  
            for n in range(pixels_per_image):  
                if mnist.train.images[i][n] != 0:  
                    mnist.train.images[i][n] = 255  
            # 由于数据集图片数量庞大，转换可能要花不少时间，有必要打印转换进度  
            if ((i+1)%50) == 0:  
                print ("图像浮点数值扩展进度：已转换 %s 张，共需转换 %s 张" % (i+1, images_to_extract))  
  # 创建数字图片的保存目录  
    for i in range(10):  
        dir = "%s/%s/" % (save_dir,i)  
        if not os.path.exists(dir):  
            print ("目录 ""%s"" 不存在！自动创建该目录..." % dir)  
            os.makedirs(dir)  

            
# 通过python图片处理库，生成图片  
    indices = [0 for x in range(0, 10)]  
    for i in range(0,images_to_extract):  
        img = Image.new("L",(cols,rows))  
        for m in range(rows):  
            for n in range(cols):  
                img.putpixel((n,m), int(mnist.train.images[i][n+m*cols]))  
        # 根据图片所代表的数字label生成对应的保存路径  
        digit = labels[i]  
        path = "%s/%s/%s.bmp" % (save_dir, labels[i], indices[digit])  
        indices[digit] += 1  
        img.save(path)  
        # 由于数据集图片数量庞大，保存过程可能要花不少时间，有必要打印保存进度  
        if ((i+1)%50) == 0:  
            print ("图片保存进度：已保存 %s 张，共需保存 %s 张" % (i+1, images_to_extract))  

else:  
    print ("图片数量和标签数量不一致！")  

数据集总共包含 55000 张图片，和 55000 个标签
每张图片包含 784 个像素
数据类型：float32
准备将数据类型从[0,1]转为binary[0,255]...
图像浮点数值扩展进度：已转换 50 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 100 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 150 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 200 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 250 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 300 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 350 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 400 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 450 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 500 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 550 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 600 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 650 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 700 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 750 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 800 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 850 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 900 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 950 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 1000 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 1050 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 1100 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 1150 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 1200 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 1250 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 1300 张，共需转换 8000 张
图像浮点数值扩展进度：已转换 1350 张，共需转换 8000 张
图像浮点数值扩展进度：已

图片保存进度：已保存 3850 张，共需保存 8000 张
图片保存进度：已保存 3900 张，共需保存 8000 张
图片保存进度：已保存 3950 张，共需保存 8000 张
图片保存进度：已保存 4000 张，共需保存 8000 张
图片保存进度：已保存 4050 张，共需保存 8000 张
图片保存进度：已保存 4100 张，共需保存 8000 张
图片保存进度：已保存 4150 张，共需保存 8000 张
图片保存进度：已保存 4200 张，共需保存 8000 张
图片保存进度：已保存 4250 张，共需保存 8000 张
图片保存进度：已保存 4300 张，共需保存 8000 张
图片保存进度：已保存 4350 张，共需保存 8000 张
图片保存进度：已保存 4400 张，共需保存 8000 张
图片保存进度：已保存 4450 张，共需保存 8000 张
图片保存进度：已保存 4500 张，共需保存 8000 张
图片保存进度：已保存 4550 张，共需保存 8000 张
图片保存进度：已保存 4600 张，共需保存 8000 张
图片保存进度：已保存 4650 张，共需保存 8000 张
图片保存进度：已保存 4700 张，共需保存 8000 张
图片保存进度：已保存 4750 张，共需保存 8000 张
图片保存进度：已保存 4800 张，共需保存 8000 张
图片保存进度：已保存 4850 张，共需保存 8000 张
图片保存进度：已保存 4900 张，共需保存 8000 张
图片保存进度：已保存 4950 张，共需保存 8000 张
图片保存进度：已保存 5000 张，共需保存 8000 张
图片保存进度：已保存 5050 张，共需保存 8000 张
图片保存进度：已保存 5100 张，共需保存 8000 张
图片保存进度：已保存 5150 张，共需保存 8000 张
图片保存进度：已保存 5200 张，共需保存 8000 张
图片保存进度：已保存 5250 张，共需保存 8000 张
图片保存进度：已保存 5300 张，共需保存 8000 张
图片保存进度：已保存 5350 张，共需保存 8000 张
图片保存进度：已保存 5400 张，共需保存 8000 张
图片保存进度：已保存 5450 张，共需保存 8000 张
图片保存进度：已保存