In [3]:
（1）mnist_test_conv.py代碼如下
#! /usr/bin/env python2
# -*- coding: utf-8 -*-
 
'''
構造一個卷積神經網絡來訓練mnist：
輸入層： 784個輸入節點
兩個卷積層（每個都具有一個卷積和Pooling操作）：
	卷積操作：步長為1，邊距為0，filter: 5x5
	Pooling(池化): 採用maxpooing, 2x2矩陣作為模板
輸出層： 10個輸出節點
'''
 
import input_data
import tensorflow as tf
import argparse
import numpy as np
import os
import struct
 
#定義初始化操作
def weight_variable(shape):
	init = tf.truncated_normal(shape, stddev=0.1)
	return tf.Variable(init)
 
def bias_variable(shape):
	init = tf.constant(0.1, shape = shape)
	return tf.Variable(init)
 
#定義卷積和池化操作
'''
卷積後的圖像高寬計算公式： W2 = (W1 - Fw + 2P) / S + 1
其中：Fw為filter的寬，P為周圍補0的圈數，S是步幅
'''
def conv2d(x, W):
	return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME')
 
def max_pool_2x2(x):
	return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')
 
'''
(1) 數據加載
'''
#mnist數據路徑
mnist_data_path = "/home/fcx/share/test/deeplearning/mnist/mnist_data"
#加載mnist數據
mnist_data = input_data.read_data_sets(mnist_data_path, one_hot=True)
 
'''
(2) 輸入層，輸入張量x定義
'''
#神經網絡輸入層變量x定義
with tf.name_scope('input_layer'):
	x = tf.placeholder("float", [None, 784]) #可以存放n個784（28x28）的數組
 
'''
(3) 第一層卷積層
'''
with tf.name_scope('conv_layer_1'):
	#定義卷積操作的filter為5x5的矩陣，且輸出32個feature map, 輸入的圖片的通道數為1，因為是灰度圖像
	W_conv1 = weight_variable([5, 5, 1, 32])
	b_conv1 = bias_variable([32])
	#先將圖像數據進行維度的變化
	x_image = tf.reshape(x, [-1, 28, 28, 1]) # 28x28的單通道圖像
	#卷積操作
	'''
	輸出h_conv1維度為：[-1, 28, 28, 32], 之所以還是28x28是因為參數padding='SAME'
	如果採用padding='VALID'則輸出為24x24, 用公式W2 = (W1 - Fw + 2P) / S + 1，24 = (28 - 5 + 2 * 0) / 1 + 1
	'''
	h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1)
	#將卷積完的結果進行pooling操作
	#輸出h_pool1維度為：[-1, 14, 14, 32]
	h_pool1 = max_pool_2x2(h_conv1)
 
'''
(3) 第二層卷積層
'''
with tf.name_scope('conv_layer_2'):
	#定義卷積操作的map為5x5的矩陣，且輸出64個feature map, 輸入的圖片的通道數為32
	W_conv2 = weight_variable([5, 5, 32, 64])
	b_conv2 = bias_variable([64])
	#卷積操作
	#輸出h_conv2維度為：[-1, 14, 14, 64]
	h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2)
	#將卷積完的結果進行pooling操作
	#輸出h_pool2維度為：[-1, 7, 7, 64]
	h_pool2 = max_pool_2x2(h_conv2)
#到此為止一張28x28的圖片就變成了64個7x7的矩陣
 
'''
(4) 全連接層定義（full connection layer）
'''
with tf.name_scope('full_connection_layer'):
	#卷積層2輸出作為輸入和隱藏層之間的權重矩陣W_fc1,偏置項b_fc1初始化
	#定義隱藏層的節點數
	hide_neurons = 1024
	#W_fc1 = weight_variable([7*7*64, hide_neurons])
	#計算卷積層2輸出的tensor，變化為一維的大小
	h_pool2_shape = h_pool2.get_shape().as_list() #得到一個列表[batch, hight, width, channels]
	fc_input_size = h_pool2_shape[1] * h_pool2_shape[2] * h_pool2_shape[3] # hight * width * channels
	W_fc1 = weight_variable([fc_input_size, hide_neurons])
	b_fc1 = bias_variable([hide_neurons])
	#將卷積層2的輸出張量扁平化作為全連接神經網絡的輸入
	fc_x = tf.reshape(h_pool2, [-1, fc_input_size])
	#全連接層中隱藏層的輸出
	fc_h = tf.nn.relu(tf.matmul(fc_x, W_fc1) + b_fc1)
 
	#為了減少過擬合，在隱藏層和輸出層之間加人dropout操作。
	#用來代表一個神經元的輸出在dropout中保存不變的概率。
	#在訓練的過程啟動dropout，在測試過程中關閉dropout
	keep_prob = tf.placeholder("float")
	drop_fc_h = tf.nn.dropout(fc_h, keep_prob)
 
	#隱藏層到輸出層
	W_fc2 = weight_variable([hide_neurons, 10])
	b_fc2 = bias_variable([10])
	y = tf.nn.softmax(tf.matmul(drop_fc_h, W_fc2) + b_fc2)
 
'''
(5) 設置訓練方法，及其他超參數
'''
#設置期待輸出值
y_ = tf.placeholder("float", [None, 10])
#設置損失函數為交叉嫡函數(negative log-likelihood函數)
cross_entropy = -tf.reduce_sum(y_ * tf.log(y))
#單步訓練操作,使用梯度下降算法,學習速率：0.01，損失函數：cross_entropy
#train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy)
#使用更複雜的ADAM優化器來做梯度最速下降
train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)
#初始化
init = tf.initialize_all_variables()
 
#定義saver用來保存訓練好的模型參數
saver = tf.train.Saver()
 
#定義檢測正確率的方法
correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1)) #用向量y和y_中的最大值進行比較
accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float")) #對正確率求均值
 
def train_and_test():
	#建立會話
	with tf.Session() as sess:
		'''
		(6) 開始訓練
		'''
		#執行初始化
		sess.run(init)
 
		#開始訓練10000次
		for i in range(10000):
			tran_sets_batch = mnist_data.train.next_batch(100) #每次取得100個樣本
			sess.run(train_step, feed_dict={x: tran_sets_batch[0], y_: tran_sets_batch[1], keep_prob: 0.5})
 
			#每100次訓練完都檢測下測試的正確率,只從5000個測試樣本中簡單抽取100個進行測試
			if i % 100 == 0:
				validation_sets_batch = mnist_data.validation.next_batch(100)
				cur_rate = sess.run(accuracy, feed_dict = {x: validation_sets_batch[0], y_: validation_sets_batch[1], keep_prob: 1})
				print('epoch %d accuracy: %s' % (i, cur_rate))
 
		#保存訓練後的模型參數
		saver.save(sess, './save_model_data_conv/model.ckpt')
 
		'''
		(7) 用訓練好的模型測試10000個樣本最終的準確度
		'''
		#這樣會報Resource Exhausted 顯存資源不足的錯誤
		#rate = sess.run(accuracy, feed_dict = {x: mnist_data.test.images, y_: mnist_data.test.labels, keep_prob: 1})
		#print('Mean Accuracy is %s' % rate)
 
		#只好多次加載統計結果
		sum_rate = 0
		for i in range(100):
			test_sets_batch = mnist_data.test.next_batch(100)
			epoch_rate = sess.run(accuracy, feed_dict = {x: test_sets_batch[0], y_: test_sets_batch[1], keep_prob: 1})
			sum_rate = sum_rate + epoch_rate
		print('Mean Accuracy is %s' % (sum_rate / 100))
 
 
#檢驗是否是bmp圖片 54字節頭 + 數據部分
def checkIsBmp(file):
	with open(file, 'rb') as f:
		head = struct.unpack('<ccIIIIIIHH', f.read(30)) #將讀取到的30個字節，轉換為指定數據類型的數字
		#print(head)
		if head[0] == b'B' and head[1] == b'M':
			#print('%s 總大小：%d, 圖片尺寸：%d X %d, 顏色數：%d' % (file, head[2], head[6], head[7], head[9]))
			return True, head[2], head[9] #返回圖片總大小，以及一個像素用多少bit表示
		else:
			#print('%s 不是Bmp圖片' % file)
			return False, 0, 0
 
def test_my_data():
	with tf.Session() as sess:
		''' 恢復訓練好的數據 '''
		model_data = tf.train.latest_checkpoint('./save_model_data_conv/')
		saver.restore(sess, model_data)
		'''
		#只好多次加載統計結果
		sum_rate = 0
		for i in range(100):
			test_sets_batch = mnist_data.test.next_batch(100)
			epoch_rate = sess.run(accuracy, feed_dict = {x: test_sets_batch[0], y_: test_sets_batch[1], keep_prob: 1})
			sum_rate = sum_rate + epoch_rate
		print('The Accuracy tested by MNIST Test samples is: %s' % (sum_rate / 100))
		'''
 
		print('Start recognizing my image:')
		my_data_path = './my_test_images/'
		print(os.listdir(my_data_path))
		for image_name in os.listdir(my_data_path):
			image_path = os.path.join(my_data_path, image_name)
			ret, file_size, bitCnt_per_pix = checkIsBmp(image_path)
			if ret == True:
				with open(image_path, 'rb') as f:
					formate = '%dB' % file_size
					data_bytes = struct.unpack(formate, f.read(file_size)) #按unsigned char 讀取文件
					image_np = np.zeros((1, 784))
					#print(image_np.shape)
					step = bitCnt_per_pix / 8
					start_pos = 54  #54字節的頭信息
					if bitCnt_per_pix == 8: #如果是8位深度的bmp圖片，有調色板
						start_pos = start_pos + 1024 #1024字節的調色板
		
					for i in range(784):
						pos = start_pos + i * step
						if bitCnt_per_pix == 8:
							pix_value = data_bytes[pos]
						elif bitCnt_per_pix == 24:
							#gray = red * 0.299 + green * 0.587 + blue * 0.114 RGB和灰度圖的轉換
							pix_value = data_bytes[pos] * 0.299 + data_bytes[pos+1] * 0.587 + data_bytes[pos+2] * 0.114
						image_np[0][i] = pix_value / 255.0 # [0..255] --> [0.0... 1.0]
						#print(image_np[0][i])
					max_idx, out = sess.run([tf.argmax(y, 1), y], feed_dict = {x: image_np, keep_prob: 1})
					print('####The image name: %s, predict number is: %d' % (image_name, max_idx))
 
def main(_):
	if ARGS.test:
		print('************** Predict by Neural network ***************')
		test_my_data()
	else:
		print('************** Train and Test accuracy of Neural network ***************')
		train_and_test()
 
if __name__ == '__main__':
	parser = argparse.ArgumentParser()
	parser.add_argument(
		'-t',
		'--test',
		default = False,
		action = 'store_true',
		help = 'Excute training network or testing network.'
		)
  
	ARGS = parser.parse_args()
	print('ARGS: %s' % ARGS)
	tf.app.run()
 
'''
(1)tf.argmax(input, axis=None, name=None, dimension=None)
此函數是對矩陣按行或列計算最大值
參數
    input：輸入Tensor
    axis：0表示按列，1表示按行
    name：名稱
    dimension：和axis功能一樣，默認axis取值優先。新加的字段
返回：Tensor 行或列的最大值下標向量
(2)tf.equal(a, b)
此函數比較等維度的a, b矩陣相應位置的元素是否相等，相等返回True,否則為False
返回：同維度的矩陣，元素值為True或False
(3)tf.cast(x, dtype, name=None)
將x的數據格式轉化成dtype.例如，原來x的數據格式是bool，
那麼將其轉化成float以後，就能夠將其轉化成0和1的序列。反之也可以
(4)tf.reduce_max(input_tensor, reduction_indices=None, keep_dims=False, name=None)
 功能：求某維度的最大值
(5)tf.reduce_mean(input_tensor, reduction_indices=None, keep_dims=False, name=None)
功能：求某維度的均值
參數1--input_tensor:待求值的tensor。
參數2--reduction_indices:在哪一維上求解。0表示按列，1表示按行
參數（3）（4）可忽略
例：x = [ 1, 2
		  3, 4]
x = tf.constant([[1,2],[3,4]], "float")
tf.reduce_mean(x) = 2.5
tf.reduce_mean(x, 0) = [2, 3]
tf.reduce_mean(x, 1) = [1.5, 3.5]
(6)tf.truncated_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=None)
從截斷的正態分佈中輸出隨機值
    shape: 輸出的張量的維度尺寸。
    mean: 正態分佈的均值。
    stddev: 正態分佈的標準差。
    dtype: 輸出的類型。
    seed: 一個整數，當設置之後，每次生成的隨機數都一樣。
    name: 操作的名字。
（7）tf.random_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=None)
從標準正態分佈中輸出隨機值
(8) tf.nn.conv2d(input, filter, strides, padding, 
				 use_cudnn_on_gpu=None, data_format=None, name=None)
在給定的4D input與 filter下計算2D卷積
	1，輸入shape為 [batch, height, width, in_channels]: batch為圖片數量，in_channels為圖片通道數
	2，第二個參數filter：相當於CNN中的卷積核，它要求是一個Tensor，具有[filter_height, filter_width, 
		in_channels, out_channels]這樣的shape，具體含義是[卷積核的高度，卷積核的寬度，圖像通道數，
		卷積核個數]，要求類型與參數input相同，有一個地方需要注意，第三維in_channels，就是參數input
		的第四維
	3，第三個參數strides：卷積時在圖像每一維的步長，這是一個一維的向量，長度4
	4，第四個參數padding：string類型的量，只能是"SAME","VALID"其中之一，這個值決定了不同的卷積方式（後面會介紹）
	5，第五個參數：use_cudnn_on_gpu:bool類型，是否使用cudnn加速，默認為true
	結果返回一個Tensor，這個輸出，就是我們常說的feature map，shape仍然是[batch, height, width, channels]這種形式。
(9)tf.nn.max_pool(value, ksize, strides, padding, name=None)
參數是四個，和卷積很類似：
第一個參數value：需要池化的輸入，一般池化層接在卷積層後面，所以輸入通常是feature map，
	依然是[batch, height, width, channels]這樣的shape
第二個參數ksize：池化窗口的大小，取一個四維向量，一般是[1, height, width, 1]，因為我們
	不想在batch和channels上做池化，所以這兩個維度設為了1
第三個參數strides：和卷積類似，窗口在每一個維度上滑動的步長，一般也是[1, stride,stride, 1]
第四個參數padding：和卷積類似，可以取'VALID' 或者'SAME'
返回一個Tensor，類型不變，shape仍然是[batch, height, width, channels]這種形式
(10) tf.reshape(tensor, shape, name=None)
函數的作用是將tensor變換為參數shape的形式。
其中shape為一個列表形式，特殊的一點是列表中可以存在-1。-1代表的含義是不用我們自己指定這一維的大小，
函數會自動計算，但列表中只能存在一個-1。（當然如果存在多個-1，就是一個存在多解的方程了）
(11)tf.nn.dropout(x, keep_prob, noise_shape=None, seed=None,name=None) 
為了減少過擬合，隨機扔掉一些神經元，這些神經元不參與權重的更新和運算
參數：
	x            :  輸入tensor
	keep_prob    :  float類型，每個元素被保留下來的概率
	noise_shape  : 一個1維的int32張量，代表了隨機產生“保留/丟棄”標誌的shape。
	seed         : 整形變量，隨機數種子。
	name         : 名字，沒啥用。 
'''

SyntaxError: invalid character in identifier (<ipython-input-3-1a11e5adf3ff>, line 1)

In [2]:
'''Trains a simple convnet on the MNIST dataset.
Gets to 99.25% test accuracy after 12 epochs
(there is still a lot of margin for parameter tuning).
16 seconds per epoch on a GRID K520 GPU.
'''

from __future__ import print_function
import keras
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten
from keras.layers import Conv2D, MaxPooling2D
from keras import backend as K

batch_size = 128
num_classes = 10
epochs = 12

# input image dimensions
img_rows, img_cols = 28, 28

# the data, split between train and test sets
(x_train, y_train), (x_test, y_test) = mnist.load_data()

if K.image_data_format() == 'channels_first':
    x_train = x_train.reshape(x_train.shape[0], 1, img_rows, img_cols)
    x_test = x_test.reshape(x_test.shape[0], 1, img_rows, img_cols)
    input_shape = (1, img_rows, img_cols)
else:
    x_train = x_train.reshape(x_train.shape[0], img_rows, img_cols, 1)
    x_test = x_test.reshape(x_test.shape[0], img_rows, img_cols, 1)
    input_shape = (img_rows, img_cols, 1)

x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
x_train /= 255
x_test /= 255
print('x_train shape:', x_train.shape)
print(x_train.shape[0], 'train samples')
print(x_test.shape[0], 'test samples')

# convert class vectors to binary class matrices
y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)

model = Sequential()
model.add(Conv2D(32, kernel_size=(3, 3),
                 activation='relu',
                 input_shape=input_shape))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(num_classes, activation='softmax'))

model.compile(loss=keras.losses.categorical_crossentropy,
              optimizer=keras.optimizers.Adadelta(),
              metrics=['accuracy'])

model.fit(x_train, y_train,
          batch_size=batch_size,
          epochs=epochs,
          verbose=1,
          validation_data=(x_test, y_test))
score = model.evaluate(x_test, y_test, verbose=0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])

ModuleNotFoundError: No module named 'keras'

In [4]:
import tensorflow as tf
print ("TensorFlow version: " + tf.__version__)

ModuleNotFoundError: No module named 'tensorflow'