In [2]:
from keras.layers import Dropout
from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Flatten, Dense
from keras.optimizers import SGD
from keras.applications.vgg16 import VGG16
import matplotlib.pyplot as plt
import time

# 1.数据预处理
data_path: 数据集路径
return: train, test:处理后的训练集数据、测试集数据

In [3]:
def processing_data(data_path):
    # 生成训练集
    train_data = ImageDataGenerator(
            # 浮点数，图片宽度的某个比例，数据提升时图片水平偏移的幅度
            width_shift_range=0.1,
            # 浮点数，图片高度的某个比例，数据提升时图片竖直偏移的幅度
            height_shift_range=0.1,
            # 浮点数，剪切强度（逆时针方向的剪切变换角度）
            shear_range=0.1,  
            # 随机缩放的幅度，若为浮点数，则相当于[lower,upper] = [1 - zoom_range, 1+zoom_range]
            zoom_range=0.1,
            # 布尔值，进行随机水平翻转
            horizontal_flip=True,
            # 对图片的每个像素值均乘上这个放缩因子，把像素值放缩到0和1之间有利于模型的收敛
            vertical_flip=True,
            # 在 0 和 1 之间浮动。用作验证集的训练数据的比例
            rescale=1. / 225
            )
 
    # 生成测试集
    validation_data = ImageDataGenerator(
            rescale=1./ 255,
            )
 
    # 以文件夹路径为参数,生成经过归一化后的数据,在一个无限循环中无限产生batch数据
    train_generator = train_data.flow_from_directory(
            # 提供的路径下面需要有子目录
            data_path, 
            # 整数元组 (height, width)，默认：(256, 256)。 所有的图像将被调整到的尺寸。
            target_size=(150, 150),
            # 一批数据的大小
            batch_size=256,
            # "categorical", "binary", "sparse", "input" 或 None 之一。
            # 默认："categorical",返回one-hot 编码标签。
            class_mode='categorical',
            )
    validation_generator = validation_data.flow_from_directory(
            data_path,
            target_size=(150, 150),
            batch_size=256,
            class_mode='categorical',
            )
 
    return train_generator, validation_generator

In [None]:

def model(train_generator, validation_generator, save_model_path, epochs):
    start = time.time()
 
    '''
    使用keras的已封装的vgg16建立一个模型，构建的模型会将VGG16顶层（全连接层）
去掉只保留其余的网络结构（去掉全连接层，前面都是卷积层）
    weights='imagenet' 使用ImageNet上预训练的模型，用ImageNet的参数初始化模型的参数
    include_top = False 是否包含最上层的全连接层 表明迁移除顶层以外的其余网络结构到自己的模型中
    input_shape 输入进来的数据是150*150 3通道
    通过.add()方法一个个的将layer加入模型中
    '''
    vgg16_model = VGG16(weights='imagenet', include_top=False, input_shape=(150,150,3))
    top_model = Sequential()
    # Flatten层用来将输入“压平”，即把多维的输入一维化，常用在从卷积层到全连接层的过渡
    top_model.add(Flatten(input_shape=vgg16_model.output_shape[1:]))
    # dense 全连接 activation: 激活函数
    top_model.add(Dense(256, activation='relu'))
    top_model.add(Dropout(0.5))
    top_model.add(Dense(4, activation='softmax'))
 
    model = Sequential()
    model.add(vgg16_model)
    model.add(top_model)
 
    # 配置模型学习过程
    model.compile(
             # 优化器, 主要有Adam、sgd、rmsprop等方式
            # SGD 每次更新时对每个样本进行梯度更新, 一次只进行一次更新，就没有冗余，而且比较快，并且可以新增样本
            # lr: float >= 0. 学习率, momentum: float >= 0. 参数，用于加速 SGD 在相关方向上前进，并抑制震荡
            optimizer=SGD(lr=1e-3, momentum=0.9),
            # 损失函数,多分类采用 categorical_crossentropy（亦称作多类的对数损失）
            loss='categorical_crossentropy',
            # 评价函数 训练和测试期间的模型评估标准 除了损失函数值之外的特定指标, 分类问题一般都是准确率
            metrics=['accuracy'])
 
    # 训练
    # 返回一个history 记录了训练过程 fit_generator分批次读取 逐个生成数据的batch并进行训练
    model.fit_generator(
            # generator:生成器函数 一个生成器或 Sequence 对象的实例
            generator=train_generator,
            # epochs: 整数，数据的迭代总轮数。
            epochs=epochs,
            # 每轮步数 一个epoch包含的步数,通常应该等于你的数据集的样本数量除以批量大小。
            steps_per_epoch=10412 //256,
            # 验证集
            validation_data=validation_generator,
             # 在验证集上,一个epoch包含的步数,通常应该等于你的数据集的样本数量除以批量大小。
            validation_steps=4608// 256,
            )
    model.save(save_model_path)
    end = time.time()
    print("训练完毕,模型已保存！总耗时：%d 秒" % (end - start)) 
    return model
 
epochs =3
# 数据集路径
data_path ='train/'
# 保存模型路径和名称
save_model_path = 'results/model_20.h5'
# 获取数据
train_generator, validation_generator = processing_data(data_path)
# 创建、训练和保存模型
model(train_generator, validation_generator, save_model_path, epochs)

Found 10412 images belonging to 4 classes.
Found 10412 images belonging to 4 classes.
Epoch 1/3


In [None]:
# coding=utf-8
from keras.models import load_model
from model_cret import processing_data
import matplotlib.pyplot as plt
 
# 评估模型
def evaluate_mode(validation_generator):
    # 加载模型
    model = load_model('results/model_20.h5')
 
    history = model.fit_generator(
        # 一个生成器或 Sequence 对象的实例
        generator=train_generator,
        # epochs: 整数，数据的迭代总轮数。
        epochs=20,
        # 一个epoch包含的步数,通常应该等于你的数据集的样本数量除以批量大小。
        steps_per_epoch=2259 // 16,
        # 验证集
        validation_data=validation_generator,
        # 在验证集上,一个epoch包含的步数,通常应该等于你的数据集的样本数量除以批量大小。
        validation_steps=248 // 16,
    )
 
    plt.figure()
    plt.plot(history.history['acc'])
    plt.plot(history.history['val_acc'])
    plt.title('model accuracy')
    plt.ylabel('accuracy')
    plt.xlabel('epoch')
    plt.legend(['train', 'test'], loc='upper left')
    plt.savefig('model_accuracy.png')
 
    plt.figure()
    plt.plot(history.history['loss'])
    plt.plot(history.history['val_loss'])
    plt.title('model loss')
    plt.ylabel('loss')
    plt.xlabel('epoch')
    plt.legend(['train', 'test'], loc='upper left')
    plt.savefig('model_loss.png')
    plt.show()
 
    # 获取验证集的 loss 和 accuracy
    loss, accuracy = model.evaluate_generator(validation_generator)
    print("模型评估：")
    print("Loss: %.2f, Accuracy: %.2f%%" % (loss, accuracy * 100))
 
    print(model.summary())
 
# 数据集路径
data_path = 'dataset/'
train_generator, validation_generator = processing_data(data_path)
evaluate_mode(validation_generator)

In [None]:
# coding=utf-8
from keras.preprocessing import image
from keras.models import load_model
import numpy as np
import cv2
 
"""
    加载模型和模型预测
    主要步骤:
        1.加载模型
        2.图片处理
        3.用加载的模型预测图片的类别
    :param img: PIL.Image 对象
    :return: string, 模型识别图片的类别, 
            共 'cardboard','glass','metal','paper','plastic','trash' 6 个类别
"""
def predict(img_path):
    # 把图片转换成为numpy数组
    img = image.load_img(img_path, target_size=(150, 150))
    img = image.img_to_array(img)
 
    # 加载模型,加载请注意 model_path 是相对路径, 与当前文件同级。
    # 如果你的模型是在 results 文件夹下的 dnn.h5 模型，则 model_path = 'results/dnn.h5'
    model_path = 'results/model_20.h5'
    # 加载模型
    model = load_model(model_path)
 
    # expand_dims的作用是把img.shape转换成(1, img.shape[0], img.shape[1], img.shape[2])
    # 给函数增加维度
    x = np.expand_dims(img, axis=0)
    # 模型预测
    y = model.predict(x)
 
    # 获取labels
    labels = {0: 'cardboard', 1: 'glass', 2: 'metal', 3: 'paper', 4: 'plastic', 5: 'trash'}
    predict = labels[np.argmax(y)]
 
    # 返回图片的类别
    return predict
 
img_path = 'testImg/cardboard2.jpg'
frame = cv2.imread(img_path)
# 定义字体
font = cv2.FONT_HERSHEY_SIMPLEX
cv2.putText(frame, predict(img_path), (10, 140), font, 3, (255, 0, 0), 2, cv2.LINE_AA)
cv2.imwrite('results/pred.png', frame)
cv2.imshow('img', frame)
cv2.waitKey(0)
cv2.destroyAllWindows()

In [None]:
# coding=utf-8
import tkinter as tk
from tkinter import *
from tkinter import ttk
from PIL import Image, ImageTk
 
# 创建窗口 设定大小并命名
window = tk.Tk()
window.title('垃圾分类')
window.geometry('1050x500')
global img_png           # 定义全局变量 图像的
var = tk.StringVar()    # 这时文字变量储存器
 
mainframe = ttk.Frame(window, padding="5 4 12 12")
mainframe.grid(column=0, row=0, sticky=(N, W, E, S))
mainframe.columnconfigure(0, weight=1)
mainframe.rowconfigure(0, weight=1)
 
def openImg():
    global img_png
    var.set('已打开')
    Img = Image.open('testImg/cardboard2.jpg')
    img_png = ImageTk.PhotoImage(Img)
    label_Img2 = tk.Label(image=img_png).grid(column=2, row=2, sticky=W)
 
num = 1
def change():       #更新图片操作
    global num
    var.set('已预测')
    num=num+1
    if num%3==0:
        url1="results/pred.png"
        pil_image = Image.open(url1)
        img= ImageTk.PhotoImage(pil_image)
        label_img.configure(image = img)
    window.update_idletasks()   #更新图片，必须update
 
# row = 1
# epochs = StringVar()
# ttk.Label(mainframe, text="epochs:").grid(column=1, row=1, sticky=W)
# addr_entry = ttk.Entry(mainframe, width=7, textvariable=epochs)
# addr_entry.grid(column=2, row=1, sticky=(W, E))
#
# ttk.Button(mainframe, text="Train").grid(column=4, row=1, sticky=W)
 
# row = 2
ttk.Button(mainframe, text="打开", command=openImg).grid(column=1, row=2, sticky=W)
ttk.Button(mainframe, text="预测", command=change).grid(column=3, row=2, sticky=W)
 
# row = 3 创建文本窗口，显示当前操作状态
ttk.Label(mainframe, text="状态").grid(column=1, row=3, sticky=W)
ttk.Label(mainframe, textvariable=var).grid(column=3, row=3, sticky=W)
 
url = "testImg/logo.jpg"
pil_image = Image.open(url)
img= ImageTk.PhotoImage(pil_image)
label_img = ttk.Label(window, image = img ,compound=CENTER)
label_img.grid(column=0, row=2, sticky=W)
 
# 运行整体窗口
window.mainloop()