<a href="https://colab.research.google.com/github/jimmy-pink/colab-playground/blob/main/pre-trained/vgg16.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## 使用VGG16预训练模型

### 需求描述

[💾 Google Drive：训练数据集](https://drive.google.com/drive/folders/1xwtf91GSyeIc7ohpCKsDCYv3zXgKa0sf)

有一批约800张文件夹图标的png图片，需要将这批图片分类：  

- 按形状分
  - 标准
  - 折叠1
  - 折叠2
  - 折叠3
  - 折叠4
  - 长方形-长
  - 长方形-短
  - 文件堆叠

简化问题：只分两种： 标准文件夹样式，  其他   
简化的二分类问题，也能够从大批量爬取图片中筛选较为优质的图标

#### 迭代训练（Iterative Training） + 主动学习（Active Learning）

主动学习（Active Learning）

- 核心思想：模型主动选择“最有价值”的数据（通常是难以分类的样本）进行标注，而非随机标注。
- 模型通过预测筛选出 False Positive（FP） 和 False Negative（FN） 的样本（即错误预测数据），人工修正标签后重新训练，属于主动学习的典型应用。


Bootstrapping（自举法）

- 通过迭代训练逐步提升模型性能，每一轮用当前模型预测未标注数据，筛选高置信度或易错样本加入训练集。

课程学习（Curriculum Learning）
- 从简单样本（少量初始数据）开始训练，逐步加入更难样本（错误预测数据）。

In [1]:
import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.applications import VGG16
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten, Dropout
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.callbacks import Callback
from tensorflow.keras import regularizers
from tensorflow.keras.preprocessing import image
from tensorflow.keras.applications.vgg16 import preprocess_input

import os
import shutil

In [2]:
from google.colab import drive
drive.mount('/content/drive')

# 挂载 Google Drive
base_dir = '/content/drive/MyDrive/Google-AI-Studio/data/folder-icon-images/'  # Google Drive 中的图像文件夹路径
train_dir=base_dir+'is_folder'
drive_train_validate_dir = base_dir + "train_validate"

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


## 识别标准文件夹的模型训练

二分类问题  
本模型负责判断一个图片是否是标准的文件夹形状

### 准备数据

### 数据处理与划分

In [3]:
# 设置数据增强
train_datagen = ImageDataGenerator(rescale=1./255,
                                   horizontal_flip=True)

# 使用 flow_from_directory 加载训练数据
# 数据增强 + 归一化
train_datagen = ImageDataGenerator(
    rescale=1./255,
    horizontal_flip=True,
    validation_split=0.3  # 30% 作为验证集
)

# 训练集生成器
train_generator = train_datagen.flow_from_directory(
    train_dir,
    target_size=(224, 224),  # VGG16 需要 224x224，将原图转成224*224
    batch_size=32,
    class_mode='binary',  # 二分类用 binary，多分类用 categorical
    subset='training'  # 指定是训练集
)

# 验证集生成器
validation_generator = train_datagen.flow_from_directory(
    train_dir,
    target_size=(224, 224),
    batch_size=32,
    class_mode='binary',
    subset='validation'  # 指定是验证集
)
print(f"找到的训练样本数: {train_generator.samples}")
print(f"找到的验证样本数: {validation_generator.samples}")
images, labels = next(train_generator)
print("图像形状:", images.shape)  # 应为 (batch_size, 224, 224, 3)
print("标签形状:", labels.shape)

Found 798 images belonging to 2 classes.
Found 341 images belonging to 2 classes.
找到的训练样本数: 798
找到的验证样本数: 341




图像形状: (32, 224, 224, 3)
标签形状: (32,)


### 定义模型

In [4]:
base_model = VGG16(weights='imagenet', include_top=False, input_shape=(224, 224, 3))

# Freeze the base model layers
for layer in base_model.layers:
    layer.trainable = False

In [5]:
model = Sequential([
    base_model,  # 假设你已经加载了预训练模型，如 VGG16
    Flatten(),
    Dense(1024, activation='relu',
          kernel_regularizer=regularizers.l2(0.01)),  # 添加L2正则化
    Dropout(0.5),  # 添加Dropout层，丢弃50%的神经元
    Dense(1, activation='sigmoid')  # 最后一层对于二分类任务使用sigmoid激活
])
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

### 模型训练

In [7]:
class myCallback(Callback):
    def on_epoch_end(self, epoch, logs={}):
        if(logs.get('val_accuracy') >= 0.98 and logs.get('val_loss') < 0.2 ):
            self.model.stop_training = True
callbacks = myCallback()
# 训练模型
model.fit(train_generator,
          epochs=100,
          validation_data=validation_generator,
          callbacks=[callbacks])

Epoch 1/100
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m11s[0m 441ms/step - accuracy: 1.0000 - loss: 0.1832 - val_accuracy: 1.0000 - val_loss: 0.1092


<keras.src.callbacks.history.History at 0x7d612c62f990>

In [8]:
# 可选： 模型保存
save_dir = '/content/drive/MyDrive/Google-AI-Studio/saved_models'
# 如果目录不存在，则创建
if not os.path.exists(save_dir):
    os.makedirs(save_dir)

In [9]:
model.save(f'{save_dir}/folder_icon_shape_isstandard_predict_model.h5')



### 模型评估

### 模型预测

In [None]:
drive_test_dir = base_dir + "test_is_folder"

In [None]:
def predict_image(model, img_path):
    # 1. 加载图片并调整为模型输入大小
    img = image.load_img(img_path, target_size=(224, 224))  # 对图像进行大小调整
    img_array = image.img_to_array(img)  # 转换为数组
    img_array = np.expand_dims(img_array, axis=0)  # 增加一个维度，符合批量输入要求

    # 2. 预处理图像（根据模型的预处理要求）
    img_array = preprocess_input(img_array)  # 对图像进行预处理（适应VGG16的要求）

    # 3. 使用模型进行预测
    prediction = model.predict(img_array)  # 预测结果

    # 4. 返回预测结果
    return prediction

In [None]:
# 使用模型进行预测
for item in os.listdir(drive_test_dir):
    item_path = os.path.join(drive_test_dir, item)
    if os.path.isfile(item_path):
        prediction = predict_image(model, item_path)  # 传递正确的路径
        if prediction > 0.5:
            # 输出预测结果
            print(f"{item_path} Prediction:", prediction)

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 2s/step
/content/drive/MyDrive/data/folder-icon-images/test_folder_recognition/test-1.png Prediction: [[1.]]
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 36ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 36ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 35ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 35ms/step
/content/drive/MyDrive/data/folder-icon-images/test_folder_recognition/test-5.jpeg Prediction: [[1.]]
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 42ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 41ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 51ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 50ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 43ms/step
/content/drive/MyDrive/data/folder-icon-images/test_folder_recognition/book-fol

现在 模型可以判断如些是标准的文件夹图片