**4.1 机器学习的四个分支**  
监督学习、无监督学习、自监督学习、强化学习

**4.2 评估机器学习模型**  
训练集、验证集和测试集

In [1]:
# 留出验证
def hold_out_validation():
    num_validation_samples = 10000
    
    np.random.shuffle(data) # 通常需要打乱数据
    
    validation_data = data[:num_validation_samples] # 定义验证集
    data = data[num_validation_samples:]
    
    training_data = data[:] # 定义训练集
    
    # 在训练数据上训练模型，并在验证数据上评估模型
    model = get_model()
    model.train(training_data)
    validation_score = model.evaluate(validation_data)
    
    # 现在你可以调节模型、重新训练、评估，然后再次调节
    
    # 一旦调节好超参数，通常就在所有非测试数据上从头开始训练最终模型
    model = get_model()
    model.train(np.concatenate([training_data, validation_data]))
    
    test_score = model.evaluate(test_data)

In [12]:
# K折交叉验证
def K_fold_validation():
    k = 4 
    num_validation_samples = len(data) // k
    
    np.random.shuffle(data)
    
    validation_scores = []
    for fold in range(k):
        # 选择验证数据分区
        validation_data = data[num_validation_samples * fold: num_validation_samples * (fold + 1)]
        
        # 使用剩余数据作为训练数据。注意，+运算符是列表合并，不是求和
        training_data = data[:num_validation_samples * fold] + data[num_validation_samples * (fold + 1):]
        
        model = get_model() # 创建一个全新的模型实例（未训练）
        model.train(training_data)
        validation_score = model.evaluate(validation_data)
        validation_score.append(validation_score)
        
    validation_score = np.average(validation_scores) # 最终验证分数：K折验证分数的平均值
    
    # 在所有非测试数据上训练最终模型
    model = get_model()
    model.train(data)
    test_score = model.evaluate(test_data)

In [13]:
# 数据标准化
def data_std():
    x -= x.mean(axis=0)
    x /= x.std(axis=0)

**4.3 数据预处理、特征工程和特征学习**

**4.4 过拟合与欠拟合**  
获取更多的训练数据  
减小网络大小  
添加权重正则化  
添加dropout正则化

In [15]:
# 原始模型
from keras import models
from keras import layers

model = models.Sequential()
model.add(layers.Dense(16, activation='relu', input_shape=(10000,)))
model.add(layers.Dense(16, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

In [16]:
# 容量更小的模型
model = models.Sequential()
model.add(layers.Dense(4, activation='relu', input_shape=(10000,)))
model.add(layers.Dense(4, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

In [20]:
# 向模型添加L2权重正则化
from keras import regularizers

model = models.Sequential()
model.add(layers.Dense(16, kernel_regularizer=regularizers.l2(0.001),
                       activation='relu', input_shape=(10000,))) # l2正则化
model.add(layers.Dense(16, kernel_regularizer=regularizers.l2(0.001),
                       activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

In [21]:
# Keras中不同的权重正则化项
from keras import regularizers 

regularizers.l1(0.001) # L1正则化

regularizers.l1_l2(l1=0.001, l2=0.002) # 同时做L1和L2正则化

<keras.regularizers.L1L2 at 0x2221eb037f0>

In [24]:
np.random.randint(0, 2, 6)

array([1, 1, 0, 0, 1, 1])

In [25]:
# 向IMDB网络中添加dropout
model = models.Sequential()
model.add(layers.Dense(16, activation='relu', input_shape=(10000,)))
model.add(layers.Dropout(0.5))
model.add(layers.Dense(16, activation='relu'))
model.add(layers.Dropout(0.5))
model.add(layers.Dense(1, activation='sigmoid'))

**4.5 机器学习的通用工作流程**  
定义问题，收集数据集  
选择衡量成功的指标  
确定评估方法  
准备数据  
开发比基准更好的模型  
扩大模型规模：开发过拟合的模型  
模型正则化与调节超参数 