## 构建神经网络/深度学习模型的基本步骤

- 数据处理：从本地或URL读取数据，并完成预处理操作（如数据校验、格式转化等），保证模型可读取。
- 模型设计：网络结构设计，相当于模型的假设空间，即模型能够表达的关系集合。
- 训练配置：设定模型采用的寻解算法，即优化器，并指定计算资源。
- 训练过程：循环调用训练过程，每轮都包括前向计算、损失函数（优化目标）和反向传播三个步骤。
- 模型保存：将训练好的模型保存，模型预测时调用。

### 数据处理

- 数据处理包含五个部分：数据导入、数据形状变换、数据集划分、数据归一化处理和封装`load data`函数。
- 数据预处理后，才能被模型调用

In [7]:
import numpy as np
import json

"""数据导入"""

data = np.fromfile(r'../datasets/housing.data', sep=' ')
data

array([6.320e-03, 1.800e+01, 2.310e+00, ..., 3.969e+02, 7.880e+00,
       1.190e+01])

In [8]:
"""数据形状变换

导入的原始数据是1维array，其中array的第0-13项是第一条数据，第14-27项是第二条数据，以此类推...
把数据形状转换成 N * 14 的二维矩阵
"""

feature_names = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE','DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV']
feature_num = len(feature_names)
data = data.reshape([data.shape[0] // feature_num, feature_num])

data.shape

(506, 14)

In [9]:
"""数据集划分

将数据集划分为训练集和测试集，训练集用于确定模型的参数，测试集用于评判模型的效果
"""

ratio = 0.8
offset = int(data.shape[0] * ratio)
training_data = data[:offset]

training_data.shape

(404, 14)

In [11]:
"""数据归一化处理

对每个特征进行归一化处理，使得每个特征的取值缩放到0-1之间
归一化的好处：模型训练更高效；特征前的权重大小可以代表该变量对预测结果的贡献度。
"""

# 计算训练数据集的最大值、最小值和平均值
maximums = training_data.max(axis=0)
minimums = training_data.min(axis=0)
avgs = training_data.sum(axis=0) / training_data.shape[0]

# 对数据进行归一化处理
for i in range(feature_num):
    data[:, i] = (data[:, i] - minimums[i]) / (maximums[i] - minimums[i])
    
data[0]

array([0.        , 0.18      , 0.07344184, 0.        , 0.31481481,
       0.57750527, 0.64160659, 0.26920314, 0.        , 0.22755741,
       0.28723404, 1.        , 0.08967991, 0.42222222])

In [16]:
"""封装成load_data函数"""

def load_data():
    # 从文件导入数据
    data = np.fromfile(r'../datasets/housing.data', sep=' ')
    
    # 数据形状变换
    feature_names = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE','DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV']
    feature_num = len(feature_names)
    data = data.reshape([data.shape[0] // feature_num, feature_num])
    
    # 数据集划分
    ratio = 0.8
    offset = int(data.shape[0] * ratio)
    training_data = data[:offset]
    
    # 归一化处理
    maximums = training_data.max(axis=0)
    minimums = training_data.min(axis=0)
    avgs = training_data.sum(axis=0) / training_data.shape[0]
    
    for i in range(feature_num):
        data[:, i] = (data[:, i] - minimums[i]) / (maximums[i] - minimums[i])
        
    # 返回训练集和测试集
    training_data = data[:offset]
    test_data = data[offset:]
    return training_data, test_data

In [18]:
# 获取数据
training_data, test_data = load_data()
x = training_data[:, :-1]
y = training_data[:, -1:]

print(x[0])
print(y[0])

[0.         0.18       0.07344184 0.         0.31481481 0.57750527
 0.64160659 0.26920314 0.         0.22755741 0.28723404 1.
 0.08967991]
[0.42222222]
