# 神经网络基础

神经网络是深度学习的基础，其灵感来源于生物神经系统。神经网络通过模拟大脑的神经元和突触连接，实现对复杂数据的处理和模式识别。

## 神经网络的组成

一个神经网络由多个神经元组成，这些神经元分为输入层、隐藏层和输出层。每个神经元接收输入信号，通过加权求和和激活函数处理后，输出结果。

### 输入层

输入层接收外界输入信号，是神经网络的起点。输入层的神经元数量等于输入特征的数量。

### 隐藏层

隐藏层位于输入层和输出层之间，负责对输入信号进行特征提取和抽象。隐藏层可以有多层，每层包含多个神经元。

In [None]:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

# 构建一个包含两层隐藏层的神经网络
model = Sequential([
    Dense(128, activation='relu', input_shape=(784,)),
    Dense(64, activation='relu'),
    Dense(10, activation='softmax')
])

# 编译模型
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

# 输出模型摘要
model.summary()

### 输出层

输出层接收隐藏层的输出，生成最终的预测结果。输出层的神经元数量等于输出类别的数量。

## 神经网络的训练

神经网络的训练过程是通过反向传播算法，调整神经元的权重，使模型的预测误差最小化。训练过程包括前向传播、损失计算、反向传播和参数更新。

### 前向传播

前向传播是指从输入层到输出层的信号传递过程，通过计算每层神经元的加权和和激活函数，得到最终的输出结果。

### 损失计算

损失函数用于衡量模型的预测误差，常见的损失函数有均方误差（MSE）、交叉熵损失（Cross-Entropy Loss）等。

### 反向传播

反向传播是指从输出层到输入层的梯度计算过程，通过链式法则计算每个权重的梯度，指导参数更新。

In [None]:
# 示例：使用TensorFlow训练一个简单的神经网络
from tensorflow.keras.datasets import mnist

# 加载MNIST数据集
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 数据预处理
x_train = x_train.reshape(-1, 784).astype('float32') / 255
x_test = x_test.reshape(-1, 784).astype('float32') / 255

# 训练模型
model.fit(x_train, y_train, epochs=5, batch_size=32, validation_data=(x_test, y_test))

# 评估模型
loss, accuracy = model.evaluate(x_test, y_test)
print(f'测试集准确率: {accuracy:.2f}')

通过以上示例，我们了解了神经网络的基本组成和训练过程。在接下来的章节中，我们将深入探讨卷积神经网络、循环神经网络和生成对抗网络的原理和应用。