## 神经网络的原理

神经网络是一种模仿人脑神经元结构的计算模型，用于处理复杂的数据模式和关系。以下是神经网络的基本原理和构成要素。

### 神经元

神经网络的基本单位是神经元，神经元接收输入信号，通过加权求和和激活函数产生输出。一个神经元的数学表示为：

$$
y = f\left( \sum_{i=1}^{n} w_i x_i + b \right)
$$

其中：

- \( x_i \) 是输入信号
- \( w_i \) 是权重
- \( b \) 是偏置
- \( f \) 是激活函数

### 激活函数

激活函数用于引入非线性，常见的激活函数有：

- Sigmoid 函数：

$$
\sigma(x) = \frac{1}{1 + e^{-x}}
$$

- ReLU 函数：

$$
f(x) = \max(0, x)
$$

- Tanh 函数：

$$
\tanh(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}}
$$

### 网络结构

神经网络通常由多个层组成，包括输入层、隐藏层和输出层。每层由多个神经元组成。

#### 输入层

输入层接收外部输入数据，不进行任何计算，直接传递到下一层。

#### 隐藏层

隐藏层位于输入层和输出层之间，可以有一层或多层。每个隐藏层神经元接收前一层的输出，进行加权求和和激活。

#### 输出层

输出层产生最终的输出结果，其结构和神经元数量取决于具体任务。

### 前向传播

前向传播是指从输入层开始，逐层计算每个神经元的输出，直到输出层。每层的输出作为下一层的输入。

### 误差计算

在训练过程中，通过损失函数计算预测输出与真实值之间的误差。常用的损失函数有均方误差和交叉熵损失。

- 均方误差（MSE）：

$$
E = \frac{1}{2} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2
$$

- 交叉熵损失：

$$
E = -\sum_{i=1}^{n} y_i \log(\hat{y}_i)
$$

### 反向传播

反向传播用于更新神经网络的权重和偏置，以最小化损失函数。反向传播通过链式法则计算梯度，并使用优化算法（如梯度下降）进行参数更新。

#### 梯度下降

梯度下降通过以下公式更新权重和偏置：

$$
w_i = w_i - \eta \frac{\partial E}{\partial w_i}
$$

$$
b = b - \eta \frac{\partial E}{\partial b}
$$

$$
\frac {\partial E}{\partial w_{j,k}}=-(t_k-o_k)\cdot \sigma(\sum_j{w_{j,k}\cdot o_j})\cdot (1 - \sigma(\sum_j{w_{j,k}\cdot o_j}))\cdot o_j
$$

其中 \( \eta \) 是学习率。

### 训练过程

神经网络的训练过程包括以下步骤：

1. 初始化权重和偏置。
2. 进行前向传播计算输出。
3. 计算损失函数值。
4. 进行反向传播计算梯度。
5. 更新权重和偏置。
6. 重复以上步骤，直到损失函数收敛或达到预定的训练次数。

通过这些步骤，神经网络能够逐渐优化其参数，提高对复杂模式和数据关系的建模能力。

## 激活函数的选择


> 一室之不治，何以家国天下为？

## 任务

从最简单的样例开始利用神经网络构建个转换二进制的神经网络模型

通过输入的 3 个 bit 位，构建一个能够将 3bit 二进制数据转换成 10 进制数据的单层神经网络

## 输出

0 ～ 7

## 输入

000 ～ 111

## 网络设计

输入层 隐藏层 输出层
3 2 1


In [5]:
import torch
import torch.nn as nn
import torch.optim as optim


# 定义神经网络
class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        self.fc1 = nn.Linear(4, 6)
        self.fc2 = nn.Linear(6, 6)
        self.fc3 = nn.Linear(6, 2)

    def forward(self, x):
        x = torch.relu(self.fc1(x))
        x = torch.relu(self.fc2(x))
        x = torch.relu(self.fc3(x))
        return x


# 自定义函数实现二进制转十进制
class BinaryToDecimal(torch.autograd.Function):
    @staticmethod
    def forward(ctx, inputs):
        ctx.save_for_backward(inputs)
        decimal = inputs.apply_(
            lambda x: int("".join(map(str, map(int, x.tolist()))), 2)
        )
        return decimal.float().view(-1, 1)

    @staticmethod
    def backward(ctx, grad_output):
        grad_input = grad_output.clone()
        return grad_input


binary_to_decimal = BinaryToDecimal.apply

# 创建神经网络实例
model = SimpleNN()

In [88]:
import numpy as np
import math
import numbers


class Neuron:
    def sigmoid(x: numbers.Number):
        return 1 / (1 + math.exp(-x))

    def liner(x: numbers.Number):
        return x

    def __init__(self, weight: float, bias: float, func=sigmoid, activation=0):
        self.w = weight
        self.b = bias
        self.fw_connextions = []
        self.bw_connextions = []
        self.func = func
        self.a = activation

    def add_connextions(self, neuron):
        self.fw_connextions.append(neuron)
        self.bw_connextions.append(neuron)

    def forward(self):
        for conn in self.fw_connextions:
            conn: Neuron
            conn.a += self.w * self.a + self.b

    def update(self):
        self.a = self.func(self.a)

    def backward(self):
        for conn in self.bw_connextions:
            conn: Neuron

    def __repr__(self) -> str:
        return f"Neuron[{self.w:.2f},{self.b:2f},{self.a:.2f}]"

    def __str__(self) -> str:
        return self.__repr__()


class Layer:
    def __init__(self, *args: Neuron):
        self.neurons = args
        self.next_layer = None
        self.prev_layer = None

    def connect(self, layer: Layer, full=True):  # type: ignore
        if not full:
            assert len(self.neurons) == len(layer.neurons)
            for i, _ in enumerate(self.neurons):
                self.neurons[i].add_connextions(layer.neurons[i])
        else:
            for i, _ in enumerate(self.neurons):
                for j, _ in enumerate(layer.neurons):
                    self.neurons[i].add_connextions(layer.neurons[j])
        self.next_layer = layer
        layer.prev_layer = self
        return self

    def forward(self):
        for i, _ in enumerate(self.neurons):
            self.neurons[i].forward()
        for i, _ in enumerate(self.next_layer.neurons):
            self.next_layer.neurons[i].update()

    def __repr__(self) -> str:
        return ",".join(map(str, self.neurons))

    def __str__(self) -> str:
        return ",".join(map(str, self.neurons))


class Train:
    def __init__(self, layers: list[Layer]):
        return

    def fit(self, x: list[float], Y: list[float]):
        return

    def output():
        return

In [89]:
from tqdm import trange

i1, i2 = (
    Neuron(1, 0, activation=1, func=Neuron.liner),
    Neuron(1, 0, activation=0.5, func=Neuron.liner),
)
h11, h21 = (
    Neuron(0.9, 0),
    Neuron(0.3, 0),
)

o1, o2 = Neuron(0.2, 0), Neuron(0.8, 0)

# input_layer = [i1, i2]
# hidden_layer = [h11, h21]
# output_layer = [o1, o2]
input_layer = Layer(i1, i2)
hidden_layer = Layer(h11, h21)
output_layer = Layer(o1, o2)
network = input_layer.connect(hidden_layer.connect(output_layer), full=False)

print(input_layer)
print(hidden_layer)
input_layer.forward()
print(hidden_layer)


def train():
    # ? forward
    for i, _ in enumerate(input_layer):
        input_layer[i].forward()

    for i in hidden_layer:
        print(i, end=" ")
    print()
    for i, _ in enumerate(hidden_layer):
        hidden_layer[i].forward()

    # for i in hidden_layer:
    #     print(i, end=" ")
    for i in output_layer:
        print(i, end=" ")
    # ?backward
    return


# train()

# batches = 10000
# for _ in trange(batches):
#     pass

Neuron[1.00,0.000000,1.00],Neuron[1.00,0.000000,0.50]
Neuron[0.90,0.000000,0.00],Neuron[0.30,0.000000,0.00]
Neuron[0.90,0.000000,0.73],Neuron[0.30,0.000000,0.62]


(1, 2, 3) <class 'tuple'>


In [None]:
from tqdm import trange

i1, i2, i3 = (
    Neuron(0, 0, activation=1),
    Neuron(0, 0, activation=1),
    Neuron(0, 0, activation=1),
)
h11, h21, n31 = Neuron(1, 1), Neuron(1, 1), Neuron(1, 1)
n12 = Neuron(1, 1)
o1 = Neuron(1, 1)
input_layer = [i1, i2, i3]
hidden_layer = [h11, h21, n31]
output_layer = [o1]

for i, neu in enumerate(input_layer):
    input_layer[i].add_connextions(hidden_layer[i])

for i, _ in enumerate(hidden_layer):
    for j, __ in enumerate(output_layer):
        hidden_layer[i].add_connextions(output_layer[j])


def train():
    # ? forward
    for i, _ in enumerate(input_layer):
        input_layer[i].forward()

    for i in hidden_layer:
        print(i, end=" ")
    print()
    for i, _ in enumerate(hidden_layer):
        hidden_layer[i].forward()
    for i in output_layer:
        print(i, end=" ")
    # ?backward
    return


train()

batches = 10000
for _ in trange(batches):
    pass