### 简单感知机

感知机是一种线性分类模型，可以用来实现简单的逻辑门（如与门、或门、与非门）。它的基本工作原理如下：
输入：感知机接收多个输入，每个输入有一个权重（weight）与之对应。
加权和：每个输入乘以其对应的权重，然后将这些乘积相加，得到加权和。
激活函数：加权和通过激活函数（通常是一个阈值函数）转换为输出。如果加权和超过某个阈值，感知机输出1；否则输出0。

逻辑门的实现就是通过找到合适的权重和阈值，使得感知机在给定输入时输出正确的逻辑结果。

In [1]:
# 简单的实现
def AND(x1, x2):
    w1, w2, theta = 0.5, 0.5, 0.7
    tmp = x1*w1 + x2*w2
    if tmp <= theta:
        return 0
    elif tmp > theta:
        return 1

print(AND(0,0))
print(AND(0,1))
print(AND(1,0))
print(AND(1,1))

0
0
0
1


理解与门的实现过程：
由于AND(x1, x2)的结果只有4中可能：
0 0 = 0；0 1 = 0；1 0 = 0；1 1 = 1
那么函数f(x1, x2)=x1*w1 + x2*w2 + b的结果大于或等于0时，结果为1，小于0时，结果为0。
可以人工推导出成立的条件是：w1 + b < 0 且 w2 + b < 0 且 w1 + w2 + b >=0
那么，可以假设b为-1，w1可以为0.6，w2可以为0.7，这样的组合是无穷的。
但是，只要确定满足以上条件的w和b，函数f(x1, x2)就确定下来了，也就得到了一个与门函数（感知机）。

In [2]:
# 使用NumPy实现，并将theta换成-b，即将x1*w1+x2*w2<=theta，换成: b+x1*w1+x2*w2<=0。
import numpy as np
def ANDN(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5]) #权重
    b = -0.7 #偏置
    tmp = np.sum(x*w)+b #np.sum是将矩阵x和w的乘积求和
    if tmp <= 0:
        return 0
    elif tmp > 0:
        return 1

print(ANDN(0,0))
print(ANDN(0,1))
print(ANDN(1,0))
print(ANDN(1,1))

0
0
0
1


In [3]:
#使用Numpy实现与非门和或门。
def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5]) #权重和偏置与AND不同
    b = 0.7
    tmp = np.sum(w * x) + b
    if(tmp <= 0):
        return 0
    else:
        return 1

print(NAND(1, 1))
print(NAND(0, 0))
print(NAND(1, 0))

def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.2
    tmp = np.sum(x*w) + b
    if(tmp <= 0):
        return 0
    else:
        return 1
    
print(OR(0, 1))

0
1
1
1


异或门的实现：
异或的规则为0 0 : 1, 1 0 : 1, 0 1 : 1, 1 1 : 1。如果直接通过以上f(x)=wx+b函数来计算，是无法得到确切的w和b。
那么，考虑结果要为0 1 1 0，就可以将一个异或门拆解为两个步骤，先得到两个中间结果，再由这两个中间结果继续进行计算。
比如：先采用一个与非门和一或门分别得到结果，再将结果通过与门进行计算，得到0 1 1 0。

In [4]:
# 利用多层感知机，异或门。
# 组合NAND和OR作为第一层，AND作为第二层，输出结果即为XOR的结果。
def XOR(x1, x2):
    s1 = NAND(x1, x2)
    print(s1)
    s2 = OR(x1, x2)
    print(s2)
    y = AND(s1, s2)
    return y

print(XOR(0, 0))
# print(XOR(0, 1))
# print(XOR(1, 0))
# print(XOR(1, 1))

1
0
0


以上各个逻辑门的实现中所采用的f(x)=wx+b为线性变换函数，用于表达权重w和偏置b对输入x的影响，从给表达一种逻辑门模型。

线性变换在神经网络中的目的主要有以下几个方面：

1. 计算加权和：
线性变换通过权重w和偏置b对输入x进行加权求和：
z=wx+b
这一步将输入数据与每个神经元的权重结合起来，产生一个加权和。这个加权和表示的是输入数据在当前神经元上的总影响力。

2. 数据压缩与扩展：
在输入数据通过多个神经元和层级传递时，线性变换起到了对数据的压缩和扩展的作用。通过不同层次和神经元数量的设置，网络可以学习到数据中的多层次特征。

3. 提供学习参数：
权重w和偏置b是神经网络的可学习参数。通过训练过程，这些参数不断调整，以最小化损失函数（表示预测与实际值之间的误差）。线性变换中的权重和偏置为优化算法提供了调整的基础。

4. 特征提取：
线性变换可以看作是对输入数据的一种特征提取方式。在初始层，权重可能用于捕捉输入数据的基本模式（如图像的边缘）。在深层网络中，权重可能表示更高层次的特征（如图像中的特定物体）。

5. 输入与输出之间的映射：
线性变换将输入向量x映射到一个新的空间。这个新的空间通过权重和偏置的调整，逐步逼近目标输出。不同的权重和偏置组合可以表示不同的映射关系，这使得神经网络能够适应各种复杂的函数和模式。