# 神经网络简介
这次的可成主要是介绍神经网络的基础知识，再介绍神经网络的同时，我们也将结合神经网络对以前学过的梯度下降，线性回归和逻辑斯蒂回归知识进行扩展。本章主要需要学习以下几点：
+ 训练简单的神经网络
+ 反向传播算法
+ 梯度误差计算
+ 简单神经网络架构
+ 激活函数

## 1.1 感知机
感知器（英语：Perceptron）是弗兰克·罗森布拉特在1957年就职于康奈尔航空实验室（Cornell Aeronautical Laboratory）时所发明的一种人工神经网路。它可以被视为一种最简单形式的前馈神经网路，是一种二元线性分类器。感知机是一种二类分类的线性分类模型，输入为实例的特征向量，输出为实例的类别，正类取1，负类取-1。感知机是一种判别模型，其目标是求得一个能够将数据集中的正实例点和负实例点完全分开的分离超平面。如果数据不是线性可分的，则最后无法获得分离超平面。

感知机是生物神经细胞的简单抽象。神经细胞结构大致可分为：树突、突触、细胞体及轴突。单个神经细胞可被视为一种只有两种状态的机器——激动时为‘是’，而未激动时为‘否’。神经细胞的状态取决于从其它的神经细胞收到的输入信号量，及突触的强度（抑制或加强）。当信号量总和超过了某个阈值时，细胞体就会激动，产生电脉冲。电脉冲沿着轴突并通过突触传递到其它神经元。为了模拟神经细胞行为，与之对应的感知机基础概念被提出，如权量（突触）、偏置（阈值）及激活函数（细胞体）。

在人工神经网络领域中，感知机也被指为单层的人工神经网络，以区别于较复杂的多层感知机（Multilayer Perceptron）。作为一种线性分类器，（单层）感知机可说是最简单的前向人工神经网络形式。尽管结构简单，感知机能够学习并解决相当复杂的问题。感知机主要的本质缺陷是它不能处理线性不可分问题。

**线性可分**：线性可分就是说可以用一个线性函数把两类样本分开，比如二维空间中的直线、三维空间中的平面以及高维空间中的线性函数。

感知器是神经⽹络的构建模块。它通常具有多个连接的输⼊，并根据传⼊连接（突触）的加权和计算输出，也称为激活函数。下图是一个感知机模型实例，对于作用于与输入$X=(x_1,x_2,\cdots,x_n)$的权重$W=(w_1,w_2,\cdots,w_n)$其输出$Z$经过激活函数$O$,那么其结构如下图所示：

![Alt text](image-1.png)

其中输出满足:
![Alt text](image-2.png)


用简单的向量表示如下：

![Alt text](image-3.png)

感知机的训练要素：
+ 训练样本线性可分
+ 学习率足够小
利用梯度下降训练的成功要素:
+ SME收敛到样本假设
+ 学习率足够小
+ 即使训练样本有噪声

下⾯是如何使⽤感知器来学习⼀个简单问题（即“或”⻔）的⽰例。或⻔是⽤于基本机器学习的简单⽰例。与异或⻔相⽐，
或⻔更容易学习。与 XOR ⻔类似，OR ⻔有 4 个实例，这些实例具有两个特征，并且输出 (OR) 为 0 或 1。该模型的⽬标
是最小化或门的最⼩平⽅误差收敛到假设，即给定输⼊预测表⽰或⻔的输出。

![Alt text](image-4.png)

那么，感知机的学习算法可以分为以下几步：

![Alt text](image-5.png)

In [1]:
import numpy as np
class Perceptron(object):
    def __init__(self, no_of_inputs, threshold, learning_rate):
        self.threshold = threshold
        self.learning_rate = learning_rate
        self.weights = np.zeros(no_of_inputs + 1)
    def predict(self, inputs):
        summation = np.dot(inputs, self.weights[1:]) + self.weights[0]
        if summation > 0:
            activation = 1
        else:
            activation = 0
        return activation
    def train(self, training_inputs, labels):
        for _ in range(self.threshold):
            for inputs, label in zip(training_inputs, labels):
                prediction = self.predict(inputs)
                #print(prediction, label)
                self.weights[1:] += self.learning_rate * (label - prediction) * inputs
                self.weights[0] += self.learning_rate * (label - prediction) #bias

    # set the dataset inputs
# AND gate
training_inputs = []
training_inputs.append(np.array([1, 1]))
training_inputs.append(np.array([1, 0]))
training_inputs.append(np.array([0, 1]))
training_inputs.append(np.array([0, 0]))
# set the dataset class labels
labels = np.array([1, 0, 0, 0])# AND
#labels = np.array([1, 0, 0, 1]) #XOR
#labels = np.array([1, 1, 1, 0]) # OR
no_of_inputs = 2
threshold=100
learning_rate=0.01
# set the class and train
perceptron = Perceptron(no_of_inputs, threshold, learning_rate)
perceptron.train(training_inputs, labels)
# now test trained percepton
inputs = np.array([1, 1])
output = perceptron.predict(inputs)
print(output, ' for input [1, 1]' )
inputs = np.array([0, 1])
output = perceptron.predict(inputs)
print(output, ' for input [0, 1]' )

1  for input [1, 1]


## 1.2 神经元

## 1.3 多层感知机

###  1.3.1 反向传播算法

### 1.3.2 前向传播

### 1.3.3 损失函数

### 1.3.4 前传

### 1.3.5 反传

### 1.3.6 反向传播

### 1.3.7 网络测试


## 1.4 前馈神经网络

### 1.4.1 前馈神经网络1

### 1.4.2 前馈神经网络2

### 1.4.3 网络训练和学习

## 1.5 Sklearn库的神经网络

### 激活函数

### 数据预处理

### 隐藏层设计