```python
from keras.layers.core import *             # '*' mean corresponding 'Func'
```

| Name | Func | Sample | Appl-Func |
| --- | --- | --- | --- |
| 全连接层 | Dense(OutputSize, input_dim=InputSize) | Dense(128, input_dim=32) | model.add() | 
| 激活层 | Activation('ActFuncName') | Activation('softmax') | model.add() |

# 一般流程

## 序列模型

In [1]:
from keras.models import Sequential

#Create the Sequential model
model = Sequential()

Using TensorFlow backend.


## 层

In [2]:
from keras.models import Sequential
from keras.layers.core import Dense, Activation, Flatten

#创建序列模型
model = Sequential()

#第一层 - 添加有128个节点的全连接层以及32个节点的输入层（只需设置一次输入维度）
model.add(Dense(128, input_dim=32))

#第二层 - 添加 softmax 激活层
model.add(Activation('softmax'))

#第三层 - 添加全连接层
model.add(Dense(10))

#第四层 - 添加 Sigmoid 激活层
model.add(Activation('sigmoid'))

Instructions for updating:
Colocations handled automatically by placer.


## 编译（并指定loss、优化程序、评判标准）

In [3]:
model.compile(loss="categorical_crossentropy", optimizer="adam", metrics = ['accuracy'])

## 查看架构

In [4]:
model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_1 (Dense)              (None, 128)               4224      
_________________________________________________________________
activation_1 (Activation)    (None, 128)               0         
_________________________________________________________________
dense_2 (Dense)              (None, 10)                1290      
_________________________________________________________________
activation_2 (Activation)    (None, 10)                0         
Total params: 5,514
Trainable params: 5,514
Non-trainable params: 0
_________________________________________________________________


## 训练（并指定epoch、显示训练过程信息类型）

```python
model.fit(X, y, nb_epoch=1000, verbose=0)
```

## 评估模型

```python
model.evaluate()
```

# XOR练习

In [5]:
import numpy as np
from keras.utils import np_utils
import tensorflow as tf
# Using TensorFlow 1.0.0; use tf.python_io in later versions
# tf.python.control_flow_ops = tf

# Set random seed
np.random.seed(42)

# Our data
X = np.array([[0,0],[0,1],[1,0],[1,1]]).astype('float32')
y = np.array([[0],[1],[1],[0]]).astype('float32')

# Initial Setup for Keras
from keras.models import Sequential
from keras.layers.core import Dense, Activation

# One-hot encoding the output(to categorical data)
y = np_utils.to_categorical(y)

# Building the model
xor = Sequential()

# Add required layers
xor.add(Dense(32, input_dim=2))
xor.add(Dense(8))
xor.add(Activation('relu'))
xor.add(Dense(2))
xor.add(Activation('sigmoid'))

# Specify loss as "binary_crossentropy", optimizer as "adam",
# and add the accuracy metric
xor.compile(loss="categorical_crossentropy", optimizer="adam", metrics = ['accuracy'])

# Uncomment this line to print the model architecture
xor.summary()

# Fitting the model
history = xor.fit(X, y, epochs=100, verbose=0)

# Scoring the model
score = xor.evaluate(X, y)
print("\nAccuracy: ", score[-1])

# Checking the predictions
print("\nPredictions:")
print(xor.predict_proba(X))

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_3 (Dense)              (None, 32)                96        
_________________________________________________________________
dense_4 (Dense)              (None, 8)                 264       
_________________________________________________________________
activation_3 (Activation)    (None, 8)                 0         
_________________________________________________________________
dense_5 (Dense)              (None, 2)                 18        
_________________________________________________________________
activation_4 (Activation)    (None, 2)                 0         
Total params: 378
Trainable params: 378
Non-trainable params: 0
_________________________________________________________________
Instructions for updating:
Use tf.cast instead.

Accuracy:  1.0

Predictions:
[[0.49689212 0.42829862]
 [0.19359669 0.5203181 ]
 [0.1375274  0.5

# 录取学生LAB
- 加州大学洛杉矶分校的学生录取数据集
```
read.csv("https://stats.idre.ucla.edu/stat/data/binary.csv")
```

## 研究数据
数据集包含以下列：

- 学生 GPA（成绩）
- GRE 考试成绩（考试）
- 级别（1-4）

In [7]:
## *另见 `student_admission.ipynb` 文件*

# 优化程序
- [optimizer, keras](https://keras.io/optimizers/)   
- [An overview of gradient descent optimization algorithms](http://ruder.io/optimizing-gradient-descent/index.html#rmsprop)

- SGD：这是`随机梯度下降`。它使用了以下参数：
    - 学习速率。
    - 动量（获取前几步的加权平均值，以便获得动量而不至于陷在局部最低点）。
    - Nesterov 动量（当最接近解决方案时，它会减缓梯度）。
    
- Adam(`Adaptive Moment Estimation`) 使用更复杂的指数衰减，不仅仅会考虑平均值（第一个动量），并且会考虑 __前几步的方差（第二个动量）__ 

- RMSProp (`RMS 表示均方根误差`）通过除以按指数衰减的平方梯度均值来减小学习速率。

# IMDb评论情感预测
- 本实验使用一个包含 `25,000` 条 IMDB评论的数据集。 
    - 每个评论都附带一个标签。 负面评论的标签为 `0` ，正面评论的标签为 `1` 。 
- 每个评论被编码为 __一系列索引__ ，对应于评论中的单词。 词<font color=blue>按频率排序</font>。
    - 整数 `1` 对应于最频繁的词（“the”）
    - 整数 `2` 对应于第二频繁的词。
    - （按照惯例）整数 `0` 对应于未知词。

## 加载数据
- [IMDB movie data review](https://keras.io/datasets/#imdb-movie-reviews-sentiment-classification)

In [9]:
from keras.datasets import imdb

In [10]:
(x_train, y_train), (x_test, y_test) = imdb.load_data(path="imdb.npz",       # download data if no data locally
                                                     num_words=None,         # top most frequent words to consider
                                                     skip_top=0,             # top most frequent words to ignore 
                                                     maxlen=None,            # maximum sequence length
                                                     seed=113,               # seed for reproducible data shuffling.
                                                     start_char=1,           # the start of a sequence will be marked with this character
                                                     oov_char=2,             # words will be replaced
                                                     index_from=3)           # index actual words with this index and higher

## 数据预处理

- 首先将数据编码为 __(0,1) - 向量__ ，编码如下：
    - 例如，如果我们的词汇量为10个词，向量为 `(4,1,8)` ，我们将它变成矢量 `(1,0,0,1,0,0,0,1,0,0)`

## 建立模型

In [11]:
# 使用 Keras 建立一个神经网络，对它进行训练并评估

In [None]:
## *另见 `imdb_comments.ipynb` 文件*