## 第 0 课：深度学习简介及环境搭建

### 1 深度学习简介


#### 1.1 神经网络背景

- Top-down approach to AI: 西蒙为代表的符号学派
  - "machines will be capable, within twenty years, of doing any work a man can do." -- 1965, H. A. Simon
  - 形式化方法，将知识表示为符号
  - 运用逻辑进行推理
  - 对自然语言、图像问题基本毫无办法

- Bottom-up approach to AI: 神经网络
  - 典型的神经元结构：突触、树突、轴突
  - 输入层、输出层、隐层
  - 直观上看深度学习（深度神经网络）可以看作是隐层层数加多


#### 1.2 神经网络历史

- 40 年代：概念雏形（没有学习算法）
- 50 年代：科尔用的学习算法 - 感知机
- 1969 年：Minsky 泼冷水 - 神经网络无法处理异或问题
- 70 年代：BP 算法，训练多层神经网络
- 90 年代：SVM 支持向量机“打败”神经网络
- 2006：深度网络理论、实验上有所突破
- 2012：ImageNet（图片分类比赛），大幅提升结果（错误率 15.3%，第二名 26.2%）


#### 1.3 深度学习在处理自然语言上的优势

- End-to-end Learning vs. Step-by-Step Learning
  - 微博自动回复：机器翻译（中→英：微博→评论）
- 相比一般机器学习算法，通用性、迁移性强
- 效果直逼或赶上传统方法


#### 1.4 自然语言处理在工业界的应用

- Google Smart Reply
- Google 机器翻译
- 通过 Twitter 情绪预测股市

### 2. 深度学习环境搭建


工欲善其事必先利其器，在正式开始深度学习之前，需要先搭建好环境。深度学习框架很多，我们采用 Google 的 Tensorflow。  

Tensorflow 安装：
- Python + Tensorflow binary
- Jupyter Notebook

我们使用 Docker 一站式环境

#### 2.1 Docker  


##### 2.1.1 什么是 Docker？

Tensorflow 上推荐使用 Docker 安装，其中对 Docker 的定义如下：  
Docker is a system to build self contained versions of a Linux operating system running on your machine. When you install and run TensorFlow via Docker it completely isolates the installation from pre-existing packages on your machine.  
简单来说，Docker 就是一个虚拟环境，可以直接下载相应的容器使用。接下来，我们将先安装 Docker，然后在 Docker 环境中安装 Tensorflow 环境。


##### 2.1.2 Docker 安装

- 以 Ubuntu 为例，其他系统可参考官方网站：https://www.docker.com
- 步骤如下：
  - 检查安装必须条件：
    1. 必须为 64 位
    2. Linux kernel 必须为 3.10 或以上
  - 更新 APT: 可参考[官网](https://docs.docker.com/engine/installation/linux/ubuntulinux/)
  - 安装最新版本
    1. 更新 APT：`sudo apt-get update`
    2. 安装 Docker：`sudo apt-get install docker-engine`
    3. 启动服务：`sudo service docker start` 
  - 设置 Docker 命令不需要输入 `sudo` 命令
    1. 创建 `docker` group：`sudo groupadd docker`
    2. 将当前用户加入 group：`sudo usermod -aG docker $USER`
    3. 重启后可用 `docker ps` 确认是否设置成功
- Docker 常用命令
  - `docker ps`：查看当前已创建的 docker
  - `docker ps` -a：查看所有已创建的 docker
  - `docker rm`：彻底删除已创建的 docker
- 有任何问题可参考官方网站 https://www.docker.com

#### 2.2 Tensorflow

- 安装好 Docker 后，可以直接将 tensorflow Image 下载后构建我们自己的容器
  - `docker run -it -p 8888:8888 tensorflow/tensorflow` ，其中 `it` 是交互模式，`-p 8888:8888` 是以 tensorflow Image 为模板构建的容器，其内部会在本地的 8888 端口开一个服务，`-p` 将服务映射到主机的 8888 端口，这样就可以通过 http://localhost:8888 来访问容器了
  - 将本地目录映射到容器：`docker run -it -p 8888:8888 -v ~/tensorflow:/tensorflow tensorflow/tensorflow`，该命令是将 Home 目录下的 tensorflow 目录映射到容器，这样容器就可以直接访问 tensorflow 中的文件了
  
  - `docker run -it -p 8888:8888 -p 6006:6006 -v ~/documents/deeplearning:/notebooks tensorflow/tensorflow` 可以把 deeplearning 目录映射到 docker 默认目录
- 创建好容器之后，以后可直接用 `docker start -i XXX` 启动，启动后直接在浏览器输入：http://localhost:8888 即可进入 Jupyter Notebook 交互环境  