[云框架]TensorFlow

TensorFlow是Google开源的人工智能（Machine Intelligence）软件库，是使用数据流图（Data Flow Graphs）进行数值计算的开源软件库。Tensor（张量）指在节点间相互联系的多维数据数组，Flow（流）指基于数据流图的计算。TensorFlow架构灵活，小到智能手机，大到数据中心服务器均可展开计算，同时具备很强的通用性，适用于包括图形分类、音频处理、推荐系统和自然语言处理等在内的各种计算领域。

TensorFlow具备以下特点——

灵活（Deep Flexibility）：支持任何数据流图计算
便携（True Portability）：支持各类计算设备
链接科研和产品（Connect Research and Product）：加速研究成果转化为实际产品
自动化微分运算（Auto-Differentiation）：帮助机器学习算法自动求出梯度
多语言（Language Options）：利用python构建和执行计算图，支持C++的语言，未来将支持Lua、JavaScript、R等
性能优化（Maximize Performance）：支持线程、队列、异步计算，并根据需要分配计算元素

自15年年底开源以来，TensorFlow迅速流行，除了Google，Airbnb、Snapchat、eBay、Twitter等知名公司也纷纷加入到TensorFlow的使用者阵营当中。

本篇云框架将以ErGo（一款基于TensorFlow的Chatbot）为例介绍TensorFlow实践。

内容概览

快速部署
- 一键部署
- 本地部署
背景知识
业务说明
ErGo实现
更新计划
社群贡献

快速部署

一键部署

一键部署在好雨云平台

本地部署

准备Docker环境

Git clone

git clone https://github.com/cloudframeworks-tensorflow/ErGo

执行如下命令，进行训练

训练时长主要取决于数据大小、learningRate（学习效率）、dropout及设备计算能力（推荐使用GPU，训练完成后脚本会自动退出）
```
cd ErGo
python main.py --train
```

初始化web ui

docker build -t ergo -f Dockerfile.cpu .
redis-server &
docker run -itd -p 8000:8000 --name ergo ergo

访问
```
http://localhost:8000
```

背景知识

TensorFlow门槛较高，背后需要大量且有一定深度的数学理论知识和技术知识：

导数与微积分
矩阵与线性代数
基本编程原则
机器学习基本概念

同时需要有一定的python编程和组织模块的经验，了解Numpy库、matplotlib库、前馈神经网络（feed-forward neural networks）、卷积神经网络（convolutional neural networks）以及循环神经网络（recurrent neural networks）等，建议通过相关专业书籍进行学习或参考下列链接——

业务说明

聊天机器人（Chatbot）——ErGo，基于TensorFlow实现，可与用户互动完成智能对话。

工作流程可分为提问（Ask）、检索（Retrieve）、抽取（Extraction）、回答（Answer）4部分，用户通过界面（Web）提出问句，ErGo将在已训练数据（Trained Data）中检索并抽取答案，通过界面反馈给用户，如下图所示：

例如——

Master: HI ERGO
ERGO: HI

Master: I LOVE YOU
ERGO: I'M SORRY

ErGO实现

整体架构

ErGo的整体架构如下图所示：

ErGo加载Data（语料）并进行数据处理
处理完成后，由训练模型（Training Model）加载并进行反复训练
完成训练后，ErGo可根据训练后的数据进行相关预测，即与用户完成对话

选取模型

Seq2Seq是最普遍的聊天机器人深度学习模型，ErGo同样采用了Seq2Seq。

Seq2Seq模型由两个主要部件组成，一个是编码器RNN，另一个是解码器RNN。

编码器的工作是将输入文本信息生成固定的表示；解码器则是接收这个表示，并生成一个可变长度的文本来响应。

进一步了解Seq2Seq

选取数据集

聊天机器人往往用于回答具体某类问题或提供某种服务，因此在训练前，第一件事便是选取数据集，并基于所选数据集类型，在根据自己业务需求定制的训练模型之上，进行定向训练。

序列模型需要大量的会话日志，以便“编码器-解码器网络”能够正确理解每个查询(编码器输入)所期望的响应类型(解码器输出)。

常见数据集包括Cornell_Movie-Dialogs_Corpus（本例使用）、Ubuntu Dialogue Corpus等。

创建数据集

创建数据集设计到数据集预处理，本例中使用已经预处理完成的数据。

进一步了解如何预处理数据，请参考——

训练

Tensorflow原生支持多种数据读取方式，本例默认使用从文件中读取的方式加载处理初始数据，处理后的数据会保存为随机生成的pkl文件

本例中数据模型基于循环神经网络（RNN）及两层长短时记忆网络（LSTM），同时使用了seq2seq模型，其主要就是定义基本的LSTM结构作为循环体的基础结构，通过MultiRNNCell类实现深层循环神经网络，利用dropout策略在处理完的数据上运行tf.train操作，返回全部数据上的perplexity的值，具体实现参考实例代码model

训练后数据

训练完成后，Tensorflow默认会将训练结果保存为model.ckpt。

ErGo每次进行预测（即对话）时会加载相关的模型数据，并返回接近最优的回答。

但在交互过程中，我们可能会发现结果不尽如人意，建议通过以下方法进行改进：

提供更多的数据库，以帮助从更大的会话语料库中学习
LSTM结构参数的调优，如LSTM单元数、LSTM层数、优化器的选择、训练迭代次数

如何变成自己的项目

生成数据集

获取自己的数据副本，利用相关工具或脚本提取相关的对话序列生成自己的数据集
生成单词向量

利用word2vec为数据集中出现的单词生成单词向量
可以根据需求来拓展修改相关model函数（可选）
参考本地部署执行训练
访问

更新计划

训练 提供训练数据API接口
展示 提供展示界面API接口
文档 微信界面展示接入

点击查看历史更新

社群贡献

QQ群: 621870673
参与贡献
联系我们

云框架系列主题，遵循APACHE LICENSE 2.0协议发布。

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
READMORE		READMORE
image		image
ABOUT.md		ABOUT.md
CHANGELOG.md		CHANGELOG.md
CONTRIBUTING.md		CONTRIBUTING.md
CONTRIBUTORS.md		CONTRIBUTORS.md
LICENSE.md		LICENSE.md
QA.md		QA.md
README.md		README.md

License

mapleflow/user-guide-tensorflow

Folders and files

Latest commit

History

Repository files navigation