#深入浅出js（Node.js）异步流程控制

>>>> 1. 从下一代测试框架ava说起

这次分享的主题是“深入浅出js（Node.js）异步流程控制”，那么为什么要从下一代测试框架ava开始呢？

虽然这看似无关，但实际上，测试框架才是对流程控制提供最全的最简洁的集成的，如果通用性的测试框架都解决不好流程控制问题，那么，这样的东西不用也罢。

ava（https://github.com/avajs/ava）是面向未来的测试运行器，简单来说，ava是mocha的替代品，对ES6语法支持更好。它对Aysnc/Await有支持，执行效率更高。使用IO并发，就必须保证测试的原子性，语义上更简单，集众家之长。

举几个例子：

test('synchronization', t => {})
test.cb('callback', t => {})
test('promise', t => {})
test('generator function',  function * (t) {})
test('async function', async t => {})

大家了解这几种写法的区别么？

总结一下就是：

test和test.cb是两种：同步和callback处理。
在test里，第二个参数有3种写法，普通函数、Generator函数和Async函数。

它们就是我们的主角，几乎所有的流程控制都在里面了。看一个模块或者框架，如果能这样比较，就非常容易看到它们的本质，一般都是写的人比用的人精，但用的人也可以变成写的人，是不是？

>>>> 2. 流程控制的6个演进步骤

js流程控制的演进过程，分以下6部分:

同步代码
异步JavaScript: callback hell
Thunk
Promise/a+
生成器Generators/yield
Async函数/Await（以前说是ES7 stage-3）

看起来挺简单的，作为*js（沾边）工程师的各位自测一下，当前是哪个阶段？

对比一下此图，是否有不了解的呢？下面一一进行介绍。

>>>> 3. 同步VS异步

上面讲过：ava里只有test和test.cb这2种写法，即同步和callback处理。

js语言里除了AJAX、setTimeout等大部分都是同步，写同步代码是一种幸福，稍后你就懂了。

同步写法

同步代码大家最熟悉不过，没啥需要特殊解释的，看一下ava里简单测试

import test from 'ava';

test('synchronization', t => {
  const a = /foo/;
  const b = 'bar';
  const c = 'baz';
  t.false(a.test(b) || b === c);
});

我们希望所有的代码都能这样写，不用再担心什么时候回调完成。。。

Callback同步写法

但是我们习惯回调，无论事件还是AJAX，都是异步的。另外Node.js里又为了性能而异步，即所谓的天生异步，每个API都是异步的。

以Node.js为例：

error-first callback（错误优先的回调机制）
EventEmitter （事件发射机制）

总结：callback是用的最多的，是绝大部分的API遵守的约定，而EventEmitter是辅助机制，通过继承EventEmitter，来解耦业务逻辑。

看一下ava的异步测试

import test from 'ava';
const exec = require('child_process').exec

test.cb('error-first callback with setTimeout', t => {
    setTimeout(() => {
      t.pass();
      t.end();
    }, 2000);
});

test.cb('error-first callback with exec', t => {
  exec('cat *.js bad_file | wc -l',
    function (error, stdout, stderr) {
      t.pass();
      t.end();
  });
});

test.cb必须和t.end结合，才能完成测试。这其实是理解异步的比较好的方式。异步就好比是你丢石头砸别人家的窗户，调用t.end的时候是人家发现的时候，至于如何处理，看着办吧。

>>>> 3. 普通函数、Generator函数和Async函数

在test里，第二个参数有3种写法：普通函数、Generator函数和Async函数。

#####（1）普通函数

“callback hell”译为回调地狱，回调都有地狱，可见大家对callback的厌恶程度。诚然，过多嵌套回调的代码是非常难以维护的，可读性极差，例如以下代码。

step1(function (value1) {
    step2(value1, function(value2) {
        step3(value2, function(value3) {
            step4(value3, function(value4) {
                // Do something with value4
            });
        });
    });
});

我要说的是以下两点：

前端如AJAX，后端如Node.js，回调是躲不过去的
回调不止js有，其他语言也有

不要逃避callback，而是想办法解决它，把callback转成普通函数，主要有2种解决方式：Thunk 和 Promise。

Thunk

Thunk是什么?可以从以下几点来理解：

Thunk 是一个被封装了同步或异步任务的函数；
Thunk 有唯一一个参数 callback，是 CPS 函数；
Thunk 运行后返回新的 Thunk 函数，形成链式调用；
Thunk 自身执行完毕后，结果进入 callback 运行；
callback 的返回值如果是 Thunk 函数，则等该 Thunk 执行完毕将结果输入新 Thunk 函数运行；如果是其它值，则当做正确结果进入新的 Thunk 函数运行；

在 JavaScript 语言中，Thunk 函数替换的不是表达式，而是多参数函数，将其替换成单参数的版本，且只接受回调函数作为参数。

在以下代码中，fs模块的 readFileAPI方法是一个多参数函数，两个参数分别为文件名和回调函数。经过转换器处理，它变成了一个单参数函数，只接受回调函数作为参数。这个单参数版本，就叫做 Thunk 函数。

// 正常版本的readFile（多参数版本）
fs.readFile(fileName, callback);

// Thunk版本的readFile（单参数版本）
var readFileThunk = Thunk(fileName);
readFileThunk(callback);

var Thunk = function (fileName){
  return function (callback){
    return fs.readFile(fileName, callback); 
  };
};

曾经大家都钟爱函数式、高阶函数、cps等，但Promise目前基本已经成为默认标准了，Thunk用的会越来越少，但函数式的一些好的有点还是值得学的。

Promise/a+

顺序执行的代码和错误有限的回调方式都是js引擎默认支持的，这部分大家会调用接口，无太多变化，而Promise是对callback的思考，或者说改良方案，目前使用非常普遍，这里详细讲解一下。

Promise最早是在commonjs社区提出来的，当时提出了很多规范。比较接受的是Promise/A规范。后来人们在这个基础上。提出了Promise/A+规范，也就是实际上的业内推行的规范。ES6也是采用的这种规范。

Promise对象用于异步技术中。Promise意味着一个还没有完成的操作（许愿），但在未来会完成的（实现）。

Promise表示一个异步操作的最终结果。与Promise最主要的交互方法是通过将函数传入它的then方法从而获取得Promise最终的值或Promise最终最拒绝（reject）的原因。可以从以下几点来理解Promise：

递归，每个异步操作返回的都是Promise对象
状态机：三种状态（pending, fulfilled 或 rejected）转换，只在Promise对象内部可以控制，外部不能改变状态
全局异常处理
每个函数的返回值都是Promise对象
和jQuery一样的链式的thenable写法

这里给出一个gif演示，便于大家学习。

如下图所示，标准的Promise只有5个核心API，所以还是比较容易学的。

先掌握着5个API，然后再熟悉bluebird，q这样的Promise库，它们做了大量的扩展而已，但核心本质还是这些的。

callback hell 更多相关资料请参考《Node.js最新技术栈之Promise篇》（https://cnodejs.org/topic/560dbc826a1ed28204a1e7de）。

（2）生成器Generators/yield

Generator Function（生成器函数）和Generator（生成器）是ES6引入的新特性，该特性早就出现在了Python、C#等其他语言中。生成器本质上是一种特殊的迭代器https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Guide/The_Iterator_protocol。

Generator函数本意是iterator生成器，函数运行到yield时退出，并保留上下文，在下次进入时可以继续运行。

生成器函数也是一种函数，语法上仅比普通function多了个星号* ，即function* ，在其函数体内部可以使用yield和yield* 关键字。

简单理解，这是ES6的新特性，function 后面带 * 的叫做Generator，如以下代码所示。

function* doSomething() {
  ....
}

先看一下Generator如何执行：

function* doSomething() {
    console.log('1');
    yield; // Line (A)
    console.log('2');
}

var gen1 = doSomething();

gen1.next(); // Prints 1 then pauses at line (A)
gen1.next(); // resumes execution at line (A), then prints 2

说明

gen1是产生出来的Generator对象
第一个next，会打印出1，之后悬停在 yield所在行，即Line (A)
第二个next，恢复line (A)点的执行，之后打印出2

如果有多个yield呢？那么会有无穷无尽的next。

于是tj就写co这个著名的Generator执行器，co目前已经是v4了，彻底的面向Promise了，个中曲折也是够八卦的了。

（3）Async函数/Await（以前说是ES7 stage-3）

Generator的弊病是没有执行器，它本身就不是为流程控制而生的，所以co的出现只是解决了这个问题。

可是，你不觉得奇怪么？为什么非要加个co，才能好好的玩耍？为什么不能是直接就可以执行，并且效果和Yieldable一样的呢?

Async/Await 就是这样被搞出来的，很多人认为它是异步操作的终极解决方案。

Await

Await的3种可能情况

Await + Async函数
Await + Promise
await + co（co会返回Promise，这样可以Yieldable，但难度较大，适合老手）

头2种是比较常用的，第三种co作为promise生成器，是一种hack的办法。

下面给出第一种和第二种的示例：

async function a2() {
  return new Promise((resolve, reject) => {
    setTimeout(resolve, 1000);
  })
}

async function a1() {
  console.log("hello a1 and start a2");
  await a2();
  console.log("hello end a2");
}

async function a0() {
  console.log("hello a0 and start a1");
  await a1();
  console.log("hello end a1");
}

a0()

执行

需要使用babel或者其他支持async函数的编译工具，这里使用runkoa（是为koa支持async函数做的基于babel的简单封装）

$ runkoa async.js
async.js
3babel presets path = /Users/sang/.nvm/versions/node/v4.4.5/lib/node_modules/runkoa/node_modules/
hello a0 and start a1
hello a1 and start a2
hello end a2
hello end a1

异常处理

Node.js里关于异常处理有一个约定，即同步代码采用try/catch，非同步代码采用error-first方式。对于Async函数俩说，它的Await语句是同步执行的，所以最正常的流程处理是采用try/catch语句捕获，和generator/yield是一样的。

下面的代码所展示的是通用性的做法：

try {
  console.log(await asyncFn());
} catch (err) {
  console.error(err);
}

很多时候，我们需要把异常做得粒度更细致一些，这时只要把Promise的异常处理好就好了。

Promise里有2种处理异常的方法

then(onFulfilled, onRejected)里的onRejected，处理当前Promise里的异常
catch处理全局异常

Async函数总结

Async函数语义上非常好
Async不需要执行器，它本身具备执行能力，不像Generator
Async函数的异常处理采用try/catch和Promise的错误处理，非常强大
Await接Promise，Promise自身就足够应对所有流程了
Await释放Promise的组合能力，外加Promise的then，基本无敌

>>>> 3. co引出的“血案”

ES6的Generator本意是为了计算而设计的迭代器，但tj觉得它可以用于流程控制，于是就有了co，co的历史可以说经历了目前所有的流程控制方案，而且由于支持Generator和yield就导致yieldable。

实际上co和Generator是把双刃剑，给了我们强大便利的同时，也增加了非常多的概念，可能是过渡性的，也可能是过时的。

可是，你真的需要了解这么多么？从学习的角度，当然是多多意义，如果从实用的角度看，你可能不需要。

存在即合理，那么我们就看看这“血案”吧:

学习ES6的Generator
了解ES6的迭代器和迭代器相关的2种协议，了解for-of
了解co和co的2种用法，源码
了解yieldable 5种（包括不常用Thunk）
如果是koa，还需要了解convert和compose

>>>> 4. 5种 yieldable

yieldable本来是没有这个词的，因为在Generator里可以是yield关键词，而yield后面接的有5种可能，故而把这些可以yield接的方式成为yieldable，即可以yield接的。

Promises
Thunks (functions)
array (parallel execution)
objects (parallel execution)
Generators and GeneratorFunctions

这里我把co和promise做了简单的关键，同时区分Yieldable里的并行和顺序执行处理方式，以便大家能够更好的理解co和Yieldable。

顺序执行
- Promises
- Thunks
并行
- array
- objects

无论是哪种，它们其实都可以是Promise，而既然是Thunk对象，它们就可以thenable，而co v4.6版本的执行的返回值就是Promise，至此完成了左侧闭环。

至于Generator和GeneratorFunction就要从yield和yield*讲起，在koa 1.x和2.x里有明显的应用。

最关键的是，Generator是用来计算的迭代器，它是过渡性的产物。yiedable足够强大，只是学习成本稍高，理解起来也有些难度。

>>>> 5. 推导出学习重点

综上所述

Async函数是趋势，如果Chrome 52. v8 5.1已经支持Async函数(https://github.com/nodejs/CTC/issues/7)了，Node.js支持还会远么？
Async和Generator函数里都支持promise，所以promise是必须会的。
Generator和yield异常强大，不过不会成为主流，所以学会基本用法和promise就好了，没必要所有的都必须会。
co作为Generator执行器是不错的，它更好的是当做Promise 包装器，通过Generator支持yieldable，最后返回Promise，是不是有点无耻？

我整理了一张图，更直观一些。

红色代表Promise，是使用最多的，无论async还是generator都可用
蓝色是Generator，过度货
绿色是Async函数，趋势

结论：Promise是必须会的，那你为什么不顺势而为呢？

推荐：使用Async函数 + Promise组合，如下图所示。

实践

合理的结合Promise和Async函数是可以非常高效的，但也要因场景而异

Promise更容易做promisefyAll（比如使用bluebird）
Async函数无法批量操作

那么，在常见的Web应用里，我们总结的实践是，dao层使用Promise比较好，而service层，使用Async/Await更好。

dao层使用Promise：

crud
单一模型的方法多
库自身支持Promise

这种用promisefyAll基本几行代码就够了，一般单一模型的操作，不会特别复杂，应变的需求基本不大。

而service层一般是多个Model组合操作，多模型操作就可以拆分成多个小的操作，然后使用Await来组合，看起来会更加清晰，另外对需求应变也是非常容易的。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

31.md

31.md

>>>> 1. 从下一代测试框架ava说起

>>>> 2. 流程控制的6个演进步骤

>>>> 3. 同步VS异步

同步写法

Callback同步写法

>>>> 3. 普通函数、Generator函数和Async函数

（2）生成器Generators/yield

（3）Async函数/Await（以前说是ES7 stage-3）

>>>> 3. co引出的“血案”

>>>> 4. 5种 yieldable

>>>> 5. 推导出学习重点

Files

31.md

Latest commit

History

31.md

File metadata and controls

>>>> 1. 从下一代测试框架ava说起

>>>> 2. 流程控制的6个演进步骤

>>>> 3. 同步VS异步

同步写法

Callback同步写法

>>>> 3. 普通函数、Generator函数和Async函数

（2）生成器Generators/yield

（3）Async函数/Await（以前说是ES7 stage-3）

>>>> 3. co引出的“血案”

>>>> 4. 5种 yieldable

>>>> 5. 推导出学习重点