
## 1 定义
RPC 的全称是 Remote Procedure Call 是一种进程间通信方式。 它允许程序调用另一个地址空间（通常是共享网络的另一台机器上）的过程或函数，而不用程序员显式编码这个远程调用的细节。


## 2 起源
RPC 这个概念术语在上世纪 80 年代由 Bruce Jay Nelson 提出。


## 3 目标
RPC 的主要目标是让构建分布式计算（应用）更容易，在提供强大的远程调用能力时不损失本地调用的语义简洁性。


## 4 分类
－　同步调用
－　异步调用
>如何客户端不关心调用返回结果，则变成单向异步调用。

![图片1.png](https://i.loli.net/2019/04/22/5cbc944147f69.png)

异步和同步的区分在于是否等待服务端执行完成并返回结果。


## 5 结构


### 5.1 模型

- RFC1050

>  The Sun RPC protocol is based on the remote procedure call model,
   which is similar to the local procedure call model.  In the local
   case, the caller places arguments to a procedure in some well-
   specified location (such as a register window).  It then transfers
   control to the procedure, and eventually regains control.  At that
   point, the results of the procedure are extracted from the well-
   specified location, and the caller continues execution.


>  The remote procedure call model is similar.  One thread of control
   logically winds through two processes: the caller's process, and a
   server's process.  The caller process first sends a call message to
   the server process and waits (blocks) for a reply message.  The call
   message includes the procedure's parameters, and the reply message
   includes the procedure's results.  Once the reply message is
   received, the results of the procedure are extracted, and caller's
   execution is resumed.

>  On the server side, a process is dormant awaiting the arrival of a
   call message.  When one arrives, the server process extracts the
   procedure's parameters, computes the results, sends a reply message,
   and then awaits the next call message.

- Ｎelson的论文

    - User 
    - User-stub 
    - RPCRuntime 
    - Server-stub 
    - Server
![](https://segmentfault.com/img/remote/1460000008550404)

### 5.2 拆解

## RPC与LPC
LPC，指与远程过程调用对应的本地过程调用，在linux环境下习惯称之为IPC，即进程间通信。

linux中IPC有如下实现方式：
- 管道
- 共享内存
- 信号量
- Socket套接字
- 信号（终端命令行程序常用）
- 消息队列（内核中的链表，逐渐淘汰）


## RPC与分布式微服务

web服务的技术体系结构图：
![](https://ketao1989.github.io/images/2016/12/web_service.png)

先看大名鼎鼎的Java RMI：
![](https://ketao1989.github.io/images/2016/12/rmi.png)

一个通用的RPC架构可以简单描述如下：
>一般，远程过程调用RPC就是本地动态代理隐藏通信细节，通过组件序列化请求，走网络到服务端，执行真正的服务代码，然后将结果返回给客户端，反序列化数据给调用方法的过程。

也就是奥利奥说的，RPC的本质就是**socket** + **动态代理**。


![](https://ketao1989.github.io/images/2016/12/rpc.png)

## RPC与RESTfulAPI
先看REST。
![深度截图_选择区域_20190421233733.png](https://i.loli.net/2019/04/21/5cbc8e7dcced6.png)


>资料出处：<https://eggjs.org/zh-cn/basics/router.html#restful-%E9%A3%8E%E6%A0%BC%E7%9A%84-url-%E5%AE%9A%E4%B9%89>



个人理解，REST中的`request.method`和`request.url.path`共同构成了RPC调用中的`远程方法`。特别的，REST中经常出现的`/api/v1`中的版本号，也和RPC协议中有关方法版本号的论述殊途同归。

## RFC1050：RPC第一版，1988/04

与本地过程调用的差异：
- Error handling: failures of the remote server or network must be handled when using remote procedure calls.

- Global variables and side effects: since the server does not have access to the client's address space, hidden arguments cannot be
 passed as global variables or returned as side effects.

- Performance:  remote procedures usually operate at one or more orders of magnitude slower than local procedure calls.

- Authentication: since remote procedure calls can be transported
over unsecured networks, authentication may be necessary.
Authentication prevents one entity from masquerading as some other
entity.


RPC协议本身与**客户端服务端的绑定以及交互**是独立的。
>Implementors should think of the RPC protocol as the jump-subroutine
   instruction ("JSR") of a network


The RPC protocol must provide:

      (1) Unique specification of a procedure to be called.
      (2) Provisions for matching response messages to request messages.
      (3) Provisions for authenticating the caller to service and
          vice-versa.
          
features worth supporting because of **protocol roll-over errors, implementation
   bugs, user error, and network administration**
   
      (1) RPC protocol mismatches.
      (2) Remote program protocol version mismatches.
      (3) Protocol errors (such as misspecification of a procedure's
          parameters).
      (4) Reasons why remote authentication failed.
      (5) Any other reasons why the desired procedure was not called.

此外还定义了详细的
- [RPC消息协议](https://tools.ietf.org/html/rfc1050#section-8)
- [RPC认证协议](https://tools.ietf.org/html/rfc1050#section-9)

一个比较直观的数据结构，**Unix Authentication**
```c
 struct auth_unix {
    unsigned int stamp;
    string machinename<255>;
    unsigned int uid;
    unsigned int gid;
    unsigned int gids<10>;
 };
```
接下来讲Unix认证的一些缺陷，以及应对之策[DES](https://www.ibm.com/support/knowledgecenter/en/ssw_aix_71/com.ibm.aix.progcomc/data_encr_std.htm)。

总结来说，Sun公司使用TCP/UDP，以及[XDR(a standard for the description and encoding of data)](https://tools.ietf.org/html/rfc1014)实现了RPC协议。

- RFC 1057: RPC 第二版 1988/06
- RFC 1831: RPC 第二版 1995/08
- RFC 5531: RPC 第二版 2009/02 (RFC正式稿）


# gRPC

## gRPC over HTTP2

### Request

- Request → Request-Headers *Length-Prefixed-Message EOS

```
HEADERS (flags = END_HEADERS)
:method = POST
:scheme = http
:path = /google.pubsub.v2.PublisherService/CreateTopic
:authority = pubsub.googleapis.com
grpc-timeout = 1S
content-type = application/grpc+proto
grpc-encoding = gzip
authorization = Bearer y235.wef315yfh138vh31hv93hv8h3v

DATA (flags = END_STREAM)
<Length-Prefixed Message>
```

### Response
- Response → (Response-Headers *Length-Prefixed-Message Trailers) / Trailers-Only

```
HEADERS (flags = END_HEADERS)
:status = 200
grpc-encoding = gzip
content-type = application/grpc+proto

DATA
<Length-Prefixed Message>

HEADERS (flags = END_STREAM, END_HEADERS)
grpc-status = 0 # OK
trace-proto-bin = jher831yy13JHy3hc
```

### HTTP2中的gRPC传输映射

- Stream ID
>gRPC中每个调用都需要分配一个内部id，实际上就是http2中stream的id。而stream的id，只能保证在一个http2会话中唯一，如果一个进程处理多个http2会话，就不能保证唯一性了。

- Data Frames
>http2数据帧的边界与**Length-Prefixed-Message**的边界是没有关联的。

- Errors
>gRPC的运行时错误，会在一个HEADERS帧（跟踪消息帧）中发给客户端。其中`grpc-status`字段是错误码，可以参考[HTTP2与gRPC错误码对照表](https://github.com/grpc/grpc/blob/master/doc/PROTOCOL-HTTP2.md#errors)。


## gRPC的wireshark抓包

### 步骤
#### 1. [配置wireshark抓包HTTP2](https://github.com/elixir-grpc/grpc/wiki/How-to-capture-HTTP2-packages-using-Wireshark)

#### 2. 运行gRPC示例程序


### 3. 报文分析
从最简单的`hello_world`开始，6个包：
1. Magic, SETTINGS, WINDOW_UPDATE, PING 
>客户端发给服务端的。
>Seq: 1, Ack: 1 （一次握手）

2. HEADERS, WINDOW_UPDATE, DATA, WINDOW_UPDATE
>客户端发给服务端的。正常http报文内容。调用函数名在headers里面，字段为path。
>Seq: 100, Ack: 1

3. SETTINGS,WINDOW_UPDATE,PING
>服务端发给客户端的。
>Seq: 1  Ack: 411 (二次握手）

4. PING,SETTINGS,WINDOW_UPDATE
>服务端发给客户端的。
>Seq: 64, Ack: 411

5. PING,SETTINGS
>客户端发给服务端的。
>Seq: 411 Ack: 103 （三次握手）

6. HEADERS,DATA,HEADERS
>服务端发给客户端的response。第一个headers是普通的http response headers，data之后的headers是grpc的status和message。
>Seq: 103 ACK: 437



前面所说的Trailers就是紧跟响应体的这个headers帧里的**Status**和**Status-Message**。如果程序报错的话，异常信息就在这里。

比如：
![深度截图_选择区域_20190421183649.png](https://i.loli.net/2019/04/21/5cbc47dd128ff.png)


### 多路复用 multiplexing

先看一张图。
![](https://qiniu.nihaoshijie.com.cn/kp2.png)


如果需要**同时/并行/串行**调用多个服务，通常怎么做（如何通过提高并行度从而提高性能）？

- 多线程
- 异步网络I/O


### 流 streaming
服务类型可以分为4类：
1. Unary RPCs
客户端发送一个请求给服务端，从服务端获取一个应答，就像一次普通的函数调用。

2. Server streaming RPCs
客户端发送一个请求给服务端，可获取一个数据流用来读取一系列消息。客户端从返回的数据流里一直读取直到没有更多消息为止。

3. Client streaming RPCs
客户端用提供的一个数据流写入并发送一系列消息给服务端。一旦客户端完成消息写入，就等待服务端读取这些消息并返回应答。

4. Bidirectional streaming RPCs
两边都可以分别通过一个读写数据流来发送一系列消息。这两个数据流操作是相互独立的，所以客户端和服务端能按其希望的任意顺序读写，例如：服务端可以在写应答前等待所有的客户端消息，或者它可以先读一个消息再写一个消息，或者是读写相结合的其他方式。每个数据流里消息的顺序会被保持。

### cancellation
语言相关，也与I/O模型相关，通常使用`Context`实现，读到EOF即认为是CACEL，从数据包看就是连接以PING-PONG结束。
>you can use io.grpc.Context to cancel any stub type. For blocking you can interrupt the thread; for future you can cancel the future; for async you can use ClientCallStreamObserver.cancel() by casting the returned StreamObserver to ClientCallStreamObserver or implementing having your passed-in StreamObserver implement ClientResponseObserver. [How to cancel a GRPC Server streaming call](https://github.com/grpc/grpc-java/issues/3095)

它不是一个"撤销"， 在取消前已经完成的不会被回滚。当然，通过同步调用的 RPC 不能被取消，因为直到 RPC 结束前，程序控制权还没有交还给应用。

### Deadline/Timeouts

对应于HTTP2的是RST_STREAM帧。

gRPC的cancellation不是撤销，在撤销前已经完成的不会被回滚。当然，通过同步调用的 RPC 不能被取消，因为直到 RPC 结束前，程序控制权还没有交还给应用。

### Retry Design

重试的**源头**，可能是Stub层传输有问题，也可能是用户程序代码有问题，总而言之，重试策略是与底层http2协议关系不大的。

详细文档可以参考：[gRPC Retry Design](https://github.com/grpc/proposal/blob/master/A6-client-retries.md)。

### Protobuf
提问：protobuf和json比较如何？


- 序列化与反序列化
![](https://static001.infoq.cn/resource/image/71/b4/71b5ccde81d13608af65ee077f7c4bb4.jpg)
>数据来源：[Protobuf 有没有比 JSON 快 5 倍？](https://www.infoq.cn/article/json-is-5-times-faster-than-protobuf)



- 传输体积
比json和xml都小。

![](http://ngudream.com/2017/08/15/java-protobuf-superior/fed19654-3ea0-3e49-b5ab-4a722a3c655f.png)
![](http://ngudream.com/2017/08/15/java-protobuf-superior/9369a50d-f9ea-3f01-bd1f-fabba514dbec.png)

protobuf采用Zigzag编码，该编码使用了Varint技术。Varint 是一种紧凑的表示数字的方法。它用一个或多个字节来表示一个数字，值越小的数字使用越少的字节数。有点像UTF-8对吧？

### gRPC的缺点
- 一次gRPC调用需要解码两次，一次是header，一次是data
- 尽管HPAC可以压缩header，但是对于确定的调用，其实一个int就够了（对应于RFC1050中的program number）。

## 参考资料
- [深入了解 gRPC：协议](https://www.jianshu.com/p/48ad37e8b4ed)
- [深入浅出RPC原理](https://ketao1989.github.io/2016/12/10/rpc-theory-in-action/)
- [RPC 的概念模型与实现解析](https://segmentfault.com/a/1190000005178084)
- [一个爬虫工程师的技术博客：gRPC](http://maqiangthunder.github.io/2016/07/04/%E6%9D%82/gRPC/)
- [HTTP/2 and gRPC — The Next Generation of Microservices Interactions]()
- [HTTP2详解](https://juejin.im/post/5b88a4f56fb9a01a0b31a67e)
- [dubbo协议](http://dubbo.apache.org/zh-cn/docs/user/references/protocol/dubbo.html)
- [HTTP/2 幕后原理](https://www.ibm.com/developerworks/cn/web/wa-http2-under-the-hood/index.html)
- [抓包gRPC的细节及分析](https://jingwei.link/2018/10/02/grpc-wireshark-analysis.html)
- [HPACK: Header Compression for HTTP/2](https://httpwg.org/specs/rfc7541.html)
- [http-parser](https://github.com/nodejs/http-parser)
- [gRPC的HTTP2实现](https://ninokop.github.io/2018/06/18/gRPC%E7%9A%84HTTP2%E5%AE%9E%E7%8E%B0/)
- [思考gRPC ：为什么是HTTP/2](http://hengyunabc.github.io/thinking-about-grpc-http2/)
- [HTTP2 协议上的 gRPC](https://doc.oschina.net/grpc?t=58011) (原文[gRPC over HTTP2](https://github.com/grpc/grpc/blob/master/doc/PROTOCOL-HTTP2.md)
- [Protobuf 有没有比 JSON 快 5 倍？](https://www.infoq.cn/article/json-is-5-times-faster-than-protobuf)
- [Protobuf 的优势在哪里？](http://ngudream.com/2017/08/15/java-protobuf-superior/)
- [Introducing gRPC Support with NGINX 1.13.10](https://www.nginx.com/blog/nginx-1-13-10-grpc/)
- [grpc实现一个较复杂的聊天室](https://my.oschina.net/tuxpy/blog/1645030)
- [NFS 文件系统源代码剖析](https://www.ibm.com/developerworks/cn/linux/l-cn-nfs/index.html)
- [晁岳攀---基于go的 rpc框架实践](http://www.10tiao.com/html/528/201809/2653371218/1.html)