浏览器渲染原理简析

&#160; &#160; 对于用户而言，浏览器的使用。往往从url开始，一开始，我们会输入url，如果网络不是很慢的情况下，我们就能看到浏览器呈现的页面。

&#160; &#160; 对于一个前端而言，我们对这个过程似乎有更深层次的认知。我们输入了url域名，然后通过dns将域名转换成ip与端口，然后找到广义网络中的主机，然后才获取到html，浏览器拿到html，紧接着解析html，渲染css，最后呈现给了我们。

&#160; &#160; 实际上，在上面流程中，浏览器做了很多，我们似乎只写了一个html，html中引用了各种静态资源以及脚本。如果想要让我们的页面速度更快，了解浏览器变得很有必要。

浏览器主要架构：
并没有规范定义说一个浏览器必须具备什么样的功能和结构，但是市面上的浏览器大体都是按以下结构运作。这可能是浏览器竞争过程中互相借鉴学习的结果，如图
1. **用户界面**(user interface)：用户使用的界面包括标签栏等
2. **浏览器引擎**(browser engine)：将用户指令安排给下层组件执行，比如输入url，将告诉网络接口，用户进行了url输入操作，网络接口将进行url解析和获取
3. **渲染引擎**(render engine)：完成html解析，和css解析工作，并交由ui层绘制最终展示到用户界面
4. **网络接口**(networking)：处理网络相关的工作
5. **后端ui**(ui backend)：绘制ui组件
6. **JavaScript解释器**(js interpreter)：执行js脚本
7. **数据存储**(data presistence)：浏览器的数据存储层，包括cookie，storage以及html5的数据库

![layers](https://user-images.githubusercontent.com/15258919/64086559-94041100-cd6b-11e9-9a89-eb6e3b32ecf6.png)

浏览器渲染四个大流程：
1. **解析html**( parsing html to dom tree)
2. **构建渲染树**(render tree construction)
3. **渲染树布局**(layout of the render tree)
4. **绘制渲染树**(painting this render tree)

![浏览器主流程](https://user-images.githubusercontent.com/15258919/64087555-2e665380-cd70-11e9-9abc-45689cb89ed9.jpg)

&#160; &#160;这里简要介绍这几个大流程，到目前为止，讨论的都是结构流程上的东西，实际上是比较抽象的。
第一个流程解析html，主要是把对开发者友好的html格式文本转换成对机器友好的机器码，并且暴露一个dom树结构, 在解析html过程中，会根据样式脚本和dom树结构构建一个渲染树（render tree）。

&#160; &#160;渲染树包含html基本层级结构，以及对应的视觉样式（即不包含position的布局信息）。紧接着，会根据元素布局信息给渲染树（render tree）布局，形成布局以后的渲染树。在所有工作完成之后，会将渲染树交给ui接口去做绘制工作，并最终呈现在用户界面。

这里需要提下：

&#160; &#160;**以上流程从视觉上虽然是依次进行，但是浏览器在做这个工作的过程中是渐近式的。也就是说，在比如完成第一个div的解析过程中，就已经形成第一个div的dom元素，并且根据css样式形成渲染树节点render Object，此时解析过程还会继续，但是渲染树的构建也会一起进行，并且会呈现一部分内容到页面上，这样一定程度上让优化过程更快。**

### 流程细化

webkit流程示例：
![流程细化](https://user-images.githubusercontent.com/15258919/64088477-417b2280-cd74-11e9-9842-bfd6966c9c1d.png)

gecko流程示例：
![image008](https://user-images.githubusercontent.com/15258919/64088584-b6e6f300-cd74-11e9-979e-cf70dc1a4d1e.jpg)

&#160; &#160;webkit图上我加了一些注释，大体上，两个流程主流程是差不多的，但是在细化流程上有些执行方式的差异，包括对象命名，流程命名，但是其含义实际上是一样的。只是说gecko将render tree定义为frame，gecko会在遇到link时候去加载解析css样式，webkit似乎从一开始就对外部链接进行解析。接下来就细化后的流程在一一讲解。

### html解析
&#160; &#160;大部分解析器，类似js的解析过程，会从上到下分析语法语句，对一些赋值语句做变量提升。但是这种方式不适合html的解析过程，原因在于：

1. html允许各种宽松语法，比如不严格封闭标签</div>并不会造成语法错误等
2. html对自定义名称的标签也能解析
3. 在html解析过程中，自然也会遇到script方式的脚本，脚本中可能会频繁的操作dom对象，这样造成html解析过程是一个重复的过程。

&#160; &#160;有兴趣的可以在最下方的参考资料，或者查阅相关资料了解更多底层编译原理的细节。浏览器自定义的解析器通过两个步骤完成解析工作 (分词器)tokeniser ---> (树构建器)tree construction

&#160; &#160;tokeniser的作用是将html中每一个字符转换成对浏览器有意义的标记，tree construction在接收到转义完以后的有效标记如div，之后，创建对应的元素以及工作。

#### 1. 标记化算法

&#160; &#160;浏览器标记化这一过程，采用的是有限状态机这样的数学模型。简单的说有限状态机定义了一个有限的状态集合中，每一个状态到另一种状态的变化规律。

&#160; &#160;比如，对于订单流程，我就讨论未支付，支付中，支付完成，支付取消，退款这样五个状态的流转 支付取消可以变化成未支付状态，但是支付完成是不能变成支付取消状态，它只能走退款流程变成退款中状态。这就是支付流程的流转规律，而且流程中的状态是有限的，不可能有无限个状态的可能。

&#160; &#160;所以说对于某个状态机，其存在含义就是，我定义了如下(a, b, c .., f)等状态，并且我定义了他们之间能够完成的操作。那么这个状态机的运行，将在这个有限个状态中，按照我定义这种规律运行。
![微信截图_20190902153914](https://user-images.githubusercontent.com/15258919/64097843-dc392880-cd97-11e9-8a60-f9bac99ff988.png)

那浏览器的算法是如何利用这个状态机的呢？
针对这幅图，以及一个文章中的实例来说明这个过程。
简单的HTML结构：
```html
<html>
  <body>
    Hello world
  </body>
</html>
```
由下图我们知道有四个状态：
+ tag open  
+ tag close
+ tag name
+ data

&#160; &#160;现在，我们假设解释器读取到了上面的html文本，第一个字符是<，我们知道，对于html规范，这是一个标签的开始。所以状态机在遇到<字符时候，会流转成tag open状态，在tag open状态下，在这个状态下如果接收到任何a-z或者其他符合名称定义的字符，状态机流转到tag name。这个状态的意思是，从tag open状态到目前为止所有字符（到下一个>闭标签之前）将用于定义tag标签名称，遇到>字符。结束tag name状态，进入data状态。根据上面html文本，<html>直接是<（标签开启）, h-->t -->m -->l(读取文本), >(结束)。于是，状态机会给解释器输出一个html标记，并且读取下面内容<body>，重复以上过程，hello world（data状态中的读取）状态到</body>字符之前，会输出文本节点hello world。知道遇到<(tag open) ---> /(tag close)。通过上面的例子，也能体会到，流程的含义，比如tag close状态只能由tag open抵达，其他状态无法到达。

标记化算法状态机：
![image019](https://user-images.githubusercontent.com/15258919/64098098-96309480-cd98-11e9-8fe5-1533e3015563.png)

#### 2. 树构建算法
&#160; &#160;我们知道这个过程是需要前置过程，就是我们前面讨论的标记化算法，标记化能够将html文本标记成解释器能识别的标签，然后交于树构建器完成。树构建器在接收到这个标记之后需要做什么工作呢？可以初略窥探。

&#160; &#160;树构建的过程也可以按状态流转的方式去解释。（inital mode, before xx, after xx， in xx）四个状态。
xx表示对应的标签变量，来自标记化产生。

&#160; &#160;树构建器有个顶层节点document, 我们假设树构建器接收到来至标记化完成的html开始标签，状态流转伟before html。然后下一个送过来的标签是body，这里需要提一下的是，因为head是html的必要标签，所以在有送head的情况下会进入before header状态，自动流转到in head --> after head, 但是由于下一个就是body，所以浏览器走一个默认的流程，隐式创建完head之后才够走到in body。知道最后一个after html送来, 结束整个解析流程。每一个in状态中，树构建器都会创建相应的dom元素。最终会形成一整科dom树。同时，在有css解析参与情况下，将形成另一颗渲染树。

![image022](https://user-images.githubusercontent.com/15258919/64099855-e0b41000-cd9c-11e9-9d6c-a9190295f786.gif)

### dom树和渲染树
&#160; &#160;到目前为止，以上是对html的解析和处理，我们知道，html文本被读取转义之后，会输出DOM树，并且还会生成一个渲染树，渲染树是最终用于绘制可视化页面，所以说渲染树包含于页面结构类似的层级，并且还包含css的可视化样式。渲染树每个元素本身是根据其在dom树中对应的元素区分类型，如div--block，渲染树强调每个元素的样式，展示细节，对于dom中display为none的元素，不会出现在渲染树中。

### css解析

css解析过程可以用通用的解析器完成。因为，css语法没有上下文关系，比如对于：
```css
#app {
  background: red;
}
```
只需要定义严格正则的区分出: #app, background, red 。几个区域的含义即可。

但是css的和html元素的关联依然不是一个容易的过程，首先，
1. 对于标签的匹配路径（#app），如果处理不好，在面对繁多的元素时候，可能是一个低效率的过程。
2. 复制的渲染树结构每个元素的样式如果量过于庞大，对内存负担很大。
3. 层叠样式的计算

### 匹配流程的优化
&#160; &#160;到目前为止，回顾之前的流程，我们知道html序列化生成了dom树，dom树创建过程中也会不断就结合css样式规则，生成渲染树。在结合css的规则这个步骤，我们知道对css的解析可以用通用的解析器去完成，解析完的css会输出成一个数组，在webkit中，叫 **CSSStyleSheetList** 。CSSStyleSheetList每一项包含着一个css样式规则的内容，包括选择器部分(#app div), 以及样式声明中的属性(color)和对应的值(red)。

&#160; &#160;匹配的意思就是对于某个渲染树节点，如div block元素，假若它包含id，类名class,如下：
```html
<p>
  <div class='box' id='app'></div>
</p>
```
&#160; &#160;他可以声明为p .box#app的样式，却无法匹配table .box。如果他没有table的祖先。

&#160; &#160;浏览器对这个匹配流程优化，体现在一个突破点。我们以上面的例子，对于一个元素，如果他匹配了一个css规则，那么意味着这个元素包含css 选择器内容里面的最末端的匹配内容，比如上面p .box#app，对于匹配该表达式的元素，它肯定是包含id为app的元素。

&#160; &#160;所以浏览器在匹配上，都会进行末端匹配，webkit中会存放一个类型哈希表集合（CSSRuleSet）包含四个哈希表，分别是id哈希表（m_idRules），class哈希表(m_classRules)，标签哈希表(m_tagRules)，通用型哈希表(m_universalRules)。四个哈希表分别存放末端匹配属性的对应规则。

&#160; &#160;基于以上的数据结构，比如上面的div，他具有id：app，class：box，div: tagName, 所以他会在这个三个哈希表里面查找出所有可能的规则。但是以这种方式匹配出来的规则虽然不一定匹配该元素，但确实一次性过滤掉大量无关元素，而且只需要O（1）复制度，因为只需要哈希表匹配。

&#160; &#160;接下来对这个可能性样式规则数组通过选择器权值进行循环做selector检测，如果匹配，将加入结果数组。最终得到该元素的样式规则数组，按选择器权值进行排序。

### webkit共享数据的优化
&#160; &#160;webkit引擎中，对满足一定条件的同级元素，他们将共享样式。共享样式意味着，共享元素的样式只需要计算一次，不需要过滤样式，匹配样式选择器的流程。而且这样满足共享样式元素的比例还挺高。简单的总结就是必须是孪生兄弟，完全相同
1. 同级：很好理解，只有同级的元素他们才有共同的祖先，共同的祖先树结构，这意味着这两个兄弟之间只要满足一下条件就可以共享其只有

2. 没有id：如果某个兄弟有id，因为id是唯一符号，这意味着这个兄弟可能可以通过这个id拿到属于自己的样式，这种情况下就无法共享他样式，因为这个id样式一定只属于他自己。
举例：
```css
.content {
    color: green;  
} 
#unique-p {
    font-weight: bold;
}
```
```html
<span>
   <p class='content'>Same with my brother</p>
   <p class='content' id='unique-p'>i have a id</p>
</span>
```
即使没有font-weight样式， 很遗憾这两个p依然无法共享样式，尽管他们都是content，这一切都是id: unique-p害的。所以，在css优化中，不到万不得已，尽量就不加id可以让浏览器更多的共享样式规则。

3. 标签相同
4. 类名相同
5. 无内联样式
6. 相同属性
7. 焦点状态，即聚焦会有样式变化
8. 链接属性同理
9. 不能使用任何同级选择器

### Firefox的优化
&#160; &#160;firefox是利用树结构减少重复计算，数据共享问题。其定义两颗树，其中一颗是规则树，规则树每个节点是一个完整的css规则实例，包含选择器，以及块内容。对于已经匹配过的元素，会在规则树上生成节点。比如我们假设一个div有三个匹配样式，这三个样式的具有不同优先级，越往树低端优先级更高。我们再次假设有另一个div需要生成样式，由于之前已经有div生成了三个不同样式路径, 假设是A-->B-->C，挂载树上。所以这个div如果满足和以上div匹配规则的一部分，比如匹配A-->B。那么第二个div只需要使用B节点的样式即可。因为规则树每个节点保存着该样式路径上计算完的端值。

&#160; &#160;div节点引用了B节点的样式，这样的引用存储在另一个颗树里面，叫上下文树，顾名思&#160; &#160;意，用来存储节点和规则树直接的关系。

规则树使得不同优先级的样式可以按规律依次计算，并且拥有包含路径的样式得以共享。

### 层叠样式和样式选择器优先级
&#160; &#160;样式的来源有三个地方，一个是浏览器默认的样式，一个是网站开发者定义的样式，一个是用户在浏览器里设置的样式。这三个样式依次优先级为用户设置的重要样式>网站定义的重要样式>网站样式>用户设置样式>浏览器样式。

&#160; &#160;上面聊到层叠样式依靠选择器优先级叠加，样式的计算由高优先级到低优先级这样计算。这样可以减少计算量。比如对于有多个不同优先级的color定义，高优先级算出颜色以后，将不会再去取低优先级的color样式。

&#160; &#160;css选择器有以下类型:
1. 标签选择器(div)
2. class选择器
3. id选择器
4. 属性选择器(a[href])
5. 后代选择器(空格)
6. 子选择器(>)
7. 相邻选择器(+)
8. 伪类(:hover :first-child等)
9. 伪元素(:first-line)
10. 通配符(*)

&#160; &#160;选择器的优先级按照内联 style，id，类，属性和伪类选择器，标签和伪元素 四种类别个数依次计算计算。其他如相邻选择器不计数。可以用（a, b, c, d）四个数值来表示内联，id，类，标签选择器的个数。
例如以下样式：
```css
#app .content p {
     color: red;
}
```
可以表示为: (0, 1, 1, 1)
这样的：
```css
#app .content p div {
     color: red;
}
```
可以表示为: (0, 1, 1, 2)
```css
h1 + *[rel=up]
```
表示为：(0, 0, 1, 1)
比较大小依次从左到右比对，左边相同，比右边。

### 布局和回流
&#160; &#160;以上关于渲染树的样式计算只针对视觉属性，不包含元素的位置信息和大小。渲染树还需要布局信息，计算布局的这个过程叫做layout，布局。
&#160; &#160;基于平时css的布局经验，默认的元素是静态文档流的形式排布。所以可以想象，浏览器对渲染树中每个节点的渲染应该是采用流的方式，也就是至上而下，至左而右。所以，靠后的元素的布局往往不会影响其前面的元素。每一个元素都有一个layout方法，并且会递归调用子元素的layout方法。
&#160; &#160;第一次布局过程，后续js脚本对dom的操作也会引起页面的重新布局，通常将重新布局的过程称为回流（reflow）。这个过程依然是从上到下，遍历布局。所以也是一个非常大的消耗。布局和回流的过程，每个块元素采用的是盒模型方式去计算。盒模型相信都不陌生。每个盒模型定义了渲染器的大小，再通过坐标即可定义每一个元素应该定位的位置。

### 绘制和重绘
&#160; &#160;绘制就是把元素最终呈现到显示器上的方法，渲染的顺序是 背景颜色->背景图片->边框->子代->轮廓。所以后面的会覆盖前面的。部分样式的改变，也会引起浏览器重新绘制，即重绘。回流的代价会比重绘更大。所以在优化方面尽量避免重新回流。


参考资料：
[浏览器的工作原理：新式网络浏览器幕后揭秘](https://www.html5rocks.com/zh/tutorials/internals/howbrowserswork/#Layered_representation)

... 待编辑


Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

浏览器渲染原理简析 #7

流程细化

html解析

1. 标记化算法

2. 树构建算法

dom树和渲染树

css解析

匹配流程的优化

webkit共享数据的优化

Firefox的优化

层叠样式和样式选择器优先级

布局和回流

绘制和重绘

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

浏览器渲染原理简析 #7

Description

流程细化

html解析

1. 标记化算法

2. 树构建算法

dom树和渲染树

css解析

匹配流程的优化

webkit共享数据的优化

Firefox的优化

层叠样式和样式选择器优先级

布局和回流

绘制和重绘

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions