Update Chapter 10 #86

xuehui1991 · 2022-04-21T08:44:48Z

No description provided.

Textbook/术语表.md

YanjieGao · 2022-04-21T08:53:30Z

Textbook/第10章-强化学习系统/10.2.1-分布式强化学习算法.md

 - 对于采样器：策略（Policy， 即Q-Network）与环境交互，同样涉及探索与利用。但是GORILA里定义了一个Bundled Mode，即采样器的策略与学习器中实时更新的Q-Network是捆绑的。

 - 对于学习器： 学习器中对于Q-Network的参数梯度会发给参数服务器。

 - 对于重放缓冲区：在GORILA里分两种形式，在本地（local） 模式下就存在采样器所在的机器上；而多机（Golbal）模式下将所有的数据聚合在分布式数据库中，这样的优点是可伸缩性好，缺点是会有额外的通信开销。

 - 对于参数服务器：存储Q-Network中参数的梯度（Gradient）的变化，好处是可以让Q-Network进行回滚，并且可以通过多个梯度（Gradient)来使训练过程更加稳定。在分布式环境中，不可避免的就是稳定性问题（比如节点消失、网速变慢或机器变慢）。GORILA中采用了几个策略来解决这个问题，如丢弃过旧的和损失值（Loss）太过偏离均值时的梯度。
+>>>>>>> main


Textbook/第10章-强化学习系统/10.2.1-分布式强化学习算法.md

YanjieGao · 2022-04-21T08:54:41Z

图中可能时间作为下横轴，圆圈内为算法名更好些

xuehui1991 added 18 commits April 8, 2022 12:43

change the chapter number

bef3c66

minus change

9d127fe

change the README.md

1d8d0e5

minus change in introduction in section 10

f613a82

minus change

d3f201d

add word to dict

5082786

minus change

0ce5813

Merge bran 'main' into xuehui

3e0ec29

minus change

d67dc88

minus change

d6941e7

minus change

6c0217b

minus change

79884e1

minus change

6ff7e11

minus change

9cc6c0d

change the dir

6eba73f

add figure of ppt; minus change

3550534

Merge branch 'main' of https://github.com/microsoft/AI-System

152e82f

Merge branch 'main' into xuehui

4f3db12

xuehui1991 requested a review from YanjieGao April 21, 2022 08:44

YanjieGao reviewed Apr 21, 2022

View reviewed changes

Textbook/术语表.md Outdated Show resolved Hide resolved

YanjieGao reviewed Apr 21, 2022

View reviewed changes

Textbook/第10章-强化学习系统/10.2.1-分布式强化学习算法.md Outdated Show resolved Hide resolved

xuehui1991 added 5 commits April 21, 2022 17:09

update the table

3ace0f1

add tables

f1b298a

minus change

3e466c5

minus change

a21e592

minus change

045f69c

YanjieGao mentioned this pull request Apr 21, 2022

Issues in chapter 10 #75

Closed

YanjieGao approved these changes Apr 21, 2022

View reviewed changes

YanjieGao merged commit 8752bbc into main Apr 21, 2022

YanjieGao deleted the xuehui branch April 21, 2022 12:52

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Update Chapter 10 #86

Update Chapter 10 #86

xuehui1991 commented Apr 21, 2022

YanjieGao Apr 21, 2022

YanjieGao commented Apr 21, 2022

Update Chapter 10 #86

Update Chapter 10 #86

Conversation

xuehui1991 commented Apr 21, 2022

YanjieGao Apr 21, 2022

Choose a reason for hiding this comment

YanjieGao commented Apr 21, 2022