Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于FDG及failure units的若干疑问 #5

Open
adverbial39 opened this issue Sep 15, 2022 · 3 comments
Open

关于FDG及failure units的若干疑问 #5

adverbial39 opened this issue Sep 15, 2022 · 3 comments

Comments

@adverbial39
Copy link

  1. 每个failure units的metric是怎么选定的?
    the experienced engineers of an online service system can define the candidate failure units by summarizing the indicative metric groups on different component classes. 可否理解为每个failure units的指标群是人工选择的?
  2. 为什么不能用GCN(3.3)
    您在论文中提到“ For generalizability, the feature aggregator should be structure-independent. Thus, graph convolutional network (GCN) [29] is unsuitable.”能否详细解释一下为什么要考虑structure-independent
  3. FDG是如何生成和更新的
    您在论文中有提到组件、部署关系会经常改变,这意味着FDG需要经常更新,这部分更新使利用专家经验完成吗?
  4. FDG是无向图,如何反应依赖/传播关系
    无向图表达相互影响,而非单方面影响(依赖),为什么能反应依赖关系呢?

期待您的解答(╹▽╹)

@lizeyan
Copy link
Member

lizeyan commented Sep 15, 2022

  1. 是的,可以说是人工选定的。准确来说,我们的实验中的做法,实际上是把我们监控到的所有指标分类成不同的failure class。
  2. strucuture-independent是希望让系统中类似的组件能共享模型。GCN的计算是和节点在图上的具体位置有关的,但是GAT就只和周围邻居的特征有关
  3. 你可以参考我在这个issue的回答 How to generate FDG automatically? #3
  4. 我们使用无向图的原因是因为,我们很难通过调用和部署关系确定故障传播的方向。比如service1部署在docker1上,那么docker1上的内存不足问题可以影响service1,但是如果是service1本身存在内存泄漏问题,那么就是service1反过来影响docker1,然后可能再影响docker1上的其他服务。因为这种不确定性,所以我们干脆用了无向图,避开了确定方向的问题。我们这个方法的本质思路,其实是学习故障特征(组件的指标特征和组件间在图上的相对关系)和根因之间的关系,并没有真的去分析故障传播的路径,所以用无向图也能够达到效果。当然,如果有更好的方法, 能得到更准确的故障实例间的因果关系图,应该是更好的。

@adverbial39
Copy link
Author

另外关于数据集还有几个问题:
a1和a2中的metric和metric_norm是什么关系?a2的指标包含a1的,两个集之间有什么关系?
数据集中的数据是原始数据还是归一化后的数据,如果是归一化后的,请问使用了什么归一化方法?

@lizeyan
Copy link
Member

lizeyan commented Sep 18, 2022 via email

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants