Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于时序数据周期性校验方法 #6

Open
xiaolong2009 opened this issue Apr 9, 2019 · 3 comments
Open

关于时序数据周期性校验方法 #6

xiaolong2009 opened this issue Apr 9, 2019 · 3 comments

Comments

@xiaolong2009
Copy link

不同指标的波动范围不同,不做归一化的话,仅靠dtw距离感觉不能很好的衡量周期性,况且阈值也不好定义,请问是否有考虑过这些问题

@jixinpu
Copy link
Owner

jixinpu commented Apr 9, 2019

在设置dtw阈值的时候,我们使用了人工的方法,看看哪种阈值的情况下,序列为周期序列。确实先归一化再去求dtw距离,这样误差会更好控制一些。
时间序列周期性最终归结为求序列相关性的问题,可以有很多方法去解决:皮尔逊相关系数、dtw都可以。
我们在实践中为了减少误报,使用了多种方法投票的方式来检测周期性问题。

@xiaolong2009
Copy link
Author

恩,就是指标多的情况下,人工定义阈值还是有一些麻烦,请问目前结合多种算法的话,准确率如何?
另外,之前看过百度的方案是 指标归一化后,两天的数据做差分,消除掉原有数据的全局波动,最后用方差来判断是否具有周期性,这个是衡量两天数据的偏移程度,也是一种方案,不过阈值还是不太好确定。

@jixinpu
Copy link
Owner

jixinpu commented Apr 15, 2019

我们使用的方法因为是人为去跟踪了一些时间序列,所以准确率还是很高的。但是不论使用哪种方法,我们都需要根据一些case自己去设置阈值。看了很多论文,好像都需要去设置阈值。因为周期性检测归根结底就是求距离,避免不了去设置阈值。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants