Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

滑窗法中节假日提取特征的疑问 #3

Open
176coding opened this issue Feb 11, 2017 · 7 comments
Open

滑窗法中节假日提取特征的疑问 #3

176coding opened this issue Feb 11, 2017 · 7 comments

Comments

@176coding
Copy link

你好,你曾经分享过视频,对视频中的滑窗法有点疑问:
qq 20170211142206
如图:

  1. 在Dataset1的“标签区间”含有5月1号劳动节,假如节日对目标变量有关系的话,是否应该创建一个特征叫 is_holiday,
  2. 与上一个问题差不多,在Dataset2的“特征区间”含有含有5月1号劳动节,假如节日对目标变量有关系的话,那么这种情况该如何处理呢,

谢谢

@QiaoXiao7282
Copy link

@176coding 你好,我想问下,你说的这个视频的链接有吗?

@stepByStepToSky
Copy link

@176coding @Jason7282 @wepe 你好,我想问下,可以分享一下这个视频的链接有吗?

@whuhit
Copy link

whuhit commented Sep 1, 2017

同问啊?视频哪里有分享的?

@whuhit
Copy link

whuhit commented Sep 1, 2017

@qk-huang
Copy link

qk-huang commented Oct 2, 2017

感觉利用划窗法,在划分数据集按时间划分,其中5.1节假日前后只有一段时间,要不测试集没有,要不训练集没有。像视频所说最好使用去年5月份同比。

@zhuzhujulie
Copy link

什么时候用滑窗法?什么时候用交叉验证法呢?

@RockyHoo1209
Copy link

从代码逻辑来看,extract_feature.py中的滑窗法 应该和我以前做过的不太一样 这里发表一下 不知道理解的逻辑是否有误。这题因为不是时间序列问题,所以实际构造的滑窗是前面一段较长时间分析的特征+后一个月的时间(即this_month系列特征),而不是前面一个时间段的窗内数据做x,后一个作y这种形式。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

7 participants