返回信息流如题,网上相关内容好少啊。。求各位大佬指点下思路。
目前是打算滑动窗口,提取一些最大最小值之类的作为窗口特征(特征提取也不是很清楚,如果能一起指点下就更拜谢啦),然后用最近的几个窗口建模(构造了一个队列),再对新窗口预测,如果新窗口是异常的则输出,并继续滑动,否则将其加入到建模队列中,并执行出队操作。直到窗口末端触底则结束。
然后还比较疑惑应该在哪个地方进行归一化操作呀?是在窗口特征提取之前吗?
这种做法有没有可行性啊。。因为是没有标签的数据。。做出来感觉很虚。。
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #37465同步于 2021/2/1
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
【时间序列】【异常检测】请问怎么用孤立森林,OCSVM做时间序列
a49781178
2021/2/1镜像同步7 回复
订阅后,新回复会通过你的通知中心匿名送达。
7 条回复
孤立森林和单类SVM的本质还是离群点检测吧?感觉不太适合做时间序列的异常检测,毕竟手动构建的时间序列特征不算可靠。最简单有效的办法还无脑上LSTM。
换句话说,如果你用孤立森林或者SVM的效果如果超过了LSTM,大概率是因为存在某些特别强的特征,很容易退化成简单的if 特征 then 异常的模型。
您好,请问下 是使用Lstm进行预测吗
【 在 Zelda (Zelda) 的大作中提到: 】
: 孤立森林和单类SVM的本质还是离群点检测吧?感觉不太适合做时间序列的异常检测,毕竟手动构建的时间序列特征不算可靠。最简单有效的办法还无脑上LSTM。
: 换句话说,如果你用孤立森林或者SVM的效果如果超过了LSTM,大概率是因为存在某些特别强的特征,很容易退化成简单的if 特征 then 异常的模型。
目前是打算模拟一段异常数据作为标签进行尝试
【 在 a546167160 (【意涵团】^_^) 的大作中提到: 】
: 异常检测没有标签的数据很难做,拿什么做评价指标呢,之前尝试过,后来就不了了之了...
用LSTM的话regression或者分类都行吧,区别就是异常的判断是交给规则还是交给classifier了,没本质区别。直观的感觉是:要是数据标注得差劲,那回归+规则效果会更好,反之如果数据标注质量高,LSTM直接分类效果更好。
如果想用SVM/孤立森林的话我还有个不太靠谱的想法:既然是时间序列,可以考虑别在时域死磕,从频域下手也值得一试,频谱保留的信息总比hand-crafted的特征多。
PS. 我纯外行,都是瞎说的。
【 在 a49781178 的大作中提到: 】
: 您好,请问下 是使用Lstm进行预测吗
频域基本没接触过,暂时不考虑。谢谢您答复啦
【 在 Zelda (Zelda) 的大作中提到: 】
: 用LSTM的话regression或者分类都行吧,区别就是异常的判断是交给规则还是交给classifier了,没本质区别。直观的感觉是:要是数据标注得差劲,那回归+规则效果会更好,反之如果数据标注质量高,LSTM直接分类效果更好。
: 如果想用SVM/孤立森林的话我还有个不太靠谱的想法:既然是时间序列,可以考虑别在时域死磕,从频域下手也值得一试,频谱保留的信息总比hand-crafted的特征多。
: ...................