返回信息流在做时序数据的异常检测,刚好sklearn里有iForest的包,本打算试一试,但是有一些问题没有想明白:
本来是计划用前几天的正常曲线做训练,用今天的曲线做检测,但是我希望拿到的异常点是今天与前几天相比差异较大的,所以今天每一分钟的数据都是一个检测点,并且每一分钟的数据对应的训练数据应该都是不同日期同一时刻的数据,这样的话,如果我以1min为粒度统计数据,一天有1440个数据,岂不是要有1440个训练模型。。。
求大神指点
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #25278同步于 2017/8/10
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
【问题】时序数据分析可以用Isolation Forest么
eha
2017/8/10镜像同步4 回复
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
因为刚开始接触异常检测这里,所以看了腾讯云社区的一篇文章里面写的就去调研了[ema1]
因为我就想做这样的效果,就盲目的跟了风[ema16]
【 在 chinapds 的大作中提到: 】
: 所以就要做好特征了啊。。。
: 纯时序信息的话,用时序模型预测不行吗?和预测值偏差大的当异常
刚搜到了,文章里有一节《特征提取》,好好看看那一节的内容,理解了就知道到底做的啥事了
【 在 eha 的大作中提到: 】
: 因为刚开始接触异常检测这里,所以看了腾讯云社区的一篇文章里面写的就去调研了
: [upload=1][/upload]
: 因为我就想做这样的效果,就盲目的跟了风
谢谢,是我之前取巧了
【 在 chinapds 的大作中提到: 】
: 刚搜到了,文章里有一节《特征提取》,好好看看那一节的内容,理解了就知道到底做的啥事了
: