返回信息流用的sklearn库对支持向量机进行基于交叉验证的网格搜索,有4W+个样本,5个特征。设定搜索13个C,13个gamma。
交叉验证的变量是cv = StratifiedShuffleSplit(y, 1, test_size=0.2, random_state=42)
程序在我的小笔记本上跑了有19个小时了,还没出结果。
想问:
1. 这个程序很复杂吗,大概什么时候能跑出来QAQ
2. 用的Spyder,在哪里能看程序跑的怎么样了呀?(没查到QAQ)
请大神指教!(>﹏<)
(不知道我对问题的描述是否合理,如果有奇怪的地方也请指正!)
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #24194同步于 2017/5/22
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
sklearn库 求问为什么网格搜索程序跑得这么慢。。
ccyrene
2017/5/22镜像同步12 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
老实说,svm真心手动调就够了。一般来说gamma更重要,先用默认的c=1,找到最好的gamma。这时候你会发现c影响不大了,稍微调调就行了。不放心的话,再来一个循环
好的,谢谢~(^(エ)^)其实是需要写一个报告,然后想弄得看起来复杂一些(>_<)
【 在 sdlslx (立夏之光) 的大作中提到: 】
: 老实说,svm真心手动调就够了。一般来说gamma更重要,先用默认的c=1,找到最好的gamma。这时候你会发现c影响不大了,稍微调调就行了。不放心的话,再来一个循环
我试了一下跑100个,感觉就是几秒就出结果了。时间可能不是线性增长的?
【 在 hx0502001 (今心雨山||请叫我雨山) 的大作中提到: 】
: 话说先跑一个看看花多长时间,感觉你设的C和gamma有点多了,
我的意思是全样本训练一次SVM大概要多久,SVM复杂度至少是n^2级的~不是线性的,
【 在 ccyrene (ccyrene) 的大作中提到: 】
: 我试了一下跑100个,感觉就是几秒就出结果了。时间可能不是线性增长的?
通过『我邮2.0』发布