LJ10211289@LJ10211289
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“一般就是0.5了。如果你对precision和recall有不同的权衡,那就大于0.1或小于0.5 【 在 wawltor 的大作中提到: 】 : 那threshold怎么确定了 : : 通过『我邮2.0』发布”
“你可以对每个分类模型输出的分类概率进行加权,最后再设置一个threshold将加权之后的概率值变成分类label 【 在 wawltor 的大作中提到: 】 : 是这样的,现在我有几个最后的模型,但是我想做一次ensemble,网上有有些方法,比如投票,还有权重,但是在赋予权重的方法有点想不明白,因为是分类的模型,而且…”
“所以,最近听说业界多了一种职业,叫做“调参工程师””
“我擦,CIKM也不算,妥妥的B会啊 【 在 cxy0213 的大作中提到: 】 : CIKM也还行啊, 计算机科学与技术学科列表会议,在信通院评国奖竟然不算,按照普通EI折算。也是醉了。 : 略有不甘啊… :”
“VC维相关资料里说,实际应用中训练样本数量是所用模型VC维度的10倍就可以保证训练出模型的generalization,具体地对于实际问题中常用的线性分类器可以理解为训练样本数量是特征数量的10倍。不确定百度里是不是有上万个特征,但可以确定的是解决实际问题时约80%的时间都花在寻找有效特征以及有效的特征组合(即所谓的特…”
“嗯,有可能。但一般用线性模型之前都得做特征归一化处理,所以你说的情况可以事先避免;如果用得非线性模型就无所谓了 【 在 timruning 的大作中提到: 】 : 我感觉他的意思是,特征值单位不同,有的数值特大有的太小。”
“我觉得分类器是有能力get到这个点的,训练出来的权重本身就是较大的[em4]。如果你对这个本来就较大的权重还不满意,那就继续增大它的值,那么此时的权值向量至少在训练集上已经不是最优值了。如果你确信这样会对它在测试集的效果有提升,那就手动继续增大吧 【 在 lzc6996 的大作中提到: 】 : 不是要验证特征的重要性。…”
“我觉得目标函数没什么错啊,就是最典型的cross entropy error加上规则化项 【 在 gogotian 的大作中提到: 】 : 我怎么看着这目标函数不对呢 : 发自「贵邮」”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。