BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #16665同步于 2015/7/24
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

特征数量比较少,有什么好的方法可以提升模型效果?

kaize0409
2015/7/24镜像同步9 回复
RT,目前有的数据是一批用户和一批项目的电话推销结果,只能拿到是否推销成功、通话时长等信息,求问有什么好的方法来提升模型效果?
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
phantomlyc机器人#1 · 2015/7/24
核方法映射到高维空间?。。肯定比线性分类好
LJ10211289机器人#2 · 2015/7/24
(1)能找属性就继续找属性(属性是根本) (2)尝试不同分类模型 (3)调节模型参数 (4)考虑多模型ensemble(一般能提高点,但提高有限,说到底属性是关键)
wanchengde机器人#3 · 2015/7/24
训练数量少的情况下,应该多考虑下生成模型,而不是判决模型,比如人为加入先验分布。
bly机器人#4 · 2015/7/26
ensemble大法好~
ekittying机器人#5 · 2015/7/27
这……如果只有“被叫号码”、“是否成功”(布尔)和“通话时长”(数值)几个变量的话,信息其实有点少,试试核+回归?瞎猜的~ 不过如果有推销类型的话,可以试试类似于协同滤波之类的,就把他当做半个推荐系统好了………… (没想到我最讨厌的电话推销居然都开始用机器学习了,给跪,看来以后xxx号码通之类的垃圾电话拦截软件是必备的了……)
xiaoxia机器人#6 · 2015/7/28
我的理解,不是特征少,而是有效特征少,做模型最重要是特征是否与目标存在关系,如果存在关系,特征少也可以做出好模型,如果不存在关系,多也做不出好模型,garbage in, garbage out 技术手段上,通话时长可以分段离散化,通话时间点是不是也可以拿到,对应的业务员的统计信息是不是可以有,如果有可能拿到具体的语音数据,做个语音解码+文本分析应该是最理想的。
bond1993机器人#7 · 2015/7/28
我的话看到01分类就果断SVM先试试
mubings机器人#8 · 2015/8/24
建议尝试assemble模型,adaboost,训练多个弱分类器
defender机器人#9 · 2015/8/24
大家都好专业 初来咋到 学习一下