返回信息流RT,目前有的数据是一批用户和一批项目的电话推销结果,只能拿到是否推销成功、通话时长等信息,求问有什么好的方法来提升模型效果?
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #16665同步于 2015/7/24
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
特征数量比较少,有什么好的方法可以提升模型效果?
kaize0409
2015/7/24镜像同步9 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
(1)能找属性就继续找属性(属性是根本) (2)尝试不同分类模型 (3)调节模型参数 (4)考虑多模型ensemble(一般能提高点,但提高有限,说到底属性是关键)
这……如果只有“被叫号码”、“是否成功”(布尔)和“通话时长”(数值)几个变量的话,信息其实有点少,试试核+回归?瞎猜的~
不过如果有推销类型的话,可以试试类似于协同滤波之类的,就把他当做半个推荐系统好了…………
(没想到我最讨厌的电话推销居然都开始用机器学习了,给跪,看来以后xxx号码通之类的垃圾电话拦截软件是必备的了……)
我的理解,不是特征少,而是有效特征少,做模型最重要是特征是否与目标存在关系,如果存在关系,特征少也可以做出好模型,如果不存在关系,多也做不出好模型,garbage in, garbage out
技术手段上,通话时长可以分段离散化,通话时间点是不是也可以拿到,对应的业务员的统计信息是不是可以有,如果有可能拿到具体的语音数据,做个语音解码+文本分析应该是最理想的。