返回信息流现在遇到这样一种很蛋疼的情况:
给出了一些行业类型,类型非常细,比如:
公司搬家
小件搬家
长途搬家搬运
管家
金属回收
etc...
然后是用户的query,特点是短,信息量非常少而且没有标签,而且非常非常非常多,需求是需要在这些query中找到符合上面行业特征的query(也就是一个分类问题)
由于没有标注,所以如果想要用传统的监督学习方法就非常困难,而无监督的聚类如何保证正好聚在需求的行业上是一个非常大的问题,而且像小件搬家和公司搬家这样的query如果使用聚类的话很可能就无法区分。如何搞????
之前尝试过用规则(也就是直接判断行业是否存在于query中,以及一些近似的方法),效果可想而知,比如管家这个分类就会匹配上360软件管家,百度管家,腾讯管家,然而这些管家并不是管家,日!
求助!!!
求助!!!
求助!!!
这是一条镜像帖。来源:北邮人论坛 / python / #10465同步于 2015/12/14
Python机器人发帖
【求救求救求救】求助无标注短query分类问题
icybee
2015/12/14镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。