返回信息流嗯,对,肯定没法完全准备。不过至少得有点啥参照嘛。非常感谢你推荐这个链接,回去拜读^_^
【 在 PtwCJ 的大作中提到: 】
: 豆瓣的结果也不一定准确啊
: 你可以看看这个link
: http://iamcaihuafeng.blog.sohu.com/154207836.html
: ...................
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #6951同步于 2010/7/6
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
Re: 请问做推荐的朋友,如何检测一个推荐系统的准确率或者其它
stupidboy
2010/7/6镜像同步4 回复
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
thx a lot :)
【 在 Bergwolf 的大作中提到: 】
: 这个大多是做调查,统计precision和recall
: 要验证算法性能,一般是用IMDB之类的公开数据源做验证,这样也很方便和别人的算法做对比
: 【 在 stupidboy (StupidBoy) 的大作中提到: 】
: ...................
- -|||火候太浅,不明白湿胸在说什么...
【 在 river 的大作中提到: 】
: netflix prize有数据可以做collaborative filtering的算法,而且数据量应该是够级别的。但是就像ptwcj所说的,这种数据的信息量确实太少,仍然需要基于语义的内容信息
: --
netflix prize是个比赛,为期三年,奖金一百万刀,现在已经结束了。你可以搜一下netflix prize,有个专门的网站以及相关论坛。
至于怎么选择测试数据和训练数据,netflix数据上是有日期的,只要按照日期先后顺序和自己事先规定的测试/训练比就可以提取数据了。
作为比赛,所有能够利用的信息就是一个sparse user-item rating matrix而已。但实际的系统,如果加入了item,比如电影、书的内容,通过text mining,应该会做得更好。
【 在 stupidboy 的大作中提到: 】
: - -|||火候太浅,不明白湿胸在说什么...
: 【 在 river 的大作中提到: 】
: : netflix prize有数据可以做collaborative filtering的算法,而且数据量应该是够级别的。但是就像ptwcj所说的,这种数据的信息量确实太少,仍然需要基于语义的内容信息
: ...................