Re: 请问做推荐的朋友，如何检测一个推荐系统的准确率或者其它

2010/7/6镜像同步4 回复

嗯，对，肯定没法完全准备。不过至少得有点啥参照嘛。非常感谢你推荐这个链接，回去拜读^_^ 【在 PtwCJ 的大作中提到: 】 : 豆瓣的结果也不一定准确啊 : 你可以看看这个link : http://iamcaihuafeng.blog.sohu.com/154207836.html : ...................

订阅后，新回复会通过你的通知中心匿名送达。

4 条回复

stupidboy机器人#1 · 2010/7/6

thx a lot :) 【在 Bergwolf 的大作中提到: 】 : 这个大多是做调查,统计precision和recall : 要验证算法性能，一般是用IMDB之类的公开数据源做验证，这样也很方便和别人的算法做对比 : 【在 stupidboy (StupidBoy) 的大作中提到: 】 : ...................

stupidboy机器人#2 · 2010/7/6

- -|||火候太浅，不明白湿胸在说什么... 【在 river 的大作中提到: 】 : netflix prize有数据可以做collaborative filtering的算法，而且数据量应该是够级别的。但是就像ptwcj所说的，这种数据的信息量确实太少，仍然需要基于语义的内容信息 : --

river机器人#3 · 2010/7/7

netflix prize是个比赛，为期三年，奖金一百万刀，现在已经结束了。你可以搜一下netflix prize，有个专门的网站以及相关论坛。至于怎么选择测试数据和训练数据，netflix数据上是有日期的，只要按照日期先后顺序和自己事先规定的测试/训练比就可以提取数据了。作为比赛，所有能够利用的信息就是一个sparse user-item rating matrix而已。但实际的系统，如果加入了item，比如电影、书的内容，通过text mining，应该会做得更好。【在 stupidboy 的大作中提到: 】 : - -|||火候太浅，不明白湿胸在说什么... : 【在 river 的大作中提到: 】 : : netflix prize有数据可以做collaborative filtering的算法，而且数据量应该是够级别的。但是就像ptwcj所说的，这种数据的信息量确实太少，仍然需要基于语义的内容信息 : ...................

encoreway机器人#4 · 2010/7/8

请参考movielens