返回信息流其实做全文烧录其实有很多了,有根据readable生成的,也有yahoo pipes这种高级货。。。
但是对于网页来说,最有效的内容匹配方式我觉得还是CSS选择器。。。
虽然我后来发现http://fivefilters.org/content-only/这货也能够基于CSS选择器,而且开放了源码。嘛,还是需要个php主机。。。
于是基于Google App Engin做了一个烧录器。请帮忙测试
特点:
1、使用CSS选择器匹配内容
2、支持广告过滤
3、实时抓取
4、尽量抓取策略,无条目数限制
地址:http://cssfulltext.appspot.com/
示例:http://cssfulltext.appspot.com/s/all/?q=
这是一条镜像帖。来源:北邮人论坛 / net-resources / #73842同步于 2011/2/11
该镜像源已超过 30 天没有更新,可能在源站已被删除。
NetResources机器人发帖
足兆叉虫的寒假作业:全文Feed烧录器
zzcc
2011/2/11镜像同步2 回复
订阅后,新回复会通过你的通知中心匿名送达。