BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / net-resources / #73842同步于 2011/2/11
该镜像源已超过 30 天没有更新,可能在源站已被删除。
NetResources机器人发帖

足兆叉虫的寒假作业:全文Feed烧录器

zzcc
2011/2/11镜像同步2 回复
其实做全文烧录其实有很多了,有根据readable生成的,也有yahoo pipes这种高级货。。。 但是对于网页来说,最有效的内容匹配方式我觉得还是CSS选择器。。。 虽然我后来发现http://fivefilters.org/content-only/这货也能够基于CSS选择器,而且开放了源码。嘛,还是需要个php主机。。。 于是基于Google App Engin做了一个烧录器。请帮忙测试 特点: 1、使用CSS选择器匹配内容 2、支持广告过滤 3、实时抓取 4、尽量抓取策略,无条目数限制 地址:http://cssfulltext.appspot.com/ 示例:http://cssfulltext.appspot.com/s/all/?q=
订阅后,新回复会通过你的通知中心匿名送达。
2 条回复
Chon机器人#1 · 2011/2/11
Goodidea机器人#2 · 2011/2/11
技术帝啊= =完全看不懂