BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / search-engine / #346同步于 2006/11/1
SearchEngine机器人发帖

Google百度爱问新闻搜索的比较[原创]

BenBenboy
2006/11/1镜像同步0 回复
新闻搜索的时效性和纯洁性都高些 新闻搜索的新闻源都是人工审核添加的 人工写好每个新闻源的配置 程序会到配置好的新闻站点抓取新闻 (google、baidu和iask爱问都有1000多新闻源) 抓取频率一般都很快 google号称15分钟抓取一次 baidu号称5分钟更新一次 爱问的更新频率也差不多 这能保证你能搜到各大新闻网站的最新新闻 由于只抓取固定的新闻站点 所以你搜索到的结果都是新闻 无关的页面比较少些 而且新闻搜索会把来自不同网站的相同新闻整理到一块 比如“离职员工称微软Windows Live濒临瘫痪”这个新闻有11家新闻网站发布过 这样你看到这个新闻的下面会写上【>>11条相同新闻】 显然你可以根据相同条数的大小来判断某个新闻是否热门 如果一个新闻被很多网站转载,那这个新闻一定很hot Google资讯 http://news.google.cn 从全球1,000多个中文新闻来源中收集新闻报道 新闻主题每15分钟更新一次 只包括过去30天内出现的文章 数据来源:Google资讯帮助 http://news.google.cn/intl/zh-CN_cn/about_google_news.html 没有高级搜索 不能限定时间 不能直接限定新闻源 但是可以通过site:新闻源url来实现 对关键词采取精确匹配 即使搜不到结果也不分词 搜索结果默认按内容相关性排序 每页10条,最多显示的结果数不固定 百度新闻 http://news.baidu.com 每天发布120000–130000条新闻,新闻来源1000多个。 每5分钟对互联网上的新闻进行检查。 来源:百度新闻帮助 http://www.baidu.com/search/faq_news.html 有高级搜索 可以限定时间和新闻源等 可以进行全文和标题搜索 直接对关键词进行分词 搜索结果默认按时间排序 默认每页20条,最多显示38页,760条结果 百度新闻从2003年11月4日开始提供历史新闻浏览 数据来源:百度新闻搜索 http://news.baidu.com/2003-01-01/?y=2003&m=01&d=01 iAsk爱问新闻搜索 http://n.iask.com/ 同样涵盖1000多新闻源 5分钟更新一次 对大新闻源,每3分钟检查一次 每天抓取12-15万条新闻 有高级搜索 可以限定时间和新闻源等 可以进行全文、标题和专题搜索 对关键词采取精确匹配 搜不到结果的话会进行分词 搜索结果默认按时间排序 每页20条,最多显示89页,1780条结果 可以搜索到1998年07月10日以来的新闻
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。