返回信息流请问有没有比较好的入门的或者经典的书推荐呢???
找了一会儿,发现如下两本:
《搜索引擎 原理 技术与系统》北大天网出的,还有
《开发自己的搜索引擎--Lucene 2.0+Heritrix》
不知道怎么样啊?大家有没有好的推荐呢?
先谢谢大家了!
这是一条镜像帖。来源:北邮人论坛 / search-engine / #8902同步于 2009/12/29
该镜像源已超过 30 天没有更新,可能在源站已被删除。
SearchEngine机器人发帖
如果想比较深入得学习搜索技术
Milantiger
2009/12/29镜像同步14 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
再看看 Lucene 的代码
【 在 Milantiger (Tiger) 的大作中提到: 】
: 标 题: 如果想比较深入得学习搜索技术
: 发信站: 北邮人论坛 (Tue Dec 29 15:34:59 2009), 站内
:
: 请问有没有比较好的入门的或者经典的书推荐呢???
: 找了一会儿,发现如下两本:
: 《搜索引擎 原理 技术与系统》北大天网出的,还有
: 《开发自己的搜索引擎--Lucene 2.0+Heritrix》
: 不知道怎么样啊?大家有没有好的推荐呢?
: 先谢谢大家了!
: --
: 很多我们以为一辈子都不会忘记的事情,就在我们念念不忘的日子里,被我们遗忘了。
: 有人说Milantiger:狂野彪悍的说话风格却透露出细腻透彻的观点!
:
: ※ 来源:·北邮人论坛 http://forum.byr.edu.cn·[FROM: 218.241.111.*]
正确率不是很高,还有很多可以优化的地方,
用户输入的是url,服务器这边要做太多的东西,
我怕机器扛不住
嗯,就不拿出来献丑了
【 在 PtwCJ 的大作中提到: 】
: 去俺那小版show一下呗~
不是,我说讲讲系统架构,算法啥的。。
【 在 xieys 的大作中提到: 】
: 正确率不是很高,还有很多可以优化的地方,
: 用户输入的是url,服务器这边要做太多的东西,
: 我怕机器扛不住
: ...................
其实也没啥好说的,大家都知道的
就是下面几个步骤
网页抓取,文本提取,编码转换,分词,特征选择,权重计算,训练,测试,分类
分类用的libsvm,主要在特征选择和权重计算方面加了些自己的想法
【 在 PtwCJ 的大作中提到: 】
: 不是,我说讲讲系统架构,算法啥的。。
谢谢推荐,我会参考你的意见的。
【 在 PtwCJ 的大作中提到: 】
: 走进搜索引擎+信息检索实践+天网
: 然后就是看paper/写代码了