BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / search-engine / #8902同步于 2009/12/29
该镜像源已超过 30 天没有更新,可能在源站已被删除。
SearchEngine机器人发帖

如果想比较深入得学习搜索技术

Milantiger
2009/12/29镜像同步14 回复
请问有没有比较好的入门的或者经典的书推荐呢??? 找了一会儿,发现如下两本: 《搜索引擎 原理 技术与系统》北大天网出的,还有 《开发自己的搜索引擎--Lucene 2.0+Heritrix》 不知道怎么样啊?大家有没有好的推荐呢? 先谢谢大家了!
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
PtwCJ机器人#1 · 2009/12/29
走进搜索引擎+信息检索实践+天网 然后就是看paper/写代码了
coolfantasy机器人#2 · 2009/12/29
再看看 Lucene 的代码 【 在 Milantiger (Tiger) 的大作中提到: 】 : 标 题: 如果想比较深入得学习搜索技术 : 发信站: 北邮人论坛 (Tue Dec 29 15:34:59 2009), 站内 : : 请问有没有比较好的入门的或者经典的书推荐呢??? : 找了一会儿,发现如下两本: : 《搜索引擎 原理 技术与系统》北大天网出的,还有 : 《开发自己的搜索引擎--Lucene 2.0+Heritrix》 : 不知道怎么样啊?大家有没有好的推荐呢? : 先谢谢大家了! : -- : 很多我们以为一辈子都不会忘记的事情,就在我们念念不忘的日子里,被我们遗忘了。 : 有人说Milantiger:狂野彪悍的说话风格却透露出细腻透彻的观点! : : ※ 来源:·北邮人论坛 http://forum.byr.edu.cn·[FROM: 218.241.111.*]
xieys机器人#3 · 2009/12/29
前一阵刚搞了一个网页分类系统, 嗯,搜索引擎挺好玩儿的
PtwCJ机器人#4 · 2009/12/29
看不懂这种规模的代码啊,太悲剧了 【 在 coolfantasy 的大作中提到: 】 : 再看看 Lucene 的代码
PtwCJ机器人#5 · 2009/12/29
去俺那小版show一下呗~ 【 在 xieys 的大作中提到: 】 : 前一阵刚搞了一个网页分类系统, : 嗯,搜索引擎挺好玩儿的
xieys机器人#6 · 2009/12/29
正确率不是很高,还有很多可以优化的地方, 用户输入的是url,服务器这边要做太多的东西, 我怕机器扛不住 嗯,就不拿出来献丑了 【 在 PtwCJ 的大作中提到: 】 : 去俺那小版show一下呗~
PtwCJ机器人#7 · 2009/12/29
不是,我说讲讲系统架构,算法啥的。。 【 在 xieys 的大作中提到: 】 : 正确率不是很高,还有很多可以优化的地方, : 用户输入的是url,服务器这边要做太多的东西, : 我怕机器扛不住 : ...................
xieys机器人#8 · 2009/12/29
其实也没啥好说的,大家都知道的 就是下面几个步骤 网页抓取,文本提取,编码转换,分词,特征选择,权重计算,训练,测试,分类 分类用的libsvm,主要在特征选择和权重计算方面加了些自己的想法 【 在 PtwCJ 的大作中提到: 】 : 不是,我说讲讲系统架构,算法啥的。。
Milantiger机器人#9 · 2009/12/31
谢谢推荐,我会参考你的意见的。 【 在 PtwCJ 的大作中提到: 】 : 走进搜索引擎+信息检索实践+天网 : 然后就是看paper/写代码了