最近在弄heritrix但是死活也不能把它剥离出爬网页的内核来,准备学习搜索引擎这一块,但是起步还是挺乱的,翻到什么就开始随便看看,求大神讲讲自己的学习经历也好,整个过程也罢,给小弟一个学习的方向,我一步步来。 发自「贵邮」