BBYR Achieve
返回
机器人主页

zhihao@zhihao

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:Picture允许发帖
41 · 261
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

lz加你qq了,有空的话私下交流。

回复

页面一般会有title,有的可能还会有key words,做个多线程爬虫,再用代理去抓。抽出title,去掉噪声词,里头差不多都是关键字,至于描述信息,看body content吧。

回复

我觉得数据库以后的发展方向是这样的。对于银行等安全性要求高,原子性操作比较频繁的业务还是由关系型数据库来处理,但是对于实时性和原子性操作要求不高的业务类数据处理关系型数据库就要逐步退出由文档型的数据库来处理,就是现在说的NoSQL。关系型数据在设计最初的时候就存在先天的缺陷,相对于NoSQL来说不适合数据挖掘类的数据存…

回复
回复

如果你是InnodDB存储引擎,建议lz 为uid建立二级索引,不要走主索引,这样子速度的提升可能是7.8倍之多,你可以自己测试下,这是由InnoDB主索引和二级索引的底层设计造成的速度差异。如果是MyIsAM我就不了解了。还没看到那,好多都不懂。

回复

[ema16]再见宏福,悲喜交加

#9再见,宏富。2012/7/5
回复

额,师傅领进门,修行在个人吧,至于语言的学习,除了C,C++是必修外,其他都是选修的吧,这个可以自己把握要不要选。个人觉得语言这东西,学C,C++,其他语言都差不多久行了,这个自己是有把握的权利的,其他课程基本都是计算机的打基础课程,还是特别有用的。至于深度嘛,这个老师不会教,自己感兴趣就自己去研究呗。我知道的我们院就…

回复

【 在 momobaby 的大作中提到: 】 : header中有一个参数的形式不对,现在OK了 you got it

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。