threbody@threbody
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“恩,现在已经能爬下来数据了。 准备系统的爬一次,估计要发送10万这个数量级的http请求,担心被对方网站封掉,网上查的有三个解决办法: 一是request header尽量模仿浏览器,这个除了cookie其他都设置了,如下: req_header = {'User-Agent':'Mozilla/5.0 (Window…”
“花了3天时间把W3School上面的大部分web相关的教程看了一遍,然后试用了一下chrome的DevTools,明白了这个页面的刷新只是更新了页面的部分内容(AJAX),即旅游项目信息,信息是通过JSON传过来的。 虽然还没有搞定如何爬这种网页,先表示感谢! 【 在 binux 的大作中提到: 】 : 你就不能自己查…”
“之前没接触过AJAX,你的意思是使用AJAX就可以得到我想要的那个网站的旅游信息? 【 在 binux 的大作中提到: 】 : AJAX”
“请问这个是怎么来的? 【 在 binux 的大作中提到: 】 : http://dujia.qunar.com/p/listapi?action=routeResult&tm=l01&tp=1366970532694_123&ts=1366970541208_837&dep=%E5%8C%97%E4%BA%AC&vie…”
“我毕设的一部分是爬虫模块,正在纠结的爬某网站的信息。 你说的信息抽取是做什么的? 【 在 shuangyub 的大作中提到: 】 : 如题。。计算机的研究生,毕设做信息抽取方向,自己实在是搞不定啊,老师也不怎么管了,求同伴。。。求学习。。。求指导。。。q:913225817”
“敢站到台上,就得考虑自己到底做得怎样: 自己真是认定自己做得好,别人批评也不太影响; 自己敷衍了事,还抱着侥幸心理+作弊,心理有阴影也是必然的。 【 在 Park 的大作中提到: 】 : 选最丑的?被选中最丑的设计者哭了怎么办。。”
“补充一下156号,整体图案还包含了北邮的校徽元素:大雁和锅 一方面北邮致力于信息技术,方便人们沟通;另一方面表达毕业生之间的离别之情。 正面: 背面: 作者的作品介绍:四载邮苑年华,我们的双手拉近了世界的距离。如今分道扬镳,各奔前程,即便身处天涯海角,依然心心相印。北邮,永远联系着我们的心。 白色那件真的挺漂亮。 借楼…”
“【 在 shylockzeng 的大作中提到: 】 : : 很好,这是个挺有意思的数据模型设计。 : 但是基于你之前说的,你的负分系统是为了防止“友情票”,那么如果你能投很多个负分,你这个目的就很难达到(投了15个和16个没什么区别),如果只能投很少个负分,那么最后的评分差距会很小。你会发现大家吵得更凶。 : ....…”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。