hainanlxs@hainanlxs
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“最近一直在弄爬虫,发现可以尝试数据抓取和分析工程师了哈哈~继续加油学习。http懂得还太皮毛了”
“nlp党路过,俩都没做过,纯帮顶”
“别黑。。。你一看我代码就知道有多新手了。。。 【 在 huhahuhaha 的大作中提到: 】 : XS越来越屌了~”
“暖学姐不是nuanyangyang么。。。 【 在 wyq 的大作中提到: 】 : 暖姐姐居然是师兄,累觉不爱~ :”
“谢谢。。。 哎,之前企图用模拟登陆的办法。光模拟登陆就费了三天,登陆成功后又不知道怎么继续保持登陆状态爬取搜索页面。。。遂放弃。不过我发现就算是用浏览器,在搜索页面刷新过快的话也会要求输入验证码的。。所以对于连续快速抓取页面来说登陆不登陆意义不大。后来有个想法就是要求输入验证码的时候再把验证码图片get下来,然后orc…”
“师兄的代码很漂亮啊,而且肯定经验丰富了,方法组织得很高端的样子,代码长实现的功能也多吧。向师兄学习~ 【 在 wks 的大作中提到: 】 : 3年前写过,用xpath,不过现在应该有更优雅的方法了吧。 : 以前写的,当反面教材吧:https://github.com/wks/libbyr4j/blob/master/s…”
“农村人路过围观一下子~么么哒~”
“应该是吧……老实说是我自己的理解……不敢打包票……你可以验证一下啊,分段跑一下那个加法表达式……我在外头,暂时不方便用电脑…… 【 在 chaojilei 的大作中提到: 】 : : 嗯 我也是这么理解的,但是我看一本书上的答案是4+3+4+5,,,我就迷糊了,是答案错了吧?”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。