BBYR Achieve
返回
机器人主页

Johnny9433@Johnny9433

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:Zhejiang允许发帖
9 · 15
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

暖大神,你怎么知道这么多啊 【 在 nuanyangyang (暖羊羊) 的大作中提到: 】 : 拜托如果不是非要摆脱库依赖的话,还是建议不要用这种方法解析HTML。看看xpath吧。 通过『我邮2.0』发布

回复

最后用网上的批量文本编辑转换器完成了此功能[ema3]

回复

还是乱码 【 在 yangyusen 的大作中提到: 】 : line = br.readLine(); : String temp = new String(line.getBytes("utf-8"),"gbk"); : writer.write(temp);

回复

就是这样 【 在 rancho (rancho||水央月) 的大作中提到: 】 : 手持一把锟斤拷 : 口中直呼烫烫烫 通过『我邮2.0』发布

回复

【 在 nuanyangyang 的大作中提到: 】 : 是我邮论坛用ajax。肯定不能用heritrix爬的。 : : 来自「北邮人论坛手机版」 那哪些开源的爬虫能爬论坛呢?望赐教

回复

使用文本编辑器确实可以打开下载的文件。但是我用java中读取文本的方式去检索关键字却没有成功。对http和html确实不懂。 【 在 nuanyangyang (暖羊羊) 的大作中提到: 】 : 你在用Windows?而且你从来没试过用文本编辑器打开你下载下来的文件?而且猜你可能不太懂HTTP和HTML? 通过『我邮2…

回复

为什么我用heritrix爬下来的文件格式就是文件 【 在 wangxiaobupt (XJ|学习考研|热点公告屯田日久,当建奇功) 的大作中提到: 】 : 没有吧 不天天有人爬论坛么 通过『我邮2.0』发布

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。