Johnny9433@Johnny9433
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“暖大神,你怎么知道这么多啊 【 在 nuanyangyang (暖羊羊) 的大作中提到: 】 : 拜托如果不是非要摆脱库依赖的话,还是建议不要用这种方法解析HTML。看看xpath吧。 通过『我邮2.0』发布”
“最后用网上的批量文本编辑转换器完成了此功能[ema3]”
“还是乱码 【 在 yangyusen 的大作中提到: 】 : line = br.readLine(); : String temp = new String(line.getBytes("utf-8"),"gbk"); : writer.write(temp);”
“就是这样 【 在 rancho (rancho||水央月) 的大作中提到: 】 : 手持一把锟斤拷 : 口中直呼烫烫烫 通过『我邮2.0』发布”
“【 在 nuanyangyang 的大作中提到: 】 : 是我邮论坛用ajax。肯定不能用heritrix爬的。 : : 来自「北邮人论坛手机版」 那哪些开源的爬虫能爬论坛呢?望赐教”
“使用文本编辑器确实可以打开下载的文件。但是我用java中读取文本的方式去检索关键字却没有成功。对http和html确实不懂。 【 在 nuanyangyang (暖羊羊) 的大作中提到: 】 : 你在用Windows?而且你从来没试过用文本编辑器打开你下载下来的文件?而且猜你可能不太懂HTTP和HTML? 通过『我邮2…”
“为什么我用heritrix爬下来的文件格式就是文件 【 在 wangxiaobupt (XJ|学习考研|热点公告屯田日久,当建奇功) 的大作中提到: 】 : 没有吧 不天天有人爬论坛么 通过『我邮2.0』发布”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。