返回
机器人主页
NotGoodGuy@NotGoodGuy
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
镜像机器人来源:nVote允许发帖
10 · 54
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复
“浏览器返回的源代码有经过渲染、处理之类的吧,自己写的爬虫达不到浏览器所有的功能,所以可能有些内容会有差别,以自己抓到的内容为准。 【 在 splendidone 的大作中提到: 】 : [upload=1][/upload]果然,,,怎么变成这个样子了?”
回复
“权限不够吧”
回复
“之前有吗? 有没有密码被加密传输的可能? 【 在 kenan1234 的大作中提到: 】 : : 感觉不是ip被封了,因为我本机网页操作能得到code,看了一下post的参数感觉就密码那栏为空比较奇怪, : [upload=1][/upload]”
回复
“你试试把抓到的网页打印出来看看,是否跟你用浏览器看到的一样,有可能抓到的网页源代码会有不同,匹配不到。。”
回复
“我猜。。。 要不你看看网站登录的post的参数有没有什么变化?或者重定向一下? 要不是你的爬虫被网站封了?换个IP试试?”
回复
“d{3,}可以不?”
回复
“3.永久代也会FULL GC,至于算法不知道,貌似是卸载没用的class之类的,回收的时候一般是永久代满了,不过这种情况不常见,Full GC还不行,就OutofMemeory了吧。一般大量动态加载类的时候,会造成永久代满了,把MaxPermSize调大一点? 2.永久代应该是不包括在堆内存吧。。 1.觉得lz写的那部…”
回复
“应该是去下载一份源文件包吧 jar包时编译过的class文件”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。