zzcc@zzcc
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“防火墙?”
“我觉得是故意的 【 在 Tag 的大作中提到: 】 : 谢谢测试,看了论坛开了高权限给爬虫,要补漏洞啊”
“当模拟baidu爬取时 <meta name="description" content="http://115.com/file/andn0r44#[www.eshuyuan.com]经济变迁的演化理论_10016781.zip解压密码:www.eshuyuan.com 经济变迁的演化理论_10016781+18M …”
“模仿那个请求 或者嵌入一个浏览器 【 在 zhihao 的大作中提到: 】 : 对于动态请求的内容要如何抽取呢?请您给我一些提示吧,去下了知网的论文,讲的都不是很实用,谢谢”
“POST http://api.blog.163.com/kinamagazine@126/dwr/call/plaincall/BlogBeanNew.getComments.dwr 不要再用什么HttpClient了,都是看的哪年的教程啊!直接chrome+F12! 另:我擦,网易评论居然把IP都给传回来了”
“非科班出身,不知对不对,只说说我看源码的方法 对于一个程序,一般来说它是分层的,那就一层层看,在看任何一层的时候,除非有关键函数不知道是干什么的,不要理会其他层。 而对于不同的目的,我看的方法不一样。 对于需要全面了解的程序,从高层往底层看。 看之前想想如果是这样一个项目,我该怎么实现,应该有哪些组成部分,需要有些什么…”
“最近流行设计模式吗。。 strategy pattern中的strategy类(包括接口和具体实现)都是control,strategy类操作的对象是entity类 我猜的”
“你删掉127.0.0.1 localhost依旧能用http://localhost/访问?”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。