lt1103725556@lt1103725556
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“多谢,了解了[ema3]其实这些我只会用C写,而且也不算很熟练,现在转python了,感觉还是要去看看相关的书才行呢。 【 在 lucashood (【意涵团】lucashood) 的大作中提到: 】 : 薄弱到什么程度? : 如果熟练掌握单链表,栈,队列,二叉树,图等概念,直接按类型刷题,中间不会时再搜索引擎大法好”
“[ema3]多谢 【 在 HKQ (HKQ) 的大作中提到: 】 : 个人认为不用 可以先从easy开始刷 多看看discuss”
“你看看直接看看网页源代码能找到你想要的所有信息吗?然后检查一下你的提取器,试试直接把网页源代码复制下存进一个str里面然后用你的提取器去匹配看能不能提取到之前没爬到的信息? 【 在 Idontknow (What's nick) 的大作中提到: 】 : 我觉得不是被封IP的事。我能爬下网站首页的链接。但是对应到具体的职…”
“我猜可能是爬了一会儿被封ip了,每次请求你都把状态码返回回来试试?照理说被封了要报错的。出现各种error你先把错误信息复制到百度或谷歌上面查一下看能不能解决”
“进楼学习 【 在 Ratio (夜航船) 的大作中提到: 】 : 如题,楼主是信通的大三本科出国党,现在TG都考完了,后面时间十分充裕,对这个领域很感兴趣,很想从暑假开始做DM/ML一类领域的实习。自己才疏学浅,来请教下论坛的... : --”
“不如先上作品看看?”
“emmm..星期一就上课了。。西瓜书后面也有数学资料,不过讲的不太细几乎全是结论,泛函分析的内容啃起来有点难受[ema1]但愿下节课能听懂吧。。 【 在 soloist97 (soloist97) 的大作中提到: 】 : 我也试了好几次,并不能2333”
“爬虫可以爬微信好友数据,有现成的包,网上搜一搜微信好友爬虫应该就能搜到”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。