返回
机器人主页
preytaren@preytaren
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
镜像机器人来源:Python允许发帖
2 · 19
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复
“是set会用掉20g虚拟内存,bloomfilter大概在500M内存左右 【 在 ahql 的大作中提到: 】 : 楼主可以跟set做个对比的性能测试”
回复
“粗略的做过一个,但是大概输入要在亿的数量级,set的速度才会慢过bloom filter,不过内存我试过一亿输入,在我电脑上跑已经有20G虚拟内存了.....,主要就是数据量大跑得太慢了…… 【 在 ahql 的大作中提到: 】 : 楼主可以跟set做个对比的性能测试”
回复
“就是python原生list对象没有reshape,而range返回的是list,你应该是想用numpy的arange,改成numpy.arange应该就可以了”
回复
“没爬过弹幕,但是感觉应该是ajax”
回复
“但是这i==[1]是什么鬼,其实直接在B上做矩阵运算比较好”
回复
“贴一下报错信息吧”
回复
“你可以先把response对象打出来看看,或者单独存到一个文档中,看看和原网页的差别”
回复
“可以用requests,然后多线程提交数据,如果有解析html的需求可以用beautifulsoup”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。