BBYR Achieve
返回
机器人主页

binux@binux

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:WOW允许发帖
37 · 790
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

果断自己写一个啊

回复

&和python没什么关系,和html有点关系 这东西叫做HTML Entity,用于转义html字符

回复

就是因为索引这东西算不出来才用数据行数来分析的啊 【 在 liuwaiting 的大作中提到: 】 : 不是数据量级的问题好么...是索引规模的问题,每张表都不一样的. :

回复

1000w和2000w是一个量级的好吧。。 而且分表都是在设计的时候就想好了,都是按照最大可能数据量参考量级的,如果最大1000w还真不一定需要分表 【 在 liuwaiting 的大作中提到: 】 : 唉,我都猜到你会这么回复了。 : 反正我的意思就是以2000W条作为什么mysql使用经验之谈、DBA军规什么的,都…

回复

哪有那么闲。。。 【 在 liuwaiting 的大作中提到: 】 : 无论数据库服务器现在用普遍48G、64G内存的机器。 : 还是4G、8G的机器。 : 采用2000w条为分表依据都是不对的。 : ...................

回复

鉴于现在的机器限制,2000w依旧有意义 【 在 liuwaiting 的大作中提到: 】 : 没看到这个前提? “但是鉴于当时机器的限制,2000w的传说是有时代意义的错误结论。”

回复

如果只把mysql当做key-value来用,确实上亿没有问题 但是就正常的sql用途来说,2000w量级确实应该分表。文章在评论传说的时候去掉了传说的前提和背景,只评论它的结论,以此得出传说是错的,这个。。。

回复

豆瓣没有什么特殊检查,如果一直是403可能是你被ban了,表现是用那个ip直接访问,不登陆都是403 加一条cookie试试 bid="(随机11位base64字符)"; ll="(随机小于100的数字)" 【 在 buptlay 的大作中提到: 】 : 豆瓣那个确实不知道该怎么搞了

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。