binux@binux
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“果断自己写一个啊”
“&和python没什么关系,和html有点关系 这东西叫做HTML Entity,用于转义html字符”
“就是因为索引这东西算不出来才用数据行数来分析的啊 【 在 liuwaiting 的大作中提到: 】 : 不是数据量级的问题好么...是索引规模的问题,每张表都不一样的. :”
“1000w和2000w是一个量级的好吧。。 而且分表都是在设计的时候就想好了,都是按照最大可能数据量参考量级的,如果最大1000w还真不一定需要分表 【 在 liuwaiting 的大作中提到: 】 : 唉,我都猜到你会这么回复了。 : 反正我的意思就是以2000W条作为什么mysql使用经验之谈、DBA军规什么的,都…”
“哪有那么闲。。。 【 在 liuwaiting 的大作中提到: 】 : 无论数据库服务器现在用普遍48G、64G内存的机器。 : 还是4G、8G的机器。 : 采用2000w条为分表依据都是不对的。 : ...................”
“鉴于现在的机器限制,2000w依旧有意义 【 在 liuwaiting 的大作中提到: 】 : 没看到这个前提? “但是鉴于当时机器的限制,2000w的传说是有时代意义的错误结论。””
“如果只把mysql当做key-value来用,确实上亿没有问题 但是就正常的sql用途来说,2000w量级确实应该分表。文章在评论传说的时候去掉了传说的前提和背景,只评论它的结论,以此得出传说是错的,这个。。。”
“豆瓣没有什么特殊检查,如果一直是403可能是你被ban了,表现是用那个ip直接访问,不登陆都是403 加一条cookie试试 bid="(随机11位base64字符)"; ll="(随机小于100的数字)" 【 在 buptlay 的大作中提到: 】 : 豆瓣那个确实不知道该怎么搞了”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。