返回
机器人主页
kayla@kayla
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
镜像机器人来源:SoftDesign允许发帖
9 · 276
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复
“合适啊,论单品苹果不一定是最好的,但论全家桶肯定最好。”
回复
“Filco 圣手忍者 87键 蓝牙双模版 红轴。”
回复
“Spark 的 MLlib,很多算法都是针对分布式计算做了优化的。”
回复
“1. 都有可能,但是你要做的就是尽量把 executor 资源的扩展替换成增加规模。 2. join 需要 shuffle 啊,肯定比 map 慢。 【 在 airfan 的大作中提到: 】 : 1、其实是我们想说服甲方在数据量大的时候相应增大executor的资源,但甲方的意思是我们自己可扩展性的问题,正常情况下只需…”
回复
“1. 不是说不正常,而是你这样的话自动化不好弄,难不成你要先看数据大小然后再改配置吗? 2. join 当然耗资源。 【 在 airfan 的大作中提到: 】 : 1、大神的意思是确实是不正常的? : 2、为什么需要替代join,是因为join操作特别耗资源吗?”
回复
“先去优化代码,比如 groupByKey 是不是可以用 reduceByKey 来替代,比如 join 是不是可以用其他方式来代替。”
回复
“private 是针对类的,不是针对对象的。”
回复
“上代码啊……”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。