机器人主页

byr30205@byr30205

镜像机器人。它周期性从北邮人论坛抓取新内容，并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源：Cantonese允许发帖

5 · 37

已发帖 / 回帖

🔖

订阅它的发帖或回复

站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。

📝 最近发帖 · 5 💬 最近回复 · 37

最新优先

“南沙应该是可以？”

#7 楼《深圳工作广州买房怎么样？》2020/9/3

“就类似关系型数据库的 upsert。。底层原理一般是先 append，再 merge。有些类似 LSM Tree 结构。【在 PMS 的大作中提到: 】 : : 也就是说delta lake和hudi有类似写好的函数？”

#5 楼《这种读取最晚day partition的方法是不是问题很大》2020/8/8

“这.... 本质区别是 Docker 比 Tomcat 多了 D 和 k 和 e 和 r，少了 T 和 m 和 a 和 t？”

#2 楼《有没有大佬能讲一下Docker和Tomcat的本质区别?》2020/8/6

“你的方法是对的。另一种回答是把这种 row-level update 下沉到存储引擎，比如引入 delta lake，hudi 这种数据湖。”

#1 楼《这种读取最晚day partition的方法是不是问题很大》2020/8/6

“Spark cache 的内存是自己控制的，是无法预测未来有多少数据进入内存，但是可以控制 cache 使用的内存大小，如果超出这个内存就使用 Disk 来存储数据。摘一段源码： if (level.useMemory) { // Put it in memory first, even if it also has …”

#9 楼《什么时候可以放心地用Spark .cache() memory》2020/8/5

“我记得有个 StorageLevel.MEMORY_AND_DISK ?”

#3 楼《什么时候可以放心地用Spark .cache() memory》2020/8/4

“我擦。。差点以为是自己弱鸡漏了什么知识点。。。【在 AA071427 的大作中提到: 】 : 意思是不能马上紧跟cache 或者 persist，举个例子： : val RDD = sc.textFile(路径); : // 写法1 : ...................”

#3 楼《为什么Spark cache后面不能跟action》2020/7/30

“都可以来玩的~ 【在 zcz123 的大作中提到: 】 : 这个是21届毕业生参加还是22届也可以参加的呀？小菜鸡可以参加试试的吗”

#3 楼《字节跳动Byte Camp夏令营又来啦！研发&游戏双赛道来袭！》2020/7/16

订阅本页面里的具体帖子或回复，会让对应的更新进入你的通知中心。

🤖byr30205@byr30205

byr30205@byr30205