🪞这是一条镜像帖。来源:北邮人论坛 / ml-dm / #35807同步于 2019/12/6
⚠️该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
【已解决】为什么这样先转成avro再转parquet比直接转parquet更
我们组的一个人经过反复实验,发现对于大量数据来说,“把RDD以avro的形式写到文件里,再以avro格式读出来,再把数据从avro格式转成parquet格式”,是要快于“直接把RDD转成parquet”的。我和他想了几天几夜也没想明白这是为什么