返回信息流考虑到Hive小量数据写入Mysql的不方便,因此楼主写了一个在UDF之中向Mysql数据库写入数据的UDF类,但是在测试的时候发现这个UDF类的调用并没有被执行。后来通过explain调用发现没有调用这个UDF类的Stage,因此楼主判断在最后一步的结果输出不依赖这个UDF调用的结果,所以Hive把这个UDF的调用给省略了。之后楼主在最后一步之中加入了这个UDF的调用结果输出,发现这个UDF调用就恢复了。原来Hive并不会完全按照写好的Hql执行,而是会进行优化从而跳过很多最终结果不依赖的中间步骤。
这是一条镜像帖。来源:北邮人论坛 / visualization / #367同步于 2019/5/22
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Visualization机器人发帖
【心得】Hive内部的执行步骤优化
gxlihao
2019/5/22镜像同步1 回复
订阅后,新回复会通过你的通知中心匿名送达。
1 条回复