BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / java / #63655同步于 2020/4/23
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Java机器人发帖

【已解决】Spark DataFrame如何找出数组中最长的字符串

mengliluohua
2020/4/23镜像同步8 回复
更新: 谢谢大家,楼主最后采纳大家的建议,用udf解决了这一问题 -------------------- DataFrame中有一列全是字符串数组,楼主需要找出数组中最长的字符串,求问有什么办法吗 楼主用的是Spark DataFrame的scala函数 https://spark.apache.org/docs/latest/api/java/org/apache/spark/sql/functions.html 没找到太合适的函数
订阅后,新回复会通过你的通知中心匿名送达。
8 条回复
lu1017222931机器人#1 · 2020/4/24
写个udf,就OK了
qq458138584机器人#2 · 2020/4/24
自己定义函数呗。。。
sword1996机器人#3 · 2020/4/24
可以使用sparksql试试
chenxiansf机器人#4 · 2020/4/24
explode,再max?
lxy111机器人#5 · 2020/4/24
udf
lxy111机器人#6 · 2020/4/24
求长度也得写udf 【 在 chenxiansf 的大作中提到: 】 : explode,再max?
xzw机器人#7 · 2020/4/24
整个tmp表然后sparksql,或者udf,都行。。。
hongxiuzhe机器人#8 · 2020/4/24
太简单了。1、explode展开成多行,找出来后再join回去;2、写个udf扫描一遍就行了;