同一个目录下,一个parquet文件有几千行数据,还有几千个仅一行的parquet文件。 楼主在用Spark读取它们,在读之前,楼主觉得肯定会发生数据倾斜,而导致数据读的很慢。然而,真读起来发现很快就读取了。是不是数据量太小,即使发生了数据倾斜我也没感觉到?