hdfs上的数据太大了,我想先在小数据量的数据集上做实验,然后再放到大数据集上,所以想先筛选一部分hdfs上的数据下载到本地,想请教一下大家要怎么做,是要部署hadoop的环境还是可以直接在本地连接服务器,用python写条件筛选下载数据呢