數據文件,如果要清理,就是這些數據沒用。
我看到妳正在使用CDH安裝。如果不想要數據,完全可以重建集群。
如果您想要保留數據文件,您可能需要考慮調整副本的數量。默認值為3。下面這個命令會將hadoop文件的副本改為1,這樣可以節省三分之二的空間。註意,只有壹份數據有風險,損害就結束了。
hadoopfs-setrep-R1/