命令行工具,能扫描目录建立一个数据库,记录文件校验和,此后依赖数据库判定重复文件,也可以删除重复文件。 
数据库是增量维护,第一次慢,之后就很快了。 
https://github.com/jkzhang2019/cldup/   
手册在 
https://github.com/jkzhang2019/cldup/wiki     cldup  -u    #建立/更新数据库,第一次相当于目录计算摘要,比较耗时。此后只对变更的文件计算,就很快了。  
cldup -l file.name #判断文件是不是重复文件,不清理   
cldup -f filename #清理重复文件,清理前会比对md5. 
cldup -f * #清理目录内所有重复文件 
也可以一个命令到底:
cldup -uf *  
--
FROM 92.118.204.*