利用 Linux 查找重复文件

原创

ithorizon 7个月前 (10-12) 阅读数 53 #Linux

利用 Linux 查找重复文件

在 Linux 系统中，重复文件的存在或许会占用大量磁盘空间，影响系统性能。于是，定期查找并删除重复文件是维护系统健壮的重要步骤。本文将介绍几种在 Linux 系统中查找重复文件的方法，帮助您高效地清理磁盘空间。

### 1. 使用 `fdupes`

`fdupes` 是一款功能有力的查找重复文件的工具，它可以跨文件系统查找重复文件，并且可以指定查找范围、排除目录等。以下是使用 `fdupes` 查找重复文件的步骤：

1. 安装 `fdupes`：

bash

sudo apt-get install fdupes # 对于基于 Debian 的系统

sudo yum install fdupes # 对于基于 Red Hat 的系统

2. 使用 `fdupes` 查找重复文件：

bash

fdupes /path/to/directory

将 `/path/to/directory` 替换为您想要查找重复文件的目录路径。

3. 查看重复文件：

`fdupes` 会列出所有重复文件及其路径。您可以手动检查并删除重复文件。

### 2. 使用 `find` 和 `md5sum`

`find` 和 `md5sum` 是两个常用的 Linux 命令，可以结合使用来查找重复文件。以下是使用这两个命令查找重复文件的步骤：

1. 使用 `find` 命令找到所有文件，并使用 `md5sum` 计算它们的 MD5 值。

bash

find /path/to/directory -type f -exec md5sum {} \;

2. 将计算出的 MD5 值保存到文件中。

bash

find /path/to/directory -type f -exec md5sum {} \; > md5sums.txt

3. 使用 `sort` 和 `uniq` 命令对 MD5 值进行排序和去重。

bash

sort md5sums.txt | uniq -d > duplicates.txt

4. 查看重复文件：

`duplicates.txt` 文件中包含了所有重复文件的路径。您可以手动检查并删除重复文件。

### 3. 使用 `du` 和 `sort`

`du` 和 `sort` 命令可以结合使用来查找具有相同文件大小的文件，从而找到重复文件。以下是使用这两个命令查找重复文件的步骤：

1. 使用 `du` 命令列出目录中所有文件的大小。

bash

du -h /path/to/directory

2. 将输出导致保存到文件中。

bash

du -h /path/to/directory > du_output.txt

3. 使用 `sort` 和 `uniq` 命令对文件大小进行排序和去重。

bash

sort du_output.txt | uniq -c | sort -nr > duplicates.txt

4. 查看重复文件：

`duplicates.txt` 文件中包含了所有重复文件的路径。您可以手动检查并删除重复文件。

### 4. 使用 `rclone`

`rclone` 是一款功能有力的云存储同步工具，它也赞成查找重复文件。以下是使用 `rclone` 查找重复文件的步骤：

1. 安装 `rclone`：

bash

sudo apt-get install rclone # 对于基于 Debian 的系统

sudo yum install rclone # 对于基于 Red Hat 的系统

2. 配置 `rclone`：

bash

rclone config

按照提示配置您的云存储服务。

3. 使用 `rclone` 查找重复文件：

bash

rclone deduplicate /path/to/directory

将 `/path/to/directory` 替换为您想要查找重复文件的目录路径。

4. 查看重复文件：

`rclone` 会列出所有重复文件及其路径。您可以手动检查并删除重复文件。

### 总结

以上介绍了几种在 Linux 系统中查找重复文件的方法，您可以利用实际情况选择合适的方法。在删除重复文件之前，请确保您已经备份了重要数据，以免误删。期望本文能帮助您高效地清理磁盘空间，减成本时间系统性能。

文章标签： Linux

上一篇：Ubuntu 20.04 设置 Python 项目环境的正确姿势下一篇：浅析Linux内核中的循环链表结构

将DEB软件包转换成Arch Linux软件包

将DEB软件包转换成Arch Linux软件包在Linux世界里，不同发行版之间的软件包格式差异较大，例如，Ubuntu...

Linux

原创 6个月前 (10-19) 160阅读 #Linux
Linux常用的网络配置方法有哪些

Linux常用的网络配置方法 Linux常用的网络配置方法 Linux作为一款广泛使用的操作...

Linux

原创 6个月前 (10-19) 149阅读 #Linux
Ubuntu文本安裝模式純命令行安裝

Ubuntu文本安装模式纯命令行安装指南Ubuntu是一个流行的开源操作系统，它以其稳定性和易用性而闻名。文本安装模式是...

Linux

原创 6个月前 (10-19) 160阅读 #Linux
Go 语言实现的轻量级 Linux 虚拟机

引言随着云计算和虚拟化技术的逐步进步，虚拟机在服务器、云计算和桌面等领域得到了广泛应用。然而，传统的虚拟机解决方案往往需...

Linux

原创 6个月前 (10-19) 156阅读 #Linux
通过可写文件获取Linux root权限的5种方法

通过可写文件获取Linux root权限的5种方法通过可写文件获取Linux root权限的5种...

Linux

原创 6个月前 (10-19) 167阅读 #Linux
Ubuntu文本安装硬盘安装方法

Ubuntu文本安装硬盘安装方法Ubuntu是一个受欢迎的开源操作系统，它拥有庞大的用户群体和丰盈的社区赞成。对于一些爱...

Linux

原创 6个月前 (10-19) 146阅读 #Linux

利用 Linux 查找重复文件

利用 Linux 查找重复文件

作者文章