it-swarm.cn

如何找到重复的照片?

我可以用什么来查找重复的照片,包括已调整大小的照片?

70
ændrük

digiKamInstall via the software center

将所有照片添加到您的收藏中。在菜单中,选择“工具/查找重复项”。这将在整个集合中查找重复项。

findimagedupesInstall via the software center

命令行工具。在命令行上传递要比较的所有图像。

Geeqie (以前 GQviewInstall via the software center

在菜单中,选择“文件/查找重复”。拖放图像文件执行重复窗口。您可以删除目录以递归方式添加其内容。对于图像的视觉比较,下拉菜单中有特定的非默认选项。 “自定义”相似度允许仅将配对限制在最高相似度,但必须在“首选项”上设置为99.即使这样,它至少对于某些类型的图像(例如线条)也不能完美地工作。艺术。遗憾的是,它没有提供具有合理标准的自动选择机制,例如分辨率,日期等等,自动选择似乎只是随机选择第一个作为保留参考的图像。删除许多图像可能会非常慢,因为它会尝试在每次删除时更新结果计数。


所有这三个工具都找到了可视副本,而不仅仅是字节相同的文件。

57
Gilles

FSlintInstall FSlint

fslint是一个图形程序,可以通过md5sum查找任何类型的重复文件。如果图像不相同,则不会将它们标记为重复。下图显示了我的下载目录中的一堆重复的pdf文件:

enter image description here

您可以更改高级搜索参数以按文件类型进行搜索,并仅限制自己使用图像。这是通过将“额外查找参数”更改为find命令选项来完成的。例如,在这里我只查找*.jpg文件(在同一路径中,只查看我的“Downloads”文件夹:

enter image description here

fdupesInstall fdupes

fdupes是一个等效的基于命令行的工具。这两个都可以在回购。

22
jozzas

fdupesInstall fdupes

您可以使用名为fdupes的命令行工具查找重复文件(有关详细信息,请参阅man fdupes)。我不知道有任何方法可以找到已调整大小的“重复”。执行此操作的程序将需要某种智能算法来分析图像内容,因为在调整图像大小时,其数据会发生变化,因此传统的重复查找方法将无法工作。

7
dv3500ea

imgSeekInstall imgseek

imgSeek 可以找到重复的以及类似的图片(因此它应该能够找到具有不同文件名和元数据的已调整大小的照片和照片),甚至可以根据草图搜索照片。它有桌面和服务器版本。

不过,我自己并没有尝试过。

6
david.libremone

dupeGuru图片版 绝对精彩,值得一试。

他们有一个 Launchpad PPAdupeguru(新的一体化软件包)或dupeguru-pe(旧图片版软件包)可以使用这些命令从它安装:

Sudo add-apt-repository ppa:hsoft/ppa
Sudo apt-get update
Sudo apt-get install dupeguru
4
tuxflo

Visipics

Visipics是一个免费的Windows应用程序用于该功能,但在Linux上通过葡萄酒工作得很好(当然,它比geeqie/gqview关于重复项的排序更好(geeqie的结果绝对是“不可排序的”))。

您可以告诉它根据标准来自动选择图像,例如较小的文件大小,非压缩类型,较低的分辨率(虽然它不会反过来,但您需要手动执行,这不是比在geeqie上做得更好,除了选择不需要持有 Shift/Ctrl),甚至优先考虑文件夹(但最后一个优先级是文件夹优先级)。

但是,您必须注意符号链接 - 它可以“随机”选择将符号链接保存到文件,同时将实际文件删除为“副本”。真是太遗憾了。

2
the dsc