Мне нужны рекомендации для программного обеспечения для дедупликации.
Требования:
Работает в Windows
Возможность поиска дубликатов архивов: файлов, которые имеют точно такое же содержимое (и, следовательно, одинаковый размер). Имена, пути или даты не имеют значения.
Варианты выполнения автоматических действий (например, сохранение самых новых, самых старых файлов или файлов по какому-либо пути), а также ручное действие «ничего не делать, запрашивать действие». Этот последний случай (ручное действие) может быть выполнен более чем с одним файлом.
Возможность создания символических ссылок: вместо простого удаления всех вхождений, кроме одного, создайте символическую ссылку на одну версию.
Графический интерфейс (и не только командная строка)
Поиск дубликатов файлов : http://doubles.sourceforge.net/
Для Windows и Linux. Позволяет пользователю находить дублированные файлы (по их содержимому, а не только по именам). Поиск может включать и исключать файлы (например, исключать все файлы *.tmp) и ограничивать размер файлов, подлежащих поиску.
Может удалить дубликаты файлов, удалив их или создав ссылки.
Вместо использования хэшей он использует следующий алгоритм:
Алгоритм такой: Сначала все файлы сортируются по размеру, т.к. файлы могут быть равными только в том случае, если они имеют одинаковый размер (логически). Затем файлы сравниваются друг с другом, и таким образом определяются одинаковые файлы. Если два файла не равны с заданной точки, чтение прерывается; больше не нужно читать, чтобы определить, что эти файлы не равны. Благодаря этому результаты определяются гораздо быстрее, чем в программах, использующих алгоритмы хэширования, для которых все файлы должны быть прочитаны полностью. Дополнительное кэширование содержимого файлов дополнительно повышает производительность.
Он прост в использовании и быстр. Может сохранять результаты (список имен файлов) в файле .txt, чтобы вы могли обрабатывать их дальше с помощью какой-либо другой техники.
Лицензия: GPL
Что ж, уже много лет я использую Duplicate Cleaner Free . Он имеет интуитивно понятный, но мощный графический интерфейс и множество функций, включая «Превратить дубликат файла в жесткие ссылки».
- Find duplicate files, fast!
- Cleaner hard drives means faster performance.
- Fast Scanning and accurate duplicate comparison.
- Locate duplicate music (includes MP3, iTunes (M4A) and more.)
- Find Similar images (resized, rotated, edited and more.)
- Find duplicate folders.
- Flexible search settings - search the way you want to.
- Intelligent Selection Assistant.
- Search home or networked drives.
- Search multiple locations.
- Export / Import your results.
- View all file information in a detailed list.
- Large, resizable windows for easy browsing.
- Handy image preview window with side-by-side comparison.
- Delete duplicate files to the Recycle bin.
- Move dupe files to a new location.
- ***Turn duplicate file into hard links***.
- Protection for Windows and system files.
- Supports multiple languages.
- Comprehensive user manual.
- For Microsoft Windows XP, Windows Vista, Windows 7 and 8.
Я использую Manyprog Find Duplicate Files для успешного удаления повторяющихся файлов в течение многих лет.
Total Commander : Alt+F7, расширенный поиск дубликатов: [x] размер, [x] содержимое. Он использует аналогичный алгоритм, такой как Duplicate Files Finder.
Лицензия: условно-бесплатная, но вы можете использовать ее вечно, она только просит нажать кнопку при запуске. Полный текст :
Total Commander для Windows является условно-бесплатной программой (демонстрационная версия). Это означает, что вы можете протестировать его в течение 30 дней. После тестирования программы необходимо либо заказать полную версию, либо удалить программу с жесткого диска.
Дальний менеджер , вероятно, тоже может это сделать.
ВЕРТРАК
ВЕРТРАК