Porovnávání adresářů

Martin Cizek cizek na cmc.hopto.org
Neděle Září 14 09:11:46 CEST 2003


On So, 2003-09-06 at 03:10, Oak wrote:
> Dobrý den,
> 
> už dlouho se trápím různýma složitýma postupama na vyhledávání duplicit 
> souborů nebo celých adresářů. Vyzkoušel jsem několik programů, jako je 
> Kompare (používá diff), ale ty slouží ke hledání _odlišností_ v přibližně 
> shodných soubrech či adresářích, zatímco já bych potřeboval hledat _shody_ 
> v naprosto odlišných adresářích či celých soub. systémech (opak :-).
Zdravim,
resil jsem podobny problem, kdyz jsem chtel hledat duplicitni mp3
soubory. Napsal jsem si na to PERLovy skript (URL viz nize), ktery
rekurzivne projde zadany(e) adresar(e), zjisti shody velikosti
(kandidati na porovnani), dale shody zarizeni a inodu (hardlinky na tyz
soubor - neporovnavaji se). Vysledkem je tabulka vyskytu duplicitnich
souboru razena podle velikosti, kde ke kazdemu souboru, u ktereho
existuji duplicity, je vypsan seznam techto duplicitnich souboru. U
kazdeho z techto souboru je seznam hardlinku na nej. Duplicity se tedy
neposuzuji podle jmena souboru; vice hardlinku na tentyz soubor
neni povazovano za duplicitu.
Lze tez zadat minimalni velikost souboru, ktere se maji porovnavat
(napr. pro setreni mista byva zbytecne se zabyvat malymi soubory).
Pouziti je napsane na zacatku skriptu.
Skript lze stahnout z
http://cmc.hopto.org/myscripts/dupfind
nebo zazipovany
http://cmc.hopto.org/myscripts/dupfind.gz

 
Martin Cizek <cizek na cmc.hopto.org>
CMC Computers




Další informace o konferenci Linux