odstraneni duplicitnich souboru

damned konf_for_all na seznam.cz
Pátek Březen 14 13:56:01 CET 2003


dobry den,

(ani nevim proc :) se mi tu postupem casu vytvorila jista kosata 
adresarova struktura se spustou duplicitnich souboru. hledal jsem 
skriptik, ktery by mi je pomohl odstranit.
z konference jsem vycucal toto:

   find "$@" -type f -exec md5sum '{}' ';' >> ALL
   cat ALL | sort > SUMS
   cut -f 1 -d ' ' SUMS | uniq -d > DUPL
   join SUMS DUPL

vystupem je seznam _vsech_ souboru duplicitnich md5 digestu:

   33b033adee5f4aa0b676b94c43de6e30 ./001/original.tar.gz
   33b033adee5f4aa0b676b94c43de6e30 ./003/kopie.tar.gz
   33b033adee5f4aa0b676b94c43de6e30 ./012/jina_kopie.tar.gz
   dd35ac33232aa51feefcf85ac563e7a4 ./original.tar.bz2
   dd35ac33232aa51feefcf85ac563e7a4 ./kopie.tar.gz
   ...

stale se mi vsak nedari najit kombinaci prikazu jimiz bych z tohoto 
seznamu nejdrive odstranil prvni radek z kazdeho bloku stejnych 
md5sum-u a nasledne vyextrahoval pouze cesty k duplicitnim souborum. 
tedy abych ziskal seznam, ktery pak budu moci predhodit napr. programu 
'rm', 'mv', a pod. :

   ./003/kopie.tar.gz
   ./012/jina_kopie.tar.gz
   ./kopie.tar.gz

diky za vas cas,
cezi





Další informace o konferenci Linux