odstraneni duplicitnich souboru

Patrik Ostrihon pa3k na pa3k.sk
Pátek Březen 14 18:19:52 CET 2003


Dňa Pi, 2003-03-14 at 13:56, damned napísal:
> 
>    33b033adee5f4aa0b676b94c43de6e30 ./001/original.tar.gz
>    33b033adee5f4aa0b676b94c43de6e30 ./003/kopie.tar.gz
>    33b033adee5f4aa0b676b94c43de6e30 ./012/jina_kopie.tar.gz
>    dd35ac33232aa51feefcf85ac563e7a4 ./original.tar.bz2
>    dd35ac33232aa51feefcf85ac563e7a4 ./kopie.tar.gz
>    ...
> 
> stale se mi vsak nedari najit kombinaci prikazu jimiz bych z tohoto 
> seznamu nejdrive odstranil prvni radek z kazdeho bloku stejnych 
> md5sum-u a nasledne vyextrahoval pouze cesty k duplicitnim souborum. 
> tedy abych ziskal seznam, ktery pak budu moci predhodit napr. programu 
> 'rm', 'mv', a pod. :

man uniq

pomocka:

v prvom kroku vyrobit z uplneho zoznamu zoznam kde bude z kazdeho md5sum
len jeden (uniq ma parameter kolko znakov od zaciatku riadku ma
porovnavat)
v druhom pouzit zoznam s unikatnymi md5sum ako zoznam vzoriek pre grep
-v a mate doplnok (cestu k suboru si potom odrezte cez cut -c 33-

Ale efektivnejsie by to bolo spravit cez awk, ale ak Vam na efektivite
moc nezalezi a len si chcete spravit poriadok tak staci aj ten prvy
postup.

pa3k



Další informace o konferenci Linux