odstraneni duplicitnich souboru
Patrik Ostrihon
pa3k na pa3k.sk
Pátek Březen 14 18:19:52 CET 2003
Dňa Pi, 2003-03-14 at 13:56, damned napísal:
>
> 33b033adee5f4aa0b676b94c43de6e30 ./001/original.tar.gz
> 33b033adee5f4aa0b676b94c43de6e30 ./003/kopie.tar.gz
> 33b033adee5f4aa0b676b94c43de6e30 ./012/jina_kopie.tar.gz
> dd35ac33232aa51feefcf85ac563e7a4 ./original.tar.bz2
> dd35ac33232aa51feefcf85ac563e7a4 ./kopie.tar.gz
> ...
>
> stale se mi vsak nedari najit kombinaci prikazu jimiz bych z tohoto
> seznamu nejdrive odstranil prvni radek z kazdeho bloku stejnych
> md5sum-u a nasledne vyextrahoval pouze cesty k duplicitnim souborum.
> tedy abych ziskal seznam, ktery pak budu moci predhodit napr. programu
> 'rm', 'mv', a pod. :
man uniq
pomocka:
v prvom kroku vyrobit z uplneho zoznamu zoznam kde bude z kazdeho md5sum
len jeden (uniq ma parameter kolko znakov od zaciatku riadku ma
porovnavat)
v druhom pouzit zoznam s unikatnymi md5sum ako zoznam vzoriek pre grep
-v a mate doplnok (cestu k suboru si potom odrezte cez cut -c 33-
Ale efektivnejsie by to bolo spravit cez awk, ale ak Vam na efektivite
moc nezalezi a len si chcete spravit poriadok tak staci aj ten prvy
postup.
pa3k
Další informace o konferenci Linux