Nalezeni duplicitnich souboru a jejich nahrazeni hardlinky

Pavel Kankovsky peak na argo.troja.mff.cuni.cz
Pondělí Červenec 21 22:09:12 CEST 2008


On Mon, 14 Jul 2008, Petr Baláš wrote:

> > Kazdopadne myslim, ze ani 20M souboru neni mimo kapacitu dnesnich
> > operacnich pameti => [...]
> Co jsem zkousel tak padlo na nedostatek pameti.

Může být.

20 mega souborů, to je jen 320 MB na uložení jejich 16-bajtových hašů.
Použitím nějakých trií se dosáhne úspory 3-4 bajtů na položku, tedy 
optimisticky redukce na nějakých 240 MB.

A zatím jsme vlastně nikam neuložili žádná užitečná data, která ten objem
ještě aspoň zdvojnásobí.

-- 
Pavel Kankovsky aka Peak                          / Jeremiah 9:21        \
"For death is come up into our MS Windows(tm)..." \ 21th century edition /




Další informace o konferenci Linux