trideni textoveho souboru

Pavel Kankovsky peak na argo.troja.mff.cuni.cz
Čtvrtek Červen 8 13:25:21 CEST 2000


On Thu, 8 Jun 2000, Jan ' Kozo ' Vajda wrote:

> :> > Dobry den omlouvam se, pokud jde o off-topic, ale nevim, kam jinam se
> :> > obratit s nasledujicim problemem. Mam asi 40 MB velky textovy soubor,
> :> > ve kterem je velke mnozstvi radku se stejnou strukturou, napr:
> :> 
> :> Zkuste se podivat na utilitu sort. Napr. man sort
> 
> myslim, ze problem nastane v pripade, ze tie opakujuce sa riadky nie su za
> sebou a dany clovek nechce menit poradie riadkov ( nemoze ) ..

cat -n soubor | sort -u -k 2 | sort -k 1 | cut -f 2-

> asi to skor vyriesi nejaky programcek, ktory si bude pamata vyskyt riadkov (
> mna napada perl )

problem je, ze to pri 40 megach dat muze byt o poznani pomalejsi, nez
dva pruchody sortem (ktery je na trideni velkych souboru optimalizovany)

--Pavel Kankovsky aka Peak  [ Boycott Microsoft--http://www.vcnet.com/bms ]
"Resistance is futile. Open your source code and prepare for assimilation."



Další informace o konferenci Linux