jak rozsekat strukturovany soubor do nekolika malych
Zdenek Pytela
letty na mrakoplas.phil.muni.cz
Čtvrtek Leden 17 16:26:56 CET 2002
Lukas Kopriva píše:
> Mam takovyto soubor:
>
> A nejakytext
> B jinytext
> BB jestejinytext
> A uplnejinytext
>
> Chtel bych jej co nejjednoduseji rozsekat do nekolika malych souboru
> obsahujicich skupiny dat v zavislosti na hodnote prvniho sloupce. Vysledkem by
> tedy byly tri soubory. Prvni 'A' by obsahoval dva radky - 'nejakytext' a
> 'uplnejinytext'. Dalsi dva soubory 'B' a 'BB' by obsahovaly kazdy po jednom
> radku analogicky.
>
> Chtel bych to provest co nejjednodusejsi skupinou programu, jako je awk apod.,
> pripadne sdruzenou v nejakem shellovem skriptu. Resenim v Perlu nebo Pythonu
> bych se rad vyhl. Jedna se o soubor s priblizne 15 miliony udaju, takze
> rychlost zpracovani taky hraje roli.
>
> Napada nekoho nejake 'elegantni' reseni?
Můžete zkusit napsat to přímo v shellu nebo jako makro v editoru,
(soubor by pak bylo lepší napřed utřídit - sort), naprogramovat v awku, ale
pokud je toho tolik, byl by o dost rychlejší perl, obzvlášť pokud to budete
potřebovat ještě víckrát, nemluvě o C nebo aspoň lexu. Ten program by v awku
i v perlu vzpadal prakticky stejně, navíc na překlad z awku do perlu je
jednoduchý překladač a2p k dispozici.
--
--Zdeněk Pytela, <letty na mrakoplas.phil.muni.cz>
Další informace o konferenci Linux