jak rozsekat strukturovany soubor do nekolika malych

Zdenek Pytela letty na mrakoplas.phil.muni.cz
Čtvrtek Leden 17 16:26:56 CET 2002


Lukas Kopriva píše:
> Mam takovyto soubor:
> 
> A	nejakytext
> B	jinytext
> BB	jestejinytext
> A	uplnejinytext
> 
> Chtel bych jej co nejjednoduseji rozsekat do nekolika malych souboru
> obsahujicich skupiny dat v zavislosti na hodnote prvniho sloupce. Vysledkem by
> tedy byly tri soubory. Prvni 'A' by obsahoval dva radky - 'nejakytext' a
> 'uplnejinytext'. Dalsi dva soubory 'B' a 'BB' by obsahovaly kazdy po jednom
> radku analogicky.
> 
> Chtel bych to provest co nejjednodusejsi skupinou programu, jako je awk apod.,
> pripadne sdruzenou v nejakem shellovem skriptu. Resenim v Perlu nebo Pythonu
> bych se rad vyhl.  Jedna se o soubor s priblizne 15 miliony udaju, takze
> rychlost zpracovani taky hraje roli.
> 
> Napada nekoho nejake 'elegantni' reseni?
	Můžete zkusit napsat to přímo v shellu nebo jako makro v editoru,
(soubor by pak bylo lepší napřed utřídit - sort), naprogramovat v awku, ale
pokud je toho tolik, byl by o dost rychlejší perl, obzvlášť pokud to budete
potřebovat ještě víckrát, nemluvě o C nebo aspoň lexu. Ten program by v awku
i v perlu vzpadal prakticky stejně, navíc na překlad z awku do perlu je
jednoduchý překladač a2p k dispozici.

-- 

--Zdeněk Pytela, <letty na mrakoplas.phil.muni.cz>



Další informace o konferenci Linux