regex (+awk)

Rybarik, Michal mrybarik na tronet.sk
Pondělí Březen 8 17:23:13 CET 2004


hello all,

mam riadok z textoveho suboru a potrebujem ho rozparsovat. v riadku su
vzdy styri 
stlpce, oddelovac je whitespace. bohuzial, niekedy je aj v texte stlpca
obsiahnuta
aj medzera (jedna, dve, tri, ...), co cely problem kompikuje. text je
generovany 
proprietarnou binarkou a nemozem ho zmenit (ale autora by som s radostou
nakopal, 
to len tak btw).

vedel by som si napisat posix regularny vyraz, ktory by matchol cely
riadok a spravne
rozpoznal jednotlive stlpce. posix regexp som hojne vyuzival v php, a
tam som si 
vedel cely matchnuty vyraz, ako aj jeho casti vratit do pola. ako to
spravim v shelli?
myslel som ze cesta vedie cez awk, ale man ani google neprezradil, ako
na to. 
viem ako matchut cely riadok podla regexpu, ale neviem ako jeho casti
vyextrahovat 
do $1 $2 $3 pripadne rovno do premennych shellu. any idea? or - any
other tool?

thanks a lot
michal


Další informace o konferenci Linux