priprava HTML stranek pomoci sed-u
Zdenek Pytela
letty na mrakoplas.phil.muni.cz
Čtvrtek Listopad 29 11:16:12 CET 2001
Jan Marek píše:
> Dobry den,
>
> snazim se pomoci sed-u pripravit k publikaci jisty log. V
> podstate umim zpracovat vsechny potrebne entity, tzn. jednotlive
> znaky nahrazovat znaky HTML kompatibilnimi, jen nemuzu prijit na
> to, jak prevest slovni spojeni v uvozovkach na odpovidajici
> reprezentaci. Takze napr. takto:
>
> "slovni spojeni" -> „slovni spojeni”
>
> Problem je prave parovost znacek... :-(
Tohle je ještě jednoduché,
sed 's/"\([^"]*\)"/a\1b/'
Problémy nastanou s víceřádkovými výrazy. Ne že by to nešlo (viz archiv),
ale líp se to bude dělat v něčem jiném.
> Mohli byste mi doporucit nejake vhodne reseni (a treba i neco
> jineho, nez sed...)?
perl, lex. Tu párovost si naprogramovat. Třeba tak, jak český TeX
řešil párové uvozovky. Ale napřed si musíte ten zdrojový text rozebrat
a rozhodnout se podle toho, co tedy vlastně obsahuje. Na rootu vyšel kdysi
článek o regulárních výrazech. Jestli ale text vyšel z MS Wordu, můžete
na jakékoliv regulární výrazy zapomenout :-).
--
--Zdeněk Pytela, <letty na mrakoplas.phil.muni.cz>
Další informace o konferenci Linux