priprava HTML stranek pomoci sed-u

Čtvrtek Listopad 29 11:16:12 CET 2001

Jan Marek píše:
> Dobry den,
> 
> snazim se pomoci sed-u pripravit k publikaci jisty log. V
> podstate umim zpracovat vsechny potrebne entity, tzn. jednotlive
> znaky nahrazovat znaky HTML kompatibilnimi, jen nemuzu prijit na
> to, jak prevest slovni spojeni v uvozovkach na odpovidajici
> reprezentaci. Takze napr. takto:
> 
> "slovni spojeni" -> „slovni spojeni”
> 
> Problem je prave parovost znacek... :-(
	Tohle je ještě jednoduché,
sed 's/"\([^"]*\)"/a\1b/'
Problémy nastanou s víceřádkovými výrazy. Ne že by to nešlo (viz archiv),
ale líp se to bude dělat v něčem jiném.

> Mohli byste mi doporucit nejake vhodne reseni (a treba i neco
> jineho, nez sed...)?
	perl, lex. Tu párovost si naprogramovat. Třeba tak, jak český TeX
řešil párové uvozovky. Ale napřed si musíte ten zdrojový text rozebrat
a rozhodnout se podle toho, co tedy vlastně obsahuje. Na rootu vyšel kdysi
článek o regulárních výrazech. Jestli ale text vyšel z MS Wordu, můžete
na jakékoliv regulární výrazy zapomenout :-).

-- 

--Zdeněk Pytela, <letty na mrakoplas.phil.muni.cz>