překódování češtiny do html (xml) entit
Jaroslav Lukesh
lukesh na seznam.cz
Pondělí Leden 24 10:26:32 CET 2005
Dne pondělí, 24. ledna 2005 00:16 jste napsal(a):
> On Sun 23. 1. 2005 21:59, Pavel Kankovsky wrote:
> > On Fri, 21 Jan 2005, Michal Čihař wrote:
> > > def escapeXML(data):
> > > for i in range(len(data) -1, -1, -1):
> > > n=ord(data[i])
> >
> > Pozor na to, ze entity musi byt generovany z unicodovych kodu.
> > Je tam treba zapojit jiz zminenou metodu decode.
>
> Jo zapomněl jsem dodat, že jsem to používal jenom na unicode řetězce :-)
to nevadí, bylo to od pohledu jasné (stejně jsem to trošku přepsal, je to
zároveň součástí většího celku), spíš mám problém, že nevím jak a co
naimportovat, aby mi to nebrblalo, že nezná funkci "decode" (ani nevím jestli
třeba nebude brblat i na ord a hex), nechci importovat všechno (taky nevím co
přesně naimportovat z locale, bez něj to nejede vůbec), zatím tam mám:
from string import split, strip, join, find
import locale
[...]
for word in split(line,' '):
if word!='':
wordxml=''
strip(word)
for i in range(len(word)):
znak=word[i]
n=ord(znak)
if n>= 128:
wordxml=wordxml+'&#'+(hex(ord(znak.decode('cp1250'))))+';'
else:
wordxml=wordxml+znak
děkuji,
--
Jaroslav Lukesh
-----------------------------------------------------------
This e-mail can not contain any viruses because I use Linux
Další informace o konferenci Linux