překódování češtiny do html (xml) entit

Jaroslav Lukesh lukesh na seznam.cz
Pondělí Leden 24 10:26:32 CET 2005


Dne pondělí, 24. ledna 2005 00:16 jste napsal(a):
> On Sun 23. 1. 2005 21:59, Pavel Kankovsky wrote:
> > On Fri, 21 Jan 2005, Michal Čihař wrote:
> > > def escapeXML(data):
> > >     for i in range(len(data) -1, -1, -1):
> > >         n=ord(data[i])
> >
> > Pozor na to, ze entity musi byt generovany z unicodovych kodu.
> > Je tam treba zapojit jiz zminenou metodu decode.
>
> Jo zapomněl jsem dodat, že jsem to používal jenom na unicode řetězce :-)

to nevadí, bylo to od pohledu jasné (stejně jsem to trošku přepsal, je to 
zároveň součástí většího celku), spíš mám problém, že nevím jak a co 
naimportovat, aby mi to nebrblalo, že nezná funkci "decode" (ani nevím jestli 
třeba nebude brblat i na ord a hex), nechci importovat všechno (taky nevím co 
přesně naimportovat z locale, bez něj to nejede vůbec), zatím tam mám:

from string import split, strip, join, find
import locale
[...]

for word in split(line,' '):
    if word!='':
        wordxml=''
        strip(word)
        for i in range(len(word)):
            znak=word[i]
            n=ord(znak)
            if n>= 128:
                wordxml=wordxml+'&#'+(hex(ord(znak.decode('cp1250'))))+';'
            else:
                wordxml=wordxml+znak

děkuji,

-- 

                        Jaroslav Lukesh
  -----------------------------------------------------------
  This e-mail can not contain any viruses because I use Linux



Další informace o konferenci Linux