[python] překódování češtiny do =?iso-8859-2?q?=20html=09?=(xml) entit

Pátek Leden 21 17:51:58 CET 2005

Dne pátek, 21. ledna 2005 16:09 Jaroslav Pachola napsal(a):
> DD,
>
> Dne Friday 21 January 2005 03:38 pm Jaroslav Lukesh napsal:
> > Dobrý den,
> >
> > potřeboval bych kvůli xml výstupu zakódovat české  texty (mohou se tam
> > ale popravdě vyskytovat kdejaké paznaky) do hexa html entit, nejlépe
> > pomocí pythonu, ale není podmínkou, přepsat se to dá vždycky jednodušeji,
> > než vymýšlet znovu kolo.
> >
> > Tedy kupř. aby "č" bylo "&#x010D;", "í" bylo "&#xED;" a pod.
> >
> > Nemáte to někdo v nějaké formě náhodou hotové?
>
> mel by to, tusim umet program recode. Jinak nevim.

No, vidím, že tudy cesta asi nepovede, potřebuji to mít on-line a ne 
jednorázově. No, naštěstí jak tak koukám a zkouším, v pythonu to půjde celkem 
snadno:

>>> test="č"
>>> test2= test.decode('iso8859-2')
>>> print test
č
>>> print test2.encode('iso8859-2')
č
>>> ord(test)
232
>>>
>>> ord(test2)
269
>>> hex(ord(test2))
'0x10d'
>>>

Což je bez oněch dekorací přesně to co hledám. Teď jenom napsat balast kolem, 
co to bude žvejkat po písmenkách.

Dík všem za inspiraci,

-- 

                        Jaroslav Lukesh
  -----------------------------------------------------------
  This e-mail can not contain any viruses because I use Linux