Re: Autodetekce znakové sady

Roman Julius rjulius na seznam.cz
Čtvrtek Říjen 18 14:15:24 CEST 2001


Dne 18. říjen 2001, <linux na linux.cz> napsal:

> Dne čt 18. říjen 2001 13:12 Roman Julius napsal(a):
> > Zdravím,
> >
> > nevíte někdo náhodou o nějakém nástroji na detekci znakové sady?
> ???
> Pokud vim, tak takovy nastroj by musel byt hodne nedeterministicky.
> Soubor obsahujici jediny znak A1h je v ktere znakove sade?
> ISO8859-1? 2? 5?. Soubor obsahujici A1hA1h je v unicode? UTF-8?
> A tak bych mohl pokracovat. Navic jak rozpoznat, zda dany text neni nahodou v 
> CP1250? Opravdu to ma byt znak Copyright, nebo to ma byt velke S s hackem?

Asi bych to mel trochu upřesnit. Nástroj si představuju aplikovat
vždy na soubor, který bude napsaný v jedné z českých znakových sad - 
Kameníci, CP 1250, ISO Latin 2 a PC Latin 2. Tím se možné rozhodování
trochu zužuje, ne? 

Ale jinak vítám každou radu a pokud mne přesvědčíte že je to blbost,
v podstatě mi to ulehčí práci.

Dík, Roman Julius
 

______________________________________________________________________
Objevte oranzovy svet financi a vyhrajte v soutezi s ING!
http://soutez.ing.cz


Další informace o konferenci Linux