Charset guesser

Ondrej Svejda osvejda na seznam.cz
Čtvrtek Říjen 23 08:50:18 CEST 2003


* 23.10.2003 05:46, Dan Bar <Daniel.Bar na seznam.cz>:
> shanim nejaky text/html, text-plain charset guesser a zatim jsem na nic 
> pouzitelneho nenarazil. Jde hlavne o kodove stranky iso-8859-2 a cp1250, 
> nicmene zdroj muze byt i jiny. Pouzival bych to v shell scriptech.
> 
> Nevite o necem?
> 

http://trific.ath.cx/software/enca/

Enca is an Extremely Naive Charset Analyser. It detects character set
and encoding of text files and can also convert them to other encodings.
The charset detecing functionality is also available as a library.

-- 
Ondřej Švejda <osvejda na seznam.cz> (formerly osvejda na volny.cz)

Registered Microsoft Hater #5359328010


Další informace o konferenci Linux