Charset guesser

Milan Kerslager milan.kerslager na pslib.cz
Čtvrtek Říjen 23 07:56:31 CEST 2003


On Thu, Oct 23, 2003 at 05:46:11AM +0200, Dan Bar wrote:
> 
> shanim nejaky text/html, text-plain charset guesser a zatim jsem na nic 
> pouzitelneho nenarazil. Jde hlavne o kodove stranky iso-8859-2 a cp1250, 
> nicmene zdroj muze byt i jiny. Pouzival bych to v shell scriptech.
> 
> Nevite o necem?

iconv se umi zastavit, pokud narazi na neznamy znak. Toho vyuziva editor
ViM (pouzivam volbu fileencodings=utf-8,iso-8859-2), ktery se pokusi o
prevod do kodove stranky podle nastavenych locale.

Rozliseni iso-8859-2 a cp1250 mi nefungovalo. Nicmene jsou tam pak
stejne paznaky, ktere se v normalnim textu nevyskytnou, takze kdybyste
si sam skriptoval, tak to podle toho poznate.

-- 
                        Milan Kerslager
                        E-mail: milan.kerslager na pslib.cz
                        WWW:    http://www.pslib.cz/~kerslage/


Další informace o konferenci Linux