Charset guesser
Milan Kerslager
milan.kerslager na pslib.cz
Čtvrtek Říjen 23 07:56:31 CEST 2003
On Thu, Oct 23, 2003 at 05:46:11AM +0200, Dan Bar wrote:
>
> shanim nejaky text/html, text-plain charset guesser a zatim jsem na nic
> pouzitelneho nenarazil. Jde hlavne o kodove stranky iso-8859-2 a cp1250,
> nicmene zdroj muze byt i jiny. Pouzival bych to v shell scriptech.
>
> Nevite o necem?
iconv se umi zastavit, pokud narazi na neznamy znak. Toho vyuziva editor
ViM (pouzivam volbu fileencodings=utf-8,iso-8859-2), ktery se pokusi o
prevod do kodove stranky podle nastavenych locale.
Rozliseni iso-8859-2 a cp1250 mi nefungovalo. Nicmene jsou tam pak
stejne paznaky, ktere se v normalnim textu nevyskytnou, takze kdybyste
si sam skriptoval, tak to podle toho poznate.
--
Milan Kerslager
E-mail: milan.kerslager na pslib.cz
WWW: http://www.pslib.cz/~kerslage/
Další informace o konferenci Linux