Kódovástránkafilesystému

Jan Otte jotte na suse.cz
Pondělí Květen 14 10:30:45 CEST 2007


On Sat, May 12, 2007 at 06:27:49AM +0200, Petr Vileta wrote:
> > Z jakeho duvodu bych mel ze standardu ISO, konkretne ISO-8859-2
> > prechazet na UTF-8?
> >
> > (duvody ze je to moderni a ze to pouziva vetsina pro me nejsou duvody)
> >

> Ze je to moderni fakt neni duvod (nebo je, ale pitomej). Ze to pouziva 
> vetsina to uz duvod je a vazny. Nekdo vam prinese neco na diskete, ZIPce, 
> CD/DVD a bude to v kodovani utf8. A jste v ... ;-)


No, povazme tuto situaci:

Pouzivam ISO standard. Jednou definovany a presne znamy. Neni problem
konvertovat dokument mezi dvema standardy, paklize se v nem vyskytuji
pouze znaky reprezentovatelne v obou kodovanich. 

Jelikoz pouzivam pouze toto kodovani, mezi svymi dokumenty nemam potrebu
prevadet sem a tam. Z IL2 se muze kdokoliv (protoze to je standard)
prevest do treba utf-8 nebo cehokoliv jineho. Pokud mi naopak nekdo chce
neco dat a prinese mi to ve standardnim kodovani, opet neni problem.
Muzu to bud zpracovat v tom kodovani ktere mi prinesl nebo si to
prevest. Pokud se bavime o cesky psanych dokementech, rozdily jsou z
informacniho hlediska zanedbatelne. Z binarniho samozrejme nikoliv, ale
bavime se o predevani cesky psanych textu.

A ted povazme co jste napsal:
...Ze to pouziva vetsina to uz duvod je a vazny...

Vetsina pouziva MS Windows. Nebudu to pouzivat. Je to spatne? Domnivam
se ze ne. Cili to ze to pouziva vetsina pro me opravdu neni argument.

Daleko vetsi problem nez jine kodovani predstavuje nepodporovany (temi
programy co pouzivam) format. Kodovani zpracuji nebo prevedu jednoduse
ale kupu binarnich dat ktera neni standardizovana ani k ni neexistuje
prevadec do nejakeho standardniho formatu... tu muzu akorat tak zahodit.

Z meho hlediska je velmi dulezite pouzivat pro reprezentaci dat format
(a kodovani), ktere

(1) vam vyhovuje

(2) je popsane a tudiz je mozne z nej za nejakych (vam vyhovujicich)
podminek prevest do nejakeho standardu, ktery je pouzitelny ostatnimi


> Dalsim duvodem muze byt, ze pokud pouzivate utf8, pak cokoliv jineho muzete 
> prevest na to sve. Pokud zustanete u iso, pak nektere znaky proste prevest 
> nelze, protoze ve vasi znakove sade proste nejsou. Typickym prikladem je 
> prevod windows-1250 -> iso-xxx. Vzdy je tam alespon 1-2 znaky, ktere proste 
> neprevedete, ale v dokumentech nebo nazvech souboru proste jsou. Oblibene 
> jsou posledni dobou treba znaky "plus-minus" nebo (c) (R) "Tm" a podobne.

Myslim ze jsem odpoved jiz nastinil vyse.

Honza



Další informace o konferenci Linux