bibliograficka databaze - unicode?

Pavel Kankovsky peak na argo.troja.mff.cuni.cz
Sobota Červen 23 17:40:19 CEST 2001


On Thu, 21 Jun 2001, Petr Tomasek wrote:

> BTW. nevite, jestli existuje nejaky obecny system pro trideni v unicode?
> To musi byt asi zahul, napsat neco takoveho.... :-o

Na to lze odpovedet tremi zpusoby:
1. existuje prave (2^16)! zpusobu, jak tridit unicodove znaky;
2. existuje nespocetne mnoho zpusobu, jak tridit unicodove stringy,
   jestlize neni jejich delka omezena;
3. neexistuje zadny zpusob, jak tridit unicodove stringy, aby vyhovoval
   vsem jazykum takovy, ze znakove sady jejich psane formy jsou
   podmnozinou Unicode.

Dukaz casti 3.: Cestina a anglictina jsou takove jazyky. Sekvence znaku
"ch" se v cestine tridi za pismeno "h", zatimco v anglictine (a mnoha
dalsich jazycich) se tridi mezi ostatni sekvence zacinajici znakem
"c". Cili kazdy zpusob trideni "ch" bud nevyhovuje cestine, nebo
nevyhovuje anglictine. Cili neexistuje zpusob, jak setridit stringy tak,
aby to zaroven vyhovovalo cestine i anglictine. QED.
Dukazy casti 1. a 2. jsou ponechany jako cviceni pro ctenare.

--Pavel Kankovsky aka Peak  [ Boycott Microsoft--http://www.vcnet.com/bms ]
"Resistance is futile. Open your source code and prepare for assimilation."



Další informace o konferenci Linux