ANNOUNCE: český slovník pro ispell

Petr Hlustik hlustik na cortex.neurology.umab.edu
Čtvrtek Leden 21 19:40:45 CET 1999


Petr Kolar <PETR.KOLAR na vslib.cz> napsal:

>    Na ftp://ftp.vslib.cz/pub/unix/ispell/ průběžně doplňuji slovník pro
> ispell. V současné době sice ještě není ani zdaleka hotový (v tomto dopise
> například našel jedno neznámé české slovo - rozšiřování), nicméně už
> obsahuje téměř 50 tisíc slov a rozeznává více než 840 tisíc slovních
> tvarů, což je 3x více než původní verze slovníku od Tomáše Čermáka.

Díky mocteré za ten slovník. Já stejně jako kolega Vajda jsem kdysi psal
Tomášovi, ale nedostal jsem odpověď. Měl jsem už slušný .ispell_czech,
bohužel nedávno se vypařil s havarovaným diskem.
 
>    Pokud máte nainstalován program ispell, stačí pouze stáhnout obsah
> zmíněného adresáře (nebo pouze soubory *.cat, czech.aff, Makefile a
> README), zadat make, zkontrolovat, zda v Makefile je uveden správný
> adresář pro soubory pro ispell, a jako root zadat make install.

Měl jsem problém ve fázi buildhash, tohle je kousek výstupu (mám ispell-3.1):

-------------------------------------
cd ~/src/ispell-cz/
make
rm -f czech.a-z
perl -pe 'print "echo "' hlavni.cat nepravid.cat nesklon.cat zajmena.cat cislovk.cat prislovc.cat predlozk.cat spojky.cat citoslov.cat castice.cat zkratky.cat nezaraz.cat | sh - | \
  perl -pe 's/ +/\n/g; s/[{}\.]//g; s/-/\n/g' > czech.a-z
buildhash czech.a-z czech.aff czech.hash
Counting words in dictionary ...
1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 11000 12000 13000 14000 15000 16000 17000 18000 19000 20000 21000 22000 23000 24000 25000 26000 27000 28000 29000 30000 31000 32000 33000 
33578 words
0 
Word 'a,in,pre,sufix' contains illegal characters

Word 'a,bezpre,in,pre,sufixový' contains illegal characters

Word 'an,kat,di,tri,tetr,pent,hex,hept,oktoda' contains illegal characters

[ asi 2.500 takových řádků  ]

--------------------------------------

Jinak myslím, že by se tento slovník mohl taky inzerovat na stránkách ispellu,
které mají momentálně link na slovník Tomáše Čermáka:

http://fmg-www.cs.ucla.edu/geoff/ispell-dictionaries.html#Czech-dicts

Zdraví
Petr





Další informace o konferenci Linux