Re: ANNOUNCE: český slovník pro ispell

Petr Kolar PETR.KOLAR na vslib.cz
Pátek Leden 22 08:17:42 CET 1999


Petr Hlustik <hlustik na cortex.neurology.umab.edu> wrote:
> Díky mocteré za ten slovník. Já stejně jako kolega Vajda jsem kdysi psal
> Tomášovi, ale nedostal jsem odpověď. Měl jsem už slušný .ispell_czech,
> bohužel nedávno se vypařil s havarovaným diskem.

:-(

> >    Pokud máte nainstalován program ispell, stačí pouze stáhnout obsah
> > zmíněného adresáře (nebo pouze soubory *.cat, czech.aff, Makefile a
> > README), zadat make, zkontrolovat, zda v Makefile je uveden správný
> > adresář pro soubory pro ispell, a jako root zadat make install.
>
> Měl jsem problém ve fázi buildhash, tohle je kousek výstupu (mám ispell-3.1):
>
> -------------------------------------
> cd ~/src/ispell-cz/
> make
> rm -f czech.a-z
> perl -pe 'print "echo "' hlavni.cat nepravid.cat nesklon.cat zajmena.cat cislovk.cat prislovc.cat predlozk.cat spojky.cat citoslov.cat castice.cat zkratky.cat nezaraz.cat | sh - | \
>   perl -pe 's/ +/\n/g; s/[{}\.]//g; s/-/\n/g' > czech.a-z
> buildhash czech.a-z czech.aff czech.hash
> Counting words in dictionary ...
> 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 11000 12000 13000 14000 15000 16000 17000 18000 19000 20000 21000 22000 23000 24000 25000 26000 27000 28000 29000 30000 31000 32000 33000
> 33578 words
> 0
> Word 'a,in,pre,sufix' contains illegal characters

Tohle vypadá, jako když Vám v shellu špatně funguje příkaz echo. 'Illegal
characters' budou nejspíš čárky. Protože je v češtině mnoho slov, které se
liší pouze předponou, jsou do slovníku zanesena jako

{a,bezpre,in,pre,su}fixový/YR

a ten dlouhý příkaz v Makefile před každý řádek připojí řetězec "echo ",
výstup se zpracuje shellem, který z toho udělá

afixový/YR bezprefixový/YR infixový/YR prefixový/YR sufixový/YR

a další skriptík v perlu smaže znaky { } a . a rozhazí jednotlivá slova na
řádky. Asi bych se měl dokopat napsat něco, co to udělá všechno najednou,
ale mně to zatím fungovalo naprosto bez problémů. Možná bych mohl na FTP
dávat přímo soubor czech.a-z. Pak by stačil pouze czech.a-z a czech.aff.

> Jinak myslím, že by se tento slovník mohl taky inzerovat na stránkách ispellu,
> které mají momentálně link na slovník Tomáše Čermáka:
>
> http://fmg-www.cs.ucla.edu/geoff/ispell-dictionaries.html#Czech-dicts

   Děkuji za informaci, zkusím jim napsat.

                                                       S pozdravem
--
                          ***  Petr Kolar  ***
 Department of Information Technologies, Technical University of Liberec
             Voronezska 1329, 461 17 Liberec, Czech Republic
             Phone: +420-48-535-2371   Fax: +420-48-535-2229
  E-mail: Petr.Kolar na vslib.cz  http://asterix.vslib.cz/staff/kolar.html


Další informace o konferenci Linux