fultextove vyhledavani v dluhem textu

Karel Zak zakkr na zf.jcu.cz
Středa Prosinec 5 10:26:52 CET 2001


On Wed, Dec 05, 2001 at 09:12:24AM +0100, POLÁČEK Petr wrote:
> Dobry den,
> 
> Potreboval bych poradit s nasledujicim problemem. Na urade archivuji
> veskerou oficialni e-mailovou postu v databazi (PostgreSQL 6.5.2) a archiv
> jsem udelal pristupny pres web (intranet) i s moznosti vyhledavani ve
> zpravach. Vse jede OK, ale dostal jsem pozadavek na to, aby se dalo
> vyhledavat i v prilohach, kterymi jsou v drtive vetsine soubory z wordu.
> Proste kdyz nekdo zada nejake slovo k vyhledani, vypisou se vsechny zpravy,
> ktere jej obsahuji nejen v predmetu nebo tele (prvni e je s hackem :-), ale
> i v priloze.
> Uz jsem tak nejak dosahl toho, ze z prilohy vydoluji vsechna slova, ale
> stojim pred problemem, jak to ulozit do databaze tak, aby se v tom dalo
> fultextove hledat. Chtel bych pouzit pole s typem text, ale narazil jsem na
> omezeni max. velikosti 8KB. 
> Cesta pres LO asi k cili nepovede, protoze jsem nedosel na to, jak v LO
> fultextove vyhledavat s rozumnou rychlosti (v soucasnosti je tam asi 20 000
> zprav a z nich zhruba tretina ma minimalne jednu prilohu). 
> Dalsim napadem je pouziti vice sloupcu typu text a to co se nevejde do
> jednoho, rozdelit po castech 8KB i do dalsich sloupcu. Ctyri (32 KB) by mely
> vzhledem k charakteru zprav bohate stacit a bude treba jen ohlidat, aby se
> to nelamalo v pulce nejakeho slova nebo vety.
> 
> Nemate nekdo nejaky jiny napad krome zmeny DB serveru.

 Jo co treba zmena DB serveru? :-) Ne vazne, pokud udelate update na 
 PostgreSQL 7.1 (nebo za par tydnu na 7.2) tak budete mit vyresen
 problem s 8KB a asi take trosku vetsi rychlost. Na fulltext snad
 existuji i nejake udelatka (zkusenost s tim nemam).
 
        Karel

-- 
 Karel Zak  <zakkr na zf.jcu.cz>
 http://home.zf.jcu.cz/~zakkr/
 
 C, PostgreSQL, PHP, WWW, http://docs.linux.cz, http://mape.jcu.cz


Další informace o konferenci Test