fultextove vyhledavani v dluhem textu
Karel Zak
zakkr na zf.jcu.cz
Středa Prosinec 5 10:26:52 CET 2001
On Wed, Dec 05, 2001 at 09:12:24AM +0100, POLÁČEK Petr wrote:
> Dobry den,
>
> Potreboval bych poradit s nasledujicim problemem. Na urade archivuji
> veskerou oficialni e-mailovou postu v databazi (PostgreSQL 6.5.2) a archiv
> jsem udelal pristupny pres web (intranet) i s moznosti vyhledavani ve
> zpravach. Vse jede OK, ale dostal jsem pozadavek na to, aby se dalo
> vyhledavat i v prilohach, kterymi jsou v drtive vetsine soubory z wordu.
> Proste kdyz nekdo zada nejake slovo k vyhledani, vypisou se vsechny zpravy,
> ktere jej obsahuji nejen v predmetu nebo tele (prvni e je s hackem :-), ale
> i v priloze.
> Uz jsem tak nejak dosahl toho, ze z prilohy vydoluji vsechna slova, ale
> stojim pred problemem, jak to ulozit do databaze tak, aby se v tom dalo
> fultextove hledat. Chtel bych pouzit pole s typem text, ale narazil jsem na
> omezeni max. velikosti 8KB.
> Cesta pres LO asi k cili nepovede, protoze jsem nedosel na to, jak v LO
> fultextove vyhledavat s rozumnou rychlosti (v soucasnosti je tam asi 20 000
> zprav a z nich zhruba tretina ma minimalne jednu prilohu).
> Dalsim napadem je pouziti vice sloupcu typu text a to co se nevejde do
> jednoho, rozdelit po castech 8KB i do dalsich sloupcu. Ctyri (32 KB) by mely
> vzhledem k charakteru zprav bohate stacit a bude treba jen ohlidat, aby se
> to nelamalo v pulce nejakeho slova nebo vety.
>
> Nemate nekdo nejaky jiny napad krome zmeny DB serveru.
Jo co treba zmena DB serveru? :-) Ne vazne, pokud udelate update na
PostgreSQL 7.1 (nebo za par tydnu na 7.2) tak budete mit vyresen
problem s 8KB a asi take trosku vetsi rychlost. Na fulltext snad
existuji i nejake udelatka (zkusenost s tim nemam).
Karel
--
Karel Zak <zakkr na zf.jcu.cz>
http://home.zf.jcu.cz/~zakkr/
C, PostgreSQL, PHP, WWW, http://docs.linux.cz, http://mape.jcu.cz
Další informace o konferenci Test