nepouzitelnost vyhledavani ...

Martin Povolný xpovolny na aurora.fi.muni.cz
Pátek Leden 9 13:36:41 CET 2004


Ahoj,

mym dilem je vyhledavatko na www.linux.cz, kolem ktereho se v posledni
dobe zvedla vlna nespokojenosti.

Na miste je asi nejake vysvetleni:

Takze stav: cela vec se sklada ze 3 casti:

   1) na odysseovi bezi kazde 2 hodiny indexovatko, ktere priindexovava nove
      zpravy do databaze

   2) dale pak taktez na odysseovi bezi vyhledavaci server, ktery
      vyhledava nad databazi vytvorenou databazi

   3) jako fastcgi aplikace napsana v C/C++ bezi taktez na odysseovi
      rozhrani, ktere vypisuje clanky, klade dotazu na vyhledavaci server,
      zobrazuje vysledky, vlakna ...

Problem:

   Na odysseovi si moje aplikace nejak spatne rozumi s fastcgi modulem
   apache, vysledkem je, ze nekdy skript vubec neodpovida (ackoliv samotne
   vyhledani v 0.85GB archivu probehne bleskove[*]), dokud neni
   restartovan apache.

   Toto zkousim nejak resit, ale fastcgi neni muj kun, 
   VITAM POMOC.
   
Jako docasne reseni, jsem zpristupnil vyhledavani v archivu linuxove
konference do data 7.1. 2004 (nenajdete nove prispevky) na adrese
http://athena.fi.muni.cz/, kde jsem zatim problemy s fastcgi nazaznamenal.
Pokud by http://www.linux.cz/lists/archive/linux/ nejelo, zkuste prosim
stesti tam.

K dalsim dotazum:

1) Pokud se nekomu neco nelibi/mate namet, napiste mi, muzu se to pokusit
   zmenit/zohlednit.

2) Nez si zacnete stezovat, prectete si prosim napovedu, snazil jsem se ji
   napsat tak, aby ji rozumnel kazdy.
   Napr. misto 'prokop samba' zkuste dotaz '+prokop +samba'.

3) Pokud mate pocit, ze na nejaky konkretni dotaz nedostavate ocekavany
   vysledek, poslete mi prosim onen dotaz + popis ocekavaneho vysledku.

4) Co je to 'Laboratoř zpracování přirozeného jazyka FI MUNI' zjistite,
   pokus tuto frazi napisete do googlu a zmacknete "I'm feeling lucky".

5) Pokud se vam to cele nelibi, napiste/domluvte instalaci/starejte se
   o jine vyhledavatko.

Dekuji za spolupraci.

[*]
$ time echo -e 'linux:1-10:+prokop +samba\n' | netcat localhost 6969
HlTerms: prokop,samba
ResultsCount: 65
RangeFrom: 1
RangeTo: 10
ResultsSorted:
 
118598 : 3.78353
118604 : 3.7736
118590 : 3.74477
203165 : 3.65453
129022 : 3.49114
95100 : 3.21435
203149 : 3.18546
119649 : 3.12548
205933 : 2.9883
 
real    0m0.286s
user    0m0.000s
sys     0m0.020s

-- 
Martin Povolný, xpovolny na fi.muni.cz, http://www.fi.muni.cz/~xpovolny


Další informace o konferenci Linux