DSpam/merged: uceni od vice uzivatelu

Jan Kasprzak kas na fi.muni.cz
Úterý Listopad 22 10:54:38 CET 2011


	Dobry den,

mam dspam, kde je spolecna databaze jako zaklad a pak individualni
databaze pro kazdeho uzivatele, co si kdo nauci (cili v group mam neco
jako "dspam:merged:*" kde "dspam" je ten spolecny uzivatel).
A ted je otazka, jak extrahovat znalosti o tom, kdo si co naucil
jako spam/nonspam, do te spolecne databaze.

Problem je, ze rozhodovani jednotlivych uzivatelu je primo neprenositelne
do globalniho nastaveni: jednak delaji chyby, a jednak cas od casu jako
spam oznacuji neco, co jini uzivatele jako spam nevnimaji (priklad: oznameni
o odpadnuti vyuky, ktere ucitel posle vsem studentum predmetu, a ne jen
dotcene seminarni skupine).

Cili bych si predstavoval, ze do spolecne databaze budu promitat jen ty
tokeny, ktere jsou v oznacenych mailech od vice uzivatelu, pripadne
ktere se pouzivaji opravdu casto. Nevite nekdo o existujici implementaci
neceho takoveho, abych to nemusel psat rucne?

Mam k dispozici vsechny maily, ktere uzivatele oznacili jako chybne
rozpoznane, a pak samozrejme celou tu databazi dspamu.

Dalsi moznost je ucit dspam pomoci odeslane posty uzivatelu.
Zkouseli jste nekdo toto?

-Yenya

-- 
| Jan "Yenya" Kasprzak  <kas at {fi.muni.cz - work | yenya.net - private}> |
| GPG: ID 1024/D3498839      Fingerprint 0D99A7FB206605D7 8B35FCDE05B18A5E |
| http://www.fi.muni.cz/~kas/    Journal: http://www.fi.muni.cz/~kas/blog/ |
Please don't top post and in particular don't attach entire digests to your
mail or we'll all soon be using bittorrent to read the list.     --Alan Cox


Další informace o konferenci Linux