Ktery bayesovsky filtr?

Pavel Kankovsky peak na argo.troja.mff.cuni.cz
Čtvrtek Červenec 24 14:23:28 CEST 2003


On Thu, 24 Jul 2003, Jan Kasprzak wrote:

> 	Ucite to rucne, nebo automaticky? Pokud rucne, predhazujete tomu
> kazdy chybne detekovany spam, nebo nejak i ty ne-spamove zpravy (a kolik
> - vsechny co vam dojdou nebo jen nektere)?

Rucne. Zacal jsem s tim, ze jsem do toho narval par tisic archivovanych
spamu a hamu (ne-spamu), a ted do toho jen pridavam chybne detekovane
zpravy (tedy strikne vzato hamy oznacete jako spamy jsem zadne nemel, ale
pro ucely treninku pokladam za chybne oznacene hamy majici skore vyssi nez
je zadana mez).

Pouzivam vlastni skript, ktery je variaci na randomtrain a ktery navic
natrenovane maily uklada do souboru, coz je vyhodne, protoze tak ma clovek
kontrolu nad tim, co se vlastne filtr naucil. Pokud budu mit nekdy dobrou
naladu, tak se o ten skript podelim s ostatnimi. :)

> 	Bogofilter jsem zkousel - maji prasacky napsany configure.in
> - i pri --with-db= i pri LDFLAGS= se zadne -L nedostane do vysledneho
> linkovaciho prikazu, cili to spadne ze nenasel -ldb.

Spis je problem v tom, ze db byva instalovano pod tolika ruznymi jmeny,
ze ne vzdy se podari ty spravne headery (hlavne ty headery) a tu spravnou
knihovnu najit.


--Pavel Kankovsky aka Peak  [ Boycott Microsoft--http://www.vcnet.com/bms ]
"Resistance is futile. Open your source code and prepare for assimilation."



Další informace o konferenci Linux