Spamassassin a uceni

Miroslav Zidek linux na mzidek.net
Pátek Květen 22 21:02:06 CEST 2009


Dobry den,

Antonín Kolísek píše v Čt 21. 05. 2009 v 11:24 +0200:

> mohl by mi nekdo objasnit, jak se zachova SpamAssassin pokud jej budu
> preucovat na SPAM
> 
> sa-learn -u USER --spam ./spam_dir
> 
> ale mezi emaily bude i ciste obrazkovy spam. Nekde jsem nasel, ze se
> muze Bayesovska databaze ucenim z obrazkoveho spamu docela pokazit. 

jestli mate na mysli, ze bude poskytovat spatne vysledky, tak s nicim
podobnym jsem se nesetkal. Obrazkovy spam vetsinou dostane bez OCR plnou
sazbu - tzn 3.5 (myslim ze se tu na to uz narazilo) - i kdyz to na
oznaceni spamu nestaci. To az OCR mu doda dostatek bodu na oznaceni. Jak
tu rikal kolega - Bayes je jen jednim z mnoha filtru, ze kterych se SA
sklada. Mate odkaz na clanek, ze ktereho toto tvrzeni vyplyva? Docela
aby mne zajimal. 

Mozna tim myslite, ze kdyz Vam nekdo posle "legalni" mail s jedinym
obrazkem/vice obr. (i to se muze stat) - pak je oznacen diky tomuto
uceni jako spam. Protoze SA nekontroluje bez OCR obsah, je pro nej
obrazek jako obrazek. Toto chovani ale IMHO neni pokazeni databaze.
<noflame>kdyz nekdo posle v tele mailu jen obrazek bez vysvetleni nebo s
odkazem, pka si koleduje o smazani</noflame>


> Zabival jste se timto nekdo?

nastesti jsem nikoho nezabil (kdyz nepocitam obcas kill -9 ) :)). I kdyz
ucenim SA se obcas musim zabyvat ;)



MiZi




Další informace o konferenci Linux