spamassassin a uceni co je SPAM a HAM

Martin Och martin na och.cz
Čtvrtek Leden 6 18:02:17 CET 2005


DV,

priznam se, ze mam pocit, ze asi nevite co delate :)
Rozvinu svoji teorii a praxi, ktera samozrejme nemusi byt spravna:

sa-learn --spam - "nauci" spamassassina, ze takovato zprava JE spam,
sa-learn --ham - "nauci" spamassassina, ze takovato zprava NENI spam

Vynechavam ostatni parametry, jejich vyznam je v man
Podle toho co vim, a pripada mi to logicke, MUSITE predat zpravy sa-learn s
puvodnimi hlavickami. Jinak v databazi bayes udelate pekny gulas.

Na strankach spamassassinu je celkem dost popsano jak zpravy spam,
resp. ham predat k uceni, ci aspon ukladat k dalsimu zpracovani.

Pokud chcete predat zpravu postovnim klientem, muzete, ale predat je musite v
NEZMODIFIKOVANE forme, s puvodnimi hlavickami.
Tohle snad umi i nekteri mail klienti, a rika se tomu, tusim, bounce message...
Myslim, ze se o nich zminuji na strankach spamassassin.org
Neni to zrovna "zdrava" funkce, coz je asi jasne.

A ted trocha praxe:
Pouzivam sendmail + clamav, ktery prijima postu, kontroluje na viry,
a uklada do pop3 uctu.
POP3 ucty vybiram openwebmailem, ktery opet vyuziva clamav, a navic spamassassin.
Postu OWM tridi a kdyz pozna spam strci ho do slozky spam.
Co nepozna mu muzu extra (A NEZMODIFIKOVANE) predat k douceni. (LEARN SPAM)
Obracene zase muzu udelat LEARN HAM pokud je moc chytrej :)

Dalsi varianta (provozovana jinde), ze na sendmail je napichnuty antivir nod32,
a zaroven spamassassin, a ten postu pred ulozenim do pop3 uctu proveri, a pokud
jde o spamm, zaroven ji nalezite oznaci. 
V teto variante jsem neprisel na to, jak nerozpoznany spam predat bez
zmodifikovani k nauceni...

Resit u Vas by to slo tak, ze by si uzivatel sam postu roztridil do lokalnich
slozek (aspon ty spamy do slozky spam), a vy pak na ne pusitl sa-learn --spam
--mbox spamfile
Problem je, ze ty soubory musi byt ve formatu, ktery sa-learn podporuje, tedy
zadne M$ blbosti...

Pomohl jsem? :)

--
Martin Och

---------- Original Message -----------
From: "Mgr. Jaroslav Filip" <filip na mits.cz>
To: linux na linux.cz
Sent: Thu, 06 Jan 2005 13:33:42 +0100
Subject: spamassassin a uceni co je SPAM a HAM

> Zdravim vsechny!
> 
> Pouzivam jiz delsi dobu Spamassassin spolu qmailem a vpopmailem. Nyni 
> jsem se rozhodl, ze si vytvorim dve specialni adresy (ham na domena.cz a 
> spam na domena.cz), na ktere budu preposilat neoznacene spamy a oznacene 
> hamy. Jednou za cas na techto boxech pustim sa-learn. Ale narazil jsem 
> na jednu vec. Kdyz v klientovi u daneho mailu dam "Predat dal", tak se 
> bud zprava zmeni tak, ze se do predmetu vlozi Fw: a na zacatek kazdeho 
> radku se da znak >, nebo se puvodni zprava vlozi jako priloha. Je to 
> dano typem a nastavenim klienta. Tato zmena dost ovlivni uceni 
> spamassassinu. :o(
> 
> Napadlo me, ze by se to dalo vyresit ctenim posty pres IMAP a vytvorenim 
>   specialni slozky. Ale problem je v tom, ze vetsina zamestnancu si 
> postu cte pres POP3.
> 
> Muzete mi nekdo poradit, jak jste to resili? Podotykam, ze postovni 
> klienti bezi na windows.
> 



Další informace o konferenci Linux