Spamassassin - uceni

Matus UHLAR - fantomas uhlar na fantomas.sk
Neděle Červen 26 16:58:25 CEST 2005


Jan Naiser <konfmail na drevojas.cz> wrote:
> na serverech mam nasazeny spamassassin a jelikoz klienti jsou Win a 
> uzivatele pouzivaji OE nebo Outlook, mam veskerou postu rovnez nasmerovanou 
> na ucty spam a ham, kde ji posleze tridim pro uceni sa. Premyslim o tom, jak 
> vse zautomatizovat a nechat na samotnych uzivatelich a napadla me toto:
> 
> rozliseni neidentifikovaneho spamu bych nechal na samotnych uzivatelich tim 
> zpusobem, ze by spam preposilali na nejaky dalsi ucet, dejme tomu uspam. 
> Jelikoz OE i Outlook meni obsah mailu pri preposlani, nemuzu tyto maily 
> samozrejme pouzit pro uceni sa. Musel bych je zpracovavat nejakym programkem 
> nebo scriptem tak, ze bych vzal mail z uspam, podle smerodatnych kriterii si 
> ho nasel v boxu spam a ham a vytridil. Posleze bych vytridene maily pouzil 
> pro sa-learn.

kedysi touto konferenciou prebehol model, ze zakaznici by mali folder so
specialnym nazvom, do ktoreho by presuvali zle ohodnotene maily, pricom
pravidelne by nad nim prebiehal skript, ktory by sa z nich ucil (a mazal ich
potom, samozrejme)
Pripadne by sa tie foldery dali urobit dva, jeden na false-positives a
false-negatives. To by proces ucenia dost zjednodusilo.

> 1) da se to takto realizovat? Pokud ano, tak jake nastroje by byly 
> nejvhodnejsi - nejaky skriptovaci jazyk nebo vyssi jazyk? Programovani mi 
> neni cizi, ale spise ve vyssich jazycich a zatim, az na skromne pokusy, jen 
> v DOS a Win. V Linuxu bych asi pouzil PAS, kde jsem vic doma nez v C, ale 
> nevim, zda a jake existuji knihovny pro podporu prace s maily (mbox).

pouzil by som cron, shell skript pre zoznam pouzivatelov, a potom uz silne
zalezi na tom ci pouzivate mbox alebo maildiry... prve chce nejaky grepmail
alebo formail, na druhe staci grep. Skoncil by som feednutim do sa-learn...

> 2) neni neco takoveho nebo podobneho jiz nekde hotovo, abych nevymyslel 
> Pythagorovu vetu? :-)

google je vas kamarat. Mozete zacat na google news hladat v archive tejto
konfery kedze sa to tu uz preberalo
-- 
Matus UHLAR - fantomas, uhlar na fantomas.sk ; http://www.fantomas.sk/
Warning: I wish NOT to receive e-mail advertising to this address.
Varovanie: na tuto adresu chcem NEDOSTAVAT akukolvek reklamnu postu.
The 3 biggets disasters: Hiroshima 45, Tschernobyl 86, Windows 95


Další informace o konferenci Linux