Rychlost spamassassinu

Jan Houstek Jan.Houstek na mff.cuni.cz
Středa Červen 1 11:34:55 CEST 2005


Ing. Pavel PaJaSoft Janoušek wrote:
> Tady souhlasím, bohužel už je docela problematické definovat a
> hlavně kategorizovat stav "zcela evidentní spam" (to je takové Orakulum:-))
> zejména v systémech, které dvojrozměrnou veličinu - text a formát -
> aproximuji na skalární hodnotu (dost rapidní projekce:-)) a dle této
> rozhodují, co je a není spam - je zřejmé, že chybovost tu bude značná a že v
> praxi se "až tak" neprojevuje je jen shoda okolností a štěstí (komerce tomu
> říká vyladění).

Poznat spam s prakticky nulovým false positive, za cenu toho, že třeba 
čtvrtinu spamu raději neoznačím jako spam, není nijak obtížné a 
nevyžaduje to velké ladění. Sice se tím problém nevyřeší úplně, ale i 
zmenšení problému na čtvrtinu se hodí.

> 	To jistě že ne, ale důsledným aplikováním této metody dojdeme k
> závěru, že místo toho aby byl zahozen/odmítnut jeden mail, tak je místo něho
> bouncován další (= již 2 kusy), ten se kupodivu občas podaří někomu nacpat,
> ten to zase odmítne, bounce atd. (= již 3 kusy) a teprve pak je (občas)
> někdo shopen detekovat cyklus a tento ping-pong ukončí - takže místo X mailů
> máme mailů minimálně 3x tolik.

Bounce je na obálce vybaven prázdnou adresou odesilatele, právě proto, 
aby se poznalo, že se jedná o bounce a že nemá cenu jej dále bouncovat. 
Pokud to někdo přesto dokáže, tak je třeba mu jako odpověď poslat 
nukleární hlavici.

> 	Jenže tak jak jste před chvílí narážel na administravitu
> "rejectovacích" seznamů, tady narážíte na administraci wish listů, což je
> řádově i technicky zcela obdobná otázka.

Kdo říká, že musím přímo udržovat wish list? Já si třeba můžu stanovit 
nějakou politiku pro odeslané maily, tj. procpat je antivirem, spamovým 
filterem (tentokrát mnohem přísnějším, než pro příchozí poštu) atd. a 
pak stejná pravidla aplikovat na příchozí bouncy, resp. odcitované 
maily, které jsou jejich součástí. K odfiltrování těch bouncovaných 
spamů s mojí obálkovou adresou to bohatě stačí.

-- Honza Houštěk


Další informace o konferenci Linux