ADMIN: co se spamem v konferenci

Jan Kasprzak kas na fi.muni.cz
Pondělí Září 20 19:05:08 CEST 2004


	Dobry den,

vypada to, ze dost lidem vadi mnozstvi spamu v teto konferenci. Zkusim
popsat co se proti spamu na nasi strane dela ted a co by se pripadne
dalo delat navic. Tohle pisu spis pro verejnou informovanost nez ze bych
uz ted hned byl rozhodnuty pro nejaky dalsi postup.

	Jeste nez budete kritizovat velke mnozstvi spamu v konferenci,
zkusil jsem si zjistit skutecny stav - podle archivu konference.
Na http://www.linux.cz/lists/archive/linux/index-2223.html je 13 spamu
nebo obecne srotu (returned mail a podobne), o jeden archiv zpet
je 8 spamu, o dva archivy zpet 7 spamu. Kazda indexova stranka popisuje
100 zprav (nepocitam predchozi zpravy zahrnute kvuli uplnosti threadu).
Cili pohybujeme se nekde okolo 10% spamu, coz je dost hluboko pod prumerem
(nedavno jsem cetl ze spamu je vic nez polovina vsech mailu). Mohlo by
to byt lepsi, ale myslim ze to neni tak spatne. Taky si uvedomte, ze ne
vsechno co ma v hlavickach linux na linux.cz skutecne proslo pres
listserver. Dobre je orientovat se napriklad podle hlavicky Delivered-To.

	Momentalne delame proti spamu toto:

- pokud poslete prvni mail do konference (pocita se obalkovy odesilatel),
	dostanete mail zpet s tim, abyste si precetli Meta-FAQ a zvazili,
	jestli opravdu chcete ten mail poslat. Cili spammer musi poslat
	minimalne dva takove spamy.
- na univerzitni relayi se zahazuji zavirovane maily. Ma-li nekdo pocit
	ze neco do koneference proslo, necht posle URL z archivu konference
	a ja to budu resit se spravcem univerzitni relaye (neposilejte mi
	ale maily od viru/cervu mene nez 1-2 dny starych - to muze byt
	jen problem s aktualizaci antivirove databaze).
- maily z konference se parsuji, vyhazuji se prilohy a netextove casti. Pokud
	po tomto nezustane zadna MIME cast, mail se zahodi (ano, tahle cast
	muze za nefunkcni MIME/PGP podpisy a mozna je tam i nejaky problem
	s UTF-8; treba to nekdy budu resit :-)
- pred vstupem do konference je navic SpamAssassin (v podstate implicitni
	konfigurace, jen prah jsem zvedl na 7 bodu a naopak vse co projde
	pres blacklistovany relay rovnou zahazuji).
- list samotny by mel vyhazovat maily ktere nemaji adresu konference
	v To: nebo v Cc: (ale ted se divam ze treba tento mail z archivu
	to nesplnuje: http://www.linux.cz/lists/archive/linux/222063.txt
	- zkusim proverit).

	Mozna dalsi opatreni jsou:

- zakazat prijem zprav od neprihlasenych uzivatelu (asi moc nefunguje,
	cervi si z webu vytahuji jiz existujici kombinace odesilatel/prijemce).
	Navic by to vyrazne zkomplikovalo newsovou branu (nebo naopak snizilo
	ucinnost, pokud by z news chodilo hodne spamu).
- udelat nejaky bayesovsky filtr - ale to by ho nekdo musel ucit. Ja sam
	bayesovsky filtr mam, ale netroufam si ho nasadit pred konferenci,
	protoze se zde mnohdy probiraji jina temata nez mam v bezne
	korespondenci.
- pri prochazeni archivu jsem si vsiml, ze spamy jsou temer bez vyjimky
	prvni maily v threadu (cili ze se spammerum obvykle nepodari
	dat do mailu smysluplne In-Reply-To:). Cili ze bych treba snizil
	limit u SpamAssassinu, kdyby mail zacinal thread. Tady je ale problem
	ze prispevky z news mohou dojit v obracenem poradi.
- greylisting - tohle neumime, protoze postu prijimame pres univerzitni
	relay. Podobne opatreni by se muselo delat tam.

	Cili ted muzete diskutovat a navrhovat nejaka smysluplna
opatreni.

-Yenya

-- 
| Jan "Yenya" Kasprzak  <kas at {fi.muni.cz - work | yenya.net - private}> |
| GPG: ID 1024/D3498839      Fingerprint 0D99A7FB206605D7 8B35FCDE05B18A5E |
| http://www.fi.muni.cz/~kas/   Czech Linux Homepage: http://www.linux.cz/ |
btw, David, I'm wondering about this loop: [...]  Is this
a busy-wait-until-someone-plugs-in-more-ram-chips thing? ;)  --Andrew Morton


Další informace o konferenci Linux