sa-learn
Tomáš Janoušek
tomi na nomi.cz
Pondělí Prosinec 29 13:21:53 CET 2003
Zdravim,
> - Kdyz uz chci bez premysleni cpat maily uzivatelu do SA, tak me prece
> nezastavi to, ze mi je uzivatele ze serveru smazou! Muzu si prece nekde
> ukladat kopie.
Ja je tam necpu bez premysleni ale prochazim to.
> - Neni uplne nejlepsi bayesovsky filtr krmit uplne vsemi spamy a hamy,
> ktere na server dorazi. Konciva to tak, ze filter pak rozpozna jako spam
> ci ham jen to, co ma naucene, a ostatni se mu zda prilis neurcite. Spise
> je ucelne urzovat jakysi reprezentativni vzorek.
Nekrmime to vsim... :)
> - Byva slusnosti ctit trochu soukromi uzivatelu a nesahat jim jen tak na
> postu (byt je ucelem pouze uceni antispamoveho filtru). Lepsi se mi zda
> maily vyssim hodnocenim nejak nenasilne oznacit a pozadat uzivatele, aby v
> pripade, ze tam neni nic tajneho, je poslali na ham na nasedomena.cz.
No ja jim na nu taky nesaham a proto mam nedostatek hamu :) A donutit je
preposilat ham nekam mi prijde jako ukol takrka nadlidsky, pokud se me z 10
lidi podarilo presvedcit tak 3 (a nejsem si tim zcela jist) aby preposilali
aspon spam.
> - Kdyz uz je rec o preposilani mailu, je vhodne uzivatele naucit to
> provadet tak, aby poslali mail presne jak jim prisel, tj. vcetne hlavicek.
> Ty jsou totiz pro rozpoznani spamu znacne dulezite.
No to snad nejak delaji a pokud ne tak se v tom povrtam zas tak tolik toho
neni.
> - Soucasne s ucenim filtru je vhodne si "korpus" naucenych spamu a hamu
> nekde uchovat pro pripad korupce databaze, zmeny strategie uceni, zmeny
> filtrovaciho sw apod.
Pro pripad nemilych problemu se zalohuje cele / ... A ze bych tak moc nemel co
delat, abych menil strategii uceni a preucoval ho, to si nemyslim.
> P.S. Vetsina techto zkusenosti pochazi od Pavla Kankovskeho, aby mi zase
> nemuzel psat a ptat se, jestli to tak opravu je :-))
No tusim ze i me kdysi s timto trochu poradil :)
--
.--------------------------------. .--------------------------. .---------.
| _________ __ _ |===| Tomáš Janoušek |===|o---. o |
||_________| _ |_/| | |===| NOMI team programmer |===||.--+--' |
| | | ___ | '-._.-._ _ | | __| | e-m na il: tomi na nomi.cz | ||| o+---o|
| | |/ _ \| .-. .-. || || |/ /| | web http://tomi.nomi.cz/ | ||| |`--. |
| | | (_) | | | | | || || ( |===| ICQ: #161807083 |===||o-'.--+o|
| |_|\___/|_| |_| |_|___|_|\_\|===| GSM: +420 608 876 277 |===|oo--' o |
`--------------------------------' `--------------------------' `---------'
Další informace o konferenci Linux