sa-learn

Tomáš Janoušek tomi na nomi.cz
Pondělí Prosinec 29 13:21:53 CET 2003


Zdravim,

> - Kdyz uz chci bez premysleni cpat maily uzivatelu do SA, tak me prece
> nezastavi to, ze mi je uzivatele ze serveru smazou! Muzu si prece nekde
> ukladat kopie.
Ja je tam necpu bez premysleni ale prochazim to.

> - Neni uplne nejlepsi bayesovsky filtr krmit uplne vsemi spamy a hamy,
> ktere na server dorazi. Konciva to tak, ze filter pak rozpozna jako spam
> ci ham jen to, co ma naucene, a ostatni se mu zda prilis neurcite. Spise
> je ucelne urzovat jakysi reprezentativni vzorek.
Nekrmime to vsim... :)

> - Byva slusnosti ctit trochu soukromi uzivatelu a nesahat jim jen tak na
> postu (byt je ucelem pouze uceni antispamoveho filtru). Lepsi se mi zda
> maily vyssim hodnocenim nejak nenasilne oznacit a pozadat uzivatele, aby v
> pripade, ze tam neni nic tajneho, je poslali na ham na nasedomena.cz.
No ja jim na nu taky nesaham a proto mam nedostatek hamu :) A donutit je
preposilat ham nekam mi prijde jako ukol takrka nadlidsky, pokud se me z 10
lidi podarilo presvedcit tak 3 (a nejsem si tim zcela jist) aby preposilali
aspon spam.

> - Kdyz uz je rec o preposilani mailu, je vhodne uzivatele naucit to
> provadet tak, aby poslali mail presne jak jim prisel, tj. vcetne hlavicek.
> Ty jsou totiz pro rozpoznani spamu znacne dulezite.
No to snad nejak delaji a pokud ne tak se v tom povrtam zas tak tolik toho
neni.

> - Soucasne s ucenim filtru je vhodne si "korpus" naucenych spamu a hamu
> nekde uchovat pro pripad korupce databaze, zmeny strategie uceni, zmeny
> filtrovaciho sw apod.
Pro pripad nemilych problemu se zalohuje cele / ... A ze bych tak moc nemel co
delat, abych menil strategii uceni a preucoval ho, to si nemyslim.

> P.S. Vetsina techto zkusenosti pochazi od Pavla Kankovskeho, aby mi zase
> nemuzel psat a ptat se, jestli to tak opravu je :-))
No tusim ze i me kdysi s timto trochu poradil :)

-- 
.--------------------------------.   .--------------------------.   .---------.
| _________              __ _    |===|      Tomáš Janoušek      |===|o---.  o |
||_________|  _         |_/| |   |===| NOMI team     programmer |===||.--+--' |
|    | | ___ | '-._.-._  _ | | __|   | e-m na il:    tomi na nomi.cz  |   ||| o+---o|
|    | |/ _ \| .-. .-. || || |/ /|   | web http://tomi.nomi.cz/ |   ||| |`--. |
|    | | (_) | | | | | || ||   ( |===| ICQ:        #161807083   |===||o-'.--+o|
|    |_|\___/|_| |_| |_|___|_|\_\|===| GSM:    +420 608 876 277 |===|oo--'  o |
`--------------------------------'   `--------------------------'   `---------'


Další informace o konferenci Linux