sa-learn

Honza Houstek houstek-lists na utf.mff.cuni.cz
Pondělí Prosinec 29 19:59:38 CET 2003


On Mon, 29 Dec 2003, Tomáš Janoušek wrote:

> No ja jim na nu taky nesaham a proto mam nedostatek hamu :) A donutit je
> preposilat ham nekam mi prijde jako ukol takrka nadlidsky, pokud se me z
> 10 lidi podarilo presvedcit tak 3 (a nejsem si tim zcela jist) aby
> preposilali aspon spam.

No pokud tem lidem spam nevadi, tak se na ne vykaslete a nikdo nema
problem. Pokud jim spam vadi, tak by ve vlastnim zajmu spolupracovat meli.

> > - Soucasne s ucenim filtru je vhodne si "korpus" naucenych spamu a hamu
> > nekde uchovat pro pripad korupce databaze, zmeny strategie uceni, zmeny
> > filtrovaciho sw apod.
> Pro pripad nemilych problemu se zalohuje cele / ... A ze bych tak moc
> nemel co delat, abych menil strategii uceni a preucoval ho, to si
> nemyslim.

Neni mi jasne, k cemu je zaloha / v tomto dobra. Nejde ani tak o ty
samotne maily, jako o ten konkretni vyber, kterym jsem filtr zaucil. A s
tim preucovanim - nikdy nerikej nikdy. Jak uz jsem psal, jedna z nemoci
podobnych filtru je to, ze kdyz se "preuci", tak jaksi zkonstnati. Dalsi
uceni nepomaha. Kdyz v takovem pripade mate korpus po ruce, tak ho muzete
zkusit "odtucnit", v opacnem pripade musite zacit od nuly. Jde o to, ze v
tom vyberu naucenych mailu je obsazeno dost prace (tedy pokud tam ty spamy
a hamy nehazite bez premysleni) a jako kazdou praci je vhodne ji mit
uchovanou v co nejpouzitelnejsim formatu. Nicmene zalohovat vas taky nikdo
nenuti ...

-- Honza Houstek


Další informace o konferenci Linux