<!doctype html public "-//w3c//dtd html 4.0 transitional//en">
<html>
A friend of mine, looking at the "evidence"&nbsp;header in one of my mail
messages, asked a "simple" question:&nbsp; what about the idea of hand-tuning
the database?
<p>I&nbsp;shouldn't be criticizing, as SpamBayes has been doing a very
good job so far (on just the initial training, it's had no misclassified
ham, only two spam rated as ham, and only a dozen messages rated as unsure
all of which were spam), but I thought I'd ask anyway.&nbsp; ;-)
<p>The evidence header has entries like "'received:ztxmail01.ztx.compaq.com':
0.62".&nbsp; (I told it to mine the headers.)&nbsp; Now, I&nbsp;believe
that ztxmail01.ztx.compaq.com handles all my mail.&nbsp; (OK, it doesn't
hand *all*&nbsp;of my mail -- it's got a couple of brothers and a dozen
cousins who share in the load, but you get the point.)&nbsp; So, the presence
of this token in my mail message is not indicative of anything (other than
the fact that the thing being looked at is a "mail message"! ;-).
<p>What do you guys think of the idea of being able to mark certain terms
in the database as being "not interesting"?&nbsp; (Of course, we would
need a tool or tool-set to be able to do this, but....)
<p>The reason I&nbsp;ask is that, if the classifier is only going to consider
100 terms, I'd like it to be considering good ones, as opposed to things
that are in every mail message that I&nbsp;get, spam and ham alike.
<br>&nbsp;
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Thanks,
<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
Webb
<br>&nbsp;
<pre>--&nbsp;
------------------------------------------------------------------------
Webb Scales&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Hewlett-Packard Company
scales@zko.dec.com&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 110 Spit Brook Rd, ZKO2-3/N30
Voice: 603.884.2196, FAX: 603.884.0120&nbsp;&nbsp;&nbsp;&nbsp; Nashua, NH 03062-2711
Someone who thinks logically provides a nice contrast to the real world.
------------------------------------------------------------------------</pre>
&nbsp;</html>