Bayesscher Spam-Filter
Mit einem Bayesschen Spam-Filter erfolgt die Erkennung von Nachrichten, die Spam sein könnten, anhand der Bayesschen Logik. Die Bayessche Logik ist eine Erweiterung der Arbeit des englischen Mathematikers Thomas Bayes aus dem 18. Jahrhundert.
Bayessche Spam-Filter sind nicht perfekt, aber da Spam typischerweise bestimmte Textarten enthält, kann ein solches Programm erstaunlich effektiv sein, wenn es über einen gewissen Zeitraum fein abgestimmt wird. Bei einem Bayes-Filter werden E-Mails anhand einer Wahrscheinlichkeitszahl (von 0 oder 0 Prozent bis 1 oder 100 Prozent) in Gruppen wie „vertrauenswürdig“ und „verdächtig“ eingeteilt. Die Kategorien werden je nach Benutzerpräferenz definiert.
Spammer versuchen ständig, neue Wege zu finden, um Spam-Filter zu umgehen. Bestimmte Wörter, die gemeinhin als charakteristisch für Spam erkannt werden, können durch das Einfügen von Symbolen wie Punkten oder durch die Verwendung von nicht standardmäßigen, aber lesbaren Zeichen wie Â, Ç, Ë oder Í verändert werden. Wenn der Benutzer einen Bayesschen Spam-Filter jedoch anweist, bestimmte Nachrichten unter Quarantäne zu stellen oder zu löschen, bezieht der Filter diese Daten in seine zukünftigen Aktionen ein. Auf diese Weise wird ein Bayesscher Spam-Filter mit der Zeit immer besser, so dass es wahrscheinlicher wird, dass er Spam blockiert, ohne auch erwünschte Nachrichten zu blockieren.