Die Nachteile der Bayesian Spam-Filter

June 11

Die Nachteile der Bayesian Spam-Filter

Kommt Sie mit Email Spam, lästige Werbung unaufgefordert an Ihren Posteingang gesendet. Frühe Spam filtert gebaut auf Regeln, wie "Filter Emails, die die Wörter 'Klick' enthalten." Aber für jede Regel, die geschrieben werden konnte, fand einige clevere Spammer eine Weise um sie. Beispielsweise könnten Spammer absichtlich Wörter wie 'c1ick' zu schreiben anstatt 'Klick', wodurch der Filterregel nutzlos falsch schreiben. Der Zusatz von Bayes-Filterung, erlaubt jedoch Anti-Spam-Programme zur Anpassung an die veränderten Merkmale von Spam.

Bayes-Filterung verwendet Wahrscheinlichkeit

Bayesian Spam-Filterung wird ein Wahrscheinlichkeit Ansatz. Er katalogisiert, Wörter und andere vordefinierte Merkmale von Spam und nicht-Spam e-Mail vom Benutzer empfangen. Wenn eine neue e-Mail eintrifft, scannt der Filter auf diese Worte und Merkmale. Spam-je mehr Wörter, die, denen das neue Email gemein Wörter in früheren gefunden hat, desto wahrscheinlicher wird das neue Email als Spam markiert werden, durch den Bayes-Filter.

Bayes-Filter lernen und anpassen

Der Bayes'schen Ansatz ermöglicht den Filter zu "Lernen" als die Merkmale von Spam ändern. Anfangs könnte es Spam, die falsch geschriebenen "c1ick," zum Beispiel hat nicht verpassen. Aber wie der Benutzer die e-Mail als Spam markiert, der Filter beginnt eine höhere Wahrscheinlichkeit, dass andere Emails mit diesem Wort Spam sind zuweisen.

Ausbildung erforderlich

Bayes-Filterung ist sehr wirksam, aber ein Nachteil ist, dass der Filter "ausgebildet werden." Zunächst die Datenbank-e-Mails ist klein, und der Benutzer muss weiterhin eingehende Mail als "Spam" markieren, um "den Filter zu trainieren". Benutzer, die ein geringes Volumen der e-Mail erhalten müssen länger warten, um eine geeignete Datenbank einzurichten.

Bayes-Vergiftung

Ein weiterer Nachteil ist, dass weiterhin, dass Spammer suchen nach neuen wegen zu "vergiften" oder Kennzeichnung als gültige Email Spam Filter zu verleiten. Beispielsweise könnten Spammer einen Block mit normaler Text aus einem Buch oder einer Webseite in einem Versuch, haben einen hohen Anteil an "guten" Worte in der e-Mail enthalten. Glücklicherweise kann dies in Wirksamkeit beschränkt werden, da der Bayes-Filter "gute e-Mail" unterschiedlich je nach Datenbank, die es jedes einzelnen Benutzers e-Mail baut definiert.