Reguläre Ausdrücke zur Spambekämpfung in Serendipity

Serendipity erlaubt es in der Konfiguration der “Anti-Spam-Maßnahmen” entsprechende URLs, Namen, E-Mails oder Textbeiträge als Spam zu kennzeichnen und entsprechend zu behandeln (auf Moderation schalten, automatisch löschen).

Vorteilhaft dabei ist es auch “Reguläre Ausdrücke” einsetzen zu können. Wikipedia erklärt diesen Begriff wieder einmal.. Kurz gesagt kann ich für Wortteile Variablen einsetzen und somit eine Vielzahl von ähnlichen Wörtern mit einem regulären Ausdruck abdecken.

Einfaches Beispiel: Ich hatte Trackbackspams die als Namen mal “ma286en”, mal “ma483en”, mal “ma3234en” eintrugen (es waren sogar noch mehr). Gemeinsam ist all diesen Namen, dass sie mit “ma” beginnen, eine Zahlenfolge beinhalten und danach mit “en” enden. Jedes mal den neuen Namen zu sperren hätte nichts gebracht, da immer neue Kombinationen auftauchten und ich nur hinterher “gehinkt” wäre.

Hier kommen nun die regulären Ausdrücke ins Spiel. Als Variable für eine oder mehrere Zahlen verwendet man z.B. “[0-9]+”. Gibt man nun “ma[0-9]+en” ein erwischt man alle der oben genannten Variationen. Natürlich gibt es noch viel komplexere Möglichkeiten.

Warum ich überhaupt darüber schreibe ist, dass mir selbst diese regulären Ausdrücke nicht so geläufig sind. Daher war ich erfreut, bei Frank Helmschrott einen Hinweis auf “Reggy“ zu finden. Dieses kostenlose Programm für MacOS erlaubt das Austesten von regulären Ausdrücken anhand von eigenen Beispielstexten. Somit kann man ausprobieren, ob eine bestimmte Kombination auch wirklich all das findet was man meint.

Ein kleines, feines Programm, dass mir ab nun immer wieder hilfreich zu Seite stehen wird um Spams (hoffentlich) noch erfolgreicher abwehren zu können.

1 Trackback

Trackback-URL für diesen Eintrag

Nur ein Blog am 25.11.2009: Spamabwehr auf meinem Blog

Mit Spams ist nicht zu spassen. Über Trackbacks und per Kommentar kommen täglich hundert und mehr nervige Nachrichten, die es gilt abzufangen. Nachfolgend ein paar Zeilen zu meiner jetzigen Strategie. Captchas Zuerst, was es auf meinem Blog nicht gib

Kommentare

Noch keine Kommentare

Kommentar schreiben

Twitter, Gravatar, Pavatar, Favatar, Identica Autoren-Bilder werden unterstützt.
Die angegebene E-Mail-Adresse wird nicht dargestellt, sondern nur für eventuelle Benachrichtigungen verwendet.
Textile-Formatierung erlaubt

   

tweetbackcheck