Basiswissen SPAM
Um SPAM zu vermeiden, sollte man die auf einer Webseite publzierte Emailadresse nicht als simplen HTML-Email-Link notieren! Ansonsten kann man schon recht bald mit einer Flut von SPAM-Mails rechnen.
|
|
Was ist SPAM + was sind häufige Ursachen für SPAM ?
Lesen sie dazu auch die Ankündigung eines Schutzes, den ich vorbereite
Begriffsherkunft für SPAM (Wikipedia): SPAM ist ursprünglich ein Markenname für Dosenfleisch, bereits 1936 entstanden aus SPiced hAM.
Der Begriff Spam – als Synonym für eine unnötig häufige Verwendung und Wiederholung – entstammt dem Spam-Sketch der englischen Comedyserie Monty Python’s Flying Circus. Im Sketch wird das Wort „Spam“ für das Dosenfleisch insgesamt knapp 100 Mal erwähnt.
Woher haben die eigentlich meine Emailadresse?
- sie haben ihre Emailadresse in Gästebüchern eingetragen
- sie haben sich für kostenlose Software registriert
- ein Spam-Robot hat einfach darauf los probiert
- sie haben eine eigene Domain - also gibts auch info@domainname.de
- ihre Bekannten und Freunde senden Massenmails an BC-Empfänger
- ihre Emailadresse steht ungschützt in HTML-Dokumenten
1 das müssen sie selbst verantworten
|
|
|
2 sie sollten Wegwerf-Adressen benutzen
|
www.trash-mail.com
|
3 dagegen kann man nicht viel machen
|
|
4 das ist abhängig vom Provider änderbar
|
|
|
5 da hilft nur Aufklärung für Anfänger
|
Email schreiben
|
6 meine Vorschläge zum Schutz
|
|
Eine im Web publizierte Emailadresse vor SPAM-Robots schützen
Böse Buben setzen Suchroboter ein, die das WEB nach Emailadressen im Quelltext von HTML-Dokumenten durchsuchen und diese extrahieren. Das sind Software Programme, ähnlich den Spidern von Suchmaschinen, die das Web durchstreifen und alle Adressen sammeln die sie auf Webseiten, in einem Forum oder in Gästebüchern bekommen können.
Sie werden als Bezeichnung dieser Adresssammler auch den Begriff «Adress-Harvester» hören. Um zu vermeiden, dass ihre Mailadresse gefunden und herausgefiltert wird, gibt es mehrere Optionen.
Das geht mit einem Script ganz einfach!
Demo ansehen
Beispiel: Der Wurm SoBig.A, Alias: Win32.Sobig.A@mm, entnimmt Emailadressen aus Dateien mit den Endungen *.txt, *.eml, *.html, *.htm, *.dbx, und *.wab.
Vorgehensweise der Spider
Die Robots suchen nach Hinweisen, die auf das Vorhandensein einer Emailadresse schließen lassen. Das ist in der Regel der Text 'mailto:'. Außerdem wird nach den Zeichen '@', [at], [AT], (at), (AT) und '@' gesucht, sind sie doch eindeutige Hinweise auf E-Mail-Adressen, weil sie Benutzername und Servername trennen ('@' ist der ASCII-Code für @).
a Einfache Spider durchsuchen den Quelltext von Webseiten nach
- dem Vorkommen des Zeichens "@"
- gefolgt von Textzeichen
- gefolgt von einem Punkt
- gefolgt von Text, der einer gültigen Domainkennung entspricht
Dann gehen sie vor dem @-Zeichen so weit zurück bis sie auf ein Leerzeichen oder Anführungszeichen treffen und speichern die ermittelte Zeichenkettenfolge ab. Schwupps, schon wieder eine Email-Adresse im Kasten. Bei der Emailadresse: aaaaaaaaa@bbb.com bedeutet das: Der Spider notiert alles vom ersten a bis zum m .
b Andere suchen den Textstring 'mailto:' und verfahren ähnlich.
c Spider suchen nach '[at] oder (at), das häufig statt des '@' eingesetzt wird.
Möglichkeiten zum Schutz
Einige der auf dieser Seite (und den weiteren Beispielseiten zum Thema) aufgeführten Techniken sind bereits sehr leistungsfähig und bieten einen Basisschutz. Für ganz raffinierte Adressensammler muss auch der Webmaster entsprechend ausgeklügelte Techniken einsetzen.
1 Zur bloßen Anzeige der Emailadresse (Darstellung der Emailadresse):
2 Zur Notierung eines Email-Verweises (Email-Link):
|
HTML-Email-Link und Mailadresse zerhacken
|
Spiderschutz 01/02/03
|
|
HTML-Email-Link mit JavaScript verschlüsseln
|
Spiderschutz 04
|
|
HTML-Email-Link mit Benutzerprüfung (zusätzlich)
|
(demnächst)
|
|
JavaScript-Mailto-Link und Mailadresse zerhacken
|
(demnächst)
|
3 Zur Notierung der Email-Adresse in Formularen:
Demnächst auf meinen Seiten
Wie wärs wenn Text wie
'mailto:', '@' und '@' nicht mehr im Quelltext vorkommen würden?
An einem Script das diese Technik verwendet arbeite ich. Die Idee ist nicht neu, wird zur Zeit aber oft mit Serverunterstützung umgesetzt. Meine Lösung, die in Grundzügen fertig ist, arbeitet mit einem Verschlüsselungssystem für Textzeichen.
Die einfache monoalphabetische Substitution wird durch eine Verschiebechiffre erweitert, die von Zeichen zu Zeichen anders ist. mehr Info bei Wikipedia 
Die zur Verschlüsselung verwendete Zeichenreihe wird dabei durch eine Basisverschiebung und zusätzlich durch zyklisches Verschieben jedes einzelnen Zeichens ermittelt.
Beispiel bei Grundverschiebung 2 und Schrittverschiebung 1:
Die Zeichenkette 'aaaaa' würde als 'cdefg' dargestellt.
Die Emailadresse 'jupp@abc.de' würde als 'lxtu:hjl0oq' dargestellt.
Der Text 'mailto:' könnte dann z.B. als 'odmqzvB' im Quelltext stehen.
Bei der Darstellung der Seite würde ein Script alles wieder zurückrechnen.
Meine Arbeiten gehen voran. Sie können bereits einen Blick auf den aktuellen Stand vom 08.08.2008 werfen!
Zur Testseite MailSpamBlocker Encoder-05.htm
Zurückschlagen
Wie wärs wenn alle Webmaster den Robots zur Abwechslung einmal (unnütze) Arbeit anbieten würden? Wenn es im Web viele Seiten mit je 50 Schrott-Emailadressen gäbe, könnte man die Spam-Roboter mit wenig ertragreicher Emailadressen-Fischerei beschäftigen.
Jeder sollte eine Seite mit pseudo-Emailadressen veröffentlichen,
- die mit Sicherheit ungültig sind
- im Web nicht doppelt vorkommen
weil sie aus entsprechenden Zeichen zufällig zusammen gebaut werden (mit JavaScript).
Ein Script das diese Aufgabe erfüllt ist auch in Vorbereitung. Mein voläufiger Entwurf für die besseren Spam-Robots, die auch JavaScript-zerhackte Mailadressen auswerten können, sieht so aus (Demo öffnet im neuen Browserfenster):
spam-robot-futter.htm

|