Emailharvester und unerwünschte Bots mit .htaccess sperren
So gennante
Emailharvester die das Netz nach E-Mail Adressen durchsuchen verursachen nur unnötig Traffic und man sollte sowieso solche Tools aussperren, dies geht am besten mit .htaccess.
Dazu schreibt man einfach nur folgendes in die
.htaccess (Wer nicht weiß wie genau das geht, fragt
hier nach ;))
Bei folgendem Beispiel wird einfach eine Fehlermeldung zurückgegeben wenn eine der Regeln zutrifft, so als würde die Seite gar nicht existieren.
Eine andere Möglichkeit ist es die Bots bewusst zu stören indem man ihnen falsche Mailadressen übergibt und somit dem Spammer die Datenbank zumüllt.
- RewriteEngine On
- RewriteBase /
- RewriteCond %{REMOTE_ADDR} ^64.140.49.6([6-9])$ [OR] # Turnitin spybot
- RewriteCond %{HTTP_USER_AGENT} anarchie [NC,OR] # OD
- RewriteCond %{HTTP_USER_AGENT} Atomz [OR] # rude bot
- RewriteCond %{HTTP_USER_AGENT} cherry.?picker [NC,OR] # spambot
- RewriteCond %{HTTP_USER_AGENT} crescent [NC,OR] # OD
- RewriteCond %{HTTP_USER_AGENT} "^DA d.d+" [OR] # OD
- RewriteCond %{HTTP_USER_AGENT} "DTS Agent" [OR] # OD
- RewriteCond %{HTTP_USER_AGENT} e?mail.?(sweeper|harvest|collect|wolf) [NC,OR] # spambot
- RewriteCond %{HTTP_USER_AGENT} express [NC,OR] # OD
- RewriteCond %{HTTP_USER_AGENT} extractor [NC,OR] # OD
- RewriteCond %{HTTP_USER_AGENT} FlickBot [OR] # rude bot
- RewriteCond %{HTTP_USER_AGENT} FrontPage [OR] # stupid user trying to edit my site
- RewriteCond %{HTTP_USER_AGENT} "efp@gmx.net" [OR] # rude bot
- RewriteCond %{HTTP_USER_AGENT} grabber [NC,OR] # OD
- RewriteCond %{HTTP_USER_AGENT} imagefetch [OR] # rude bot
- RewriteCond %{HTTP_USER_AGENT} httrack [NC,OR] # OD
- RewriteCond %{HTTP_USER_AGENT} "Indy Library" [OR] # spambot
- RewriteCond %{HTTP_USER_AGENT} "^Internet Explore" [OR] # spambot
- RewriteCond %{HTTP_USER_AGENT} ^IE d.d Compatible.*Browser$ [OR] # spambot
- RewriteCond %{HTTP_USER_AGENT} "LINKS ARoMATIZED" [OR] # rude bot
- RewriteCond %{HTTP_USER_AGENT} "Microsoft URL Control" [OR] # spambot
- RewriteCond %{HTTP_USER_AGENT} "mister pix" [NC,OR] # rude bot
- RewriteCond %{HTTP_USER_AGENT} ^NG [OR] # unknown bot
- RewriteCond %{HTTP_USER_AGENT} net.?(ants|mechanic|spider|vampire|zip) [NC,OR] # OD
- RewriteCond %{HTTP_USER_AGENT} nicerspro [NC,OR] # spambot
- RewriteCond %{HTTP_USER_AGENT} ninja [NC,OR] # Download Ninja OD
- RewriteCond %{HTTP_USER_AGENT} NPBot [OR] # NameProtect spybot
- RewriteCond %{HTTP_USER_AGENT} PersonaPilot [OR] # rude bot
- RewriteCond %{HTTP_USER_AGENT} snagger [NC,OR] # OD
- RewriteCond %{HTTP_USER_AGENT} Sqworm [OR] # rude bot
- RewriteCond %{HTTP_USER_AGENT} SurveyBot [OR] # rude bot
- RewriteCond %{HTTP_USER_AGENT} tele(port|soft) [NC,OR] # OD
- RewriteCond %{HTTP_USER_AGENT} TurnitinBot [OR] # Turnitin spybot
- RewriteCond %{HTTP_USER_AGENT} vayala [OR] # dumb bot
- RewriteCond %{HTTP_USER_AGENT} zeus [NC]
- RewriteRule .* /blocked.php [F,L]
Natürlich kann man diese Liste unendlich erweitern und immer wieder aktualisieren, diese ist die, die ich verwende.