<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Joachim Nadolny.de &#187; Bot</title>
	<atom:link href="http://www.joachimnadolny.de/blog/tag/bot/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.joachimnadolny.de</link>
	<description>Private Homepage, Bloggen und mehr...</description>
	<lastBuildDate>Sat, 10 Apr 2010 06:44:26 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	
<xhtml:meta xmlns:xhtml="http://www.w3.org/1999/xhtml" name="robots" content="noindex" />
		<item>
		<title>Bots und Spammer den Zugriff auf die eigene Webseite verweigern.</title>
		<link>http://www.joachimnadolny.de/blog/bots-und-spammer-den-zugriff-auf-die-eigene-webseite-verweigern/</link>
		<comments>http://www.joachimnadolny.de/blog/bots-und-spammer-den-zugriff-auf-die-eigene-webseite-verweigern/#comments</comments>
		<pubDate>Mon, 26 Oct 2009 13:01:21 +0000</pubDate>
		<dc:creator>Joachim Nadolny</dc:creator>
				<category><![CDATA[Tipps & Tricks]]></category>
		<category><![CDATA[.htaccess]]></category>
		<category><![CDATA[Bot]]></category>
		<category><![CDATA[mod_rewrite]]></category>
		<category><![CDATA[User-Agent]]></category>

		<guid isPermaLink="false">http://www.joachimnadolny.de/?p=1937</guid>
		<description><![CDATA[Da ich schon seit Wochen von einem ganz fiesen Bot geplagt werde, habe ich mich dazu entschlossen, diesen Kamerad von meiner Homepage zu verbannen. Dazu manipuliere ich die .htaccess-Datei indem ich einen Code einsetze, der es mir ermöglicht, einzelne IP´s  und User-Agents zu sperren. Wie das funktioniert möchte ich dir gerne erklären. Wichtig: Das Apache [...]]]></description>
			<content:encoded><![CDATA[<p style="text-align: justify;"><a href="http://www.joachimnadolny.de/blog/bots-und-spammer-den-zugriff-auf-die-eigene-webseite-verweigern/"><img class="alignleft" title="Tipps &amp; Tricks" src="http://www.joachimnadolny.de/uploads/images/tipps-und-tricks.jpg" alt="" width="167" height="175" /></a>Da ich schon seit Wochen von einem ganz <a title="Fieser Bot" href="http://www.joachimnadolny.de/blog/bot-verursacht-haufenweise-404-fehlerseiten-auf-meiner-webseite/">fiesen Bot</a> geplagt werde, habe ich mich dazu entschlossen, diesen Kamerad von meiner Homepage zu verbannen. Dazu manipuliere ich die .<strong>htaccess-Datei</strong> indem ich einen Code einsetze, der es mir ermöglicht, einzelne IP´s  und User-Agents zu sperren. Wie das funktioniert möchte ich dir gerne erklären.</p>
<p style="text-align: justify;"><strong>Wichtig:</strong> Das Apache Modul &#8220;<strong>mod_rewrite</strong>&#8221; muss auf deinem Server aktiviert sein!</p>
<p style="text-align: justify;">Als erstes benötigst du die .htaccess-Datei, die du auf deinem<span id="more-1937"></span> Root-Verzeichnis finden kannst. Jetzt kopierst du diese Datei per FTP auf den PC rüber und öffnest sie mit dem Texteditor. Anschließend schreibst du in die .htaccess-Datei den Code und kopierst diese wieder zurück auf den Webserver.</p>
<p style="text-align: justify;"><br class="clear" /></p>
<p><strong>Einzelne IP und Domain Sperren:</strong></p>
<p class="alt2" style="border: 1px inset ; margin: 0px; padding: 10px; overflow: auto; text-align: left;" dir="ltr"><code>order deny,allow</code><br />
<code>deny from 62.178.217.28</code><br />
<code>deny from .chello.at</code>
</p>
<p style="text-align: justify;">Hier wird der Zugriff auf den Homepage-Bereich für die IP-Adresse 62.178.217.28 und für jeden Host, der auf .chello.at endet, verboten.</p>
<p style="text-align: justify;"><br class="clear" /></p>
<p><strong>Alle sperren und nur bestimmten IP´s den Zugriff erlauben:</strong></p>
<p class="alt2" style="border: 1px inset ; margin: 0px; padding: 10px; overflow: auto; text-align: left;" dir="ltr"><code>order deny,allow</code><br />
<code>deny from all</code><br />
<code>allow from 89.58</code>
</p>
<p style="text-align: justify;">In diesem Beispiel, wird der Zugriff auf den Bereich der Webseite ausschließlich nur den IP-Adressen erlaubt, die mit 89.58 anfangen. Der Rest ist ausgesperrt.</p>
<p style="text-align: justify;"><br class="clear" /></p>
<p><strong>Client (User-Agent) Sperre:</strong></p>
<p><strong>Bot sperren</strong><strong><br />
</strong></p>
<p class="alt2" style="border: 1px inset ; margin: 0px; padding: 10px; overflow: auto; text-align: left;" dir="ltr"><code>RewriteEngine on</code><br />
<code># betaBot den Zugriff verweigern</code><br />
<code>RewriteCond %{HTTP_USER_AGENT} ^betaBot</code><br />
<span style="color: #808080;"><code>RewriteRule /* http://www.chello.at/ [L,R]</code></span>
</p>
<p style="text-align: justify;">In diesem Fall sperre ich den “betaBot” aus. Sollte dieser Bot auf meine Webseite zugreifen, so wird ihm das verwehrt und er wird (jetzt kommt das geilste) auf seine eigene Webseite umgeleitet.</p>
<p style="text-align: justify;"><span style="color: #808080;">Mit dem Befehl „<em>RewriteRule /* http://www.chello.at/ [L,R]</em>“ leitest du Bots, auf die diese Regel zutrifft, auf eine X-beliebige Webseite um. In diesem Fall ist das <a href="http://www.chello.at/">www.chello.at</a>.</span></p>
<p style="text-align: justify;"><br class="clear" /></p>
<p style="text-align: justify;"><strong>Betriebssystem sperren</strong><br class="clear" /></p>
<p class="alt2" style="border: 1px inset ; margin: 0px; padding: 10px; overflow: auto; text-align: left;" dir="ltr"><code>RewriteEngine on</code><br />
<code># Windows User-Agent den Zugriff verweigern</code><br />
<code>RewriteCond %{HTTP_USER_AGENT} ^Windows.*</code><br />
<span style="color: #808080;"><code>RewriteRule ^.* - [F]</code></span>
</p>
<p style="text-align: justify;">Mit dieser Client-Sperre wird der Seitenzugriff jedem untersagt, der über einen Windows-Computer die Homepage aufrufen möchte. <span style="color: #808080;">Mit dem Befehl: „<em>RewriteRule ^.* - [F]</em>“ wird der Besucher nicht auf eine andere Webseite umgeleitet, sondern bekommt eine ganz normale Fehlerseite angezeigt.</span></p>
<p style="text-align: justify;"><br class="clear" /></p>
<p style="text-align: justify;"><strong>Verschiedene User-Agents sperren</strong><br class="clear" /></p>
<p class="alt2" style="border: 1px inset ; margin: 0px; padding: 10px; overflow: auto; text-align: left;" dir="ltr"><code>RewriteEngine on</code><br />
<code># Mehrere Spambots nach User-Agent aussperren</code><br />
<code>RewriteCond %{HTTP_USER_AGENT} ^.*Bot1 [OR] </code><br />
<code>RewriteCond %{HTTP_USER_AGENT} ^.*Bot2 [OR] </code><br />
<code>RewriteCond %{HTTP_USER_AGENT} ^.*Bot3 [OR] </code><br />
<code>RewriteCond %{HTTP_USER_AGENT} ^.*Bot4 </code><br />
<span style="color: #000000;"><code>RewriteRule ^.* - [F]</code></span>
</p>
<p style="text-align: justify;">Hier werden mehrere User-Agents gesperrt. <span style="color: #888888;"> </span></p>
<p style="text-align: justify;"><br class="clear" /></p>
]]></content:encoded>
			<wfw:commentRss>http://www.joachimnadolny.de/blog/bots-und-spammer-den-zugriff-auf-die-eigene-webseite-verweigern/feed/</wfw:commentRss>
		<slash:comments>8</slash:comments>
		</item>
		<item>
		<title>Bot verursacht &#8220;Fehler 404 not found&#8221; Seiten auf meiner Webseite</title>
		<link>http://www.joachimnadolny.de/blog/bot-verursacht-haufenweise-404-fehlerseiten-auf-meiner-webseite/</link>
		<comments>http://www.joachimnadolny.de/blog/bot-verursacht-haufenweise-404-fehlerseiten-auf-meiner-webseite/#comments</comments>
		<pubDate>Wed, 21 Oct 2009 12:21:33 +0000</pubDate>
		<dc:creator>Joachim Nadolny</dc:creator>
				<category><![CDATA[Intern]]></category>
		<category><![CDATA[Bot]]></category>
		<category><![CDATA[Crawler]]></category>
		<category><![CDATA[Robot]]></category>
		<category><![CDATA[Spider]]></category>

		<guid isPermaLink="false">http://www.joachimnadolny.de/?p=1745</guid>
		<description><![CDATA[Jeder Webseiten Besitzer wird täglich von bekannten, aber auch unbekannten Crawler besucht. Crawler bzw. Webcrawler (auch Robot oder Spider genannt) sind Programme, die im Auftrag einer Suchmaschine eigenständig das Internet auf Inhalte von Webseiten durchsuchen und analysieren. Jetzt besucht mich seit Wochen ein unbekannter Bot, der sich auf meinem Blog anscheinend Pudelwohl fühlt und meine [...]]]></description>
			<content:encoded><![CDATA[<p style="text-align: justify;"><img class="alignleft" title="Frage, Antwort, Diskussion" src="http://www.joachimnadolny.de/uploads/images/frage-antwort.jpg" alt="" width="110" height="110" />Jeder Webseiten Besitzer wird täglich von bekannten, aber auch unbekannten Crawler besucht. Crawler bzw. Webcrawler (auch Robot oder Spider genannt) sind Programme, die im Auftrag einer Suchmaschine eigenständig das Internet auf Inhalte von Webseiten durchsuchen und analysieren.<span id="more-1745"></span></p>
<p style="text-align: justify;">Jetzt besucht mich seit Wochen ein unbekannter Bot, der sich auf meinem Blog anscheinend Pudelwohl fühlt und meine Webseite deshalb mehrmals am Tag für 30-45 Minuten durchsucht. Wenn das der GoogleBot wäre, würde ich mich ja freuen.  Leider durchsucht der Kamerad mit der Kennung: &#8220;<strong>chello062178217028.11.15.vie.surfer.at</strong>&#8221; alle möglichen und unmöglich Seiten meines Blogs und vor allem Seiten, die es gar nicht gibt. Er generiert zu jeder URL immer &#8220;/blank&#8221; am Ende dazu und erzeugt somit einen 404 Fehler. Beispiel: &#8220;www.joachimnadolny.de<strong>/blank</strong>&#8220;</p>
<p style="text-align: justify;"><img title="404 Fehlerseiten" src="http://www.joachimnadolny.de/uploads/bot-verursacht-fehler-404-not-found-seiten-auf-meiner-webseite/bot-verursacht-404-fehler.jpg" alt="" /></p>
<p style="text-align: justify;">Ich habe mir vor einiger Zeit das Plugin: <a title="404 Fehlerseiten Logger" href="http://www.joehoyle.co.uk/jh-404-logger/">JH 404-Logger</a> installiert und sehe somit jede generierte &#8220;404 not found&#8221; Fehlerseite auf meinem Blog. Da die Liste der erzeugten Fehler langsam enorme Ausmaße annimmt, will ich nun etwas gegen diesen Bot und allen zukünftigen 404 Erzeuger unternehmen. Deshalb habe ich ein paar Fragen an die Spezialisten unter euch und hoffe, dass ihr mir diese beantworten könnt.</p>
<p style="text-align: justify;">1. Kennt jemand diesen Bot und hat Informationen darüber, was dieser Knabe überhaupt indexiert?</p>
<p style="text-align: justify;">2. Wie kann ich mich gegen solche Crawler schützen? Ich habe im Hinterkopf, dass ich mit der .htaccess etwas spielen kann um so bestimmten Bots den Zugriff zu verweigern. Aber wie funktioniert das eigentlich genau? (Mittlerweile habe ich herausgefunden wie man das bewerkstelligen kann. Lese dazu <a title="Bots sperren" href="http://www.joachimnadolny.de/blog/bots-und-spammer-den-zugriff-auf-die-eigene-webseite-verweigern/">diesen Artikel</a>)</p>
<p style="text-align: justify;">3. Ist es für den Traffic ein Problem, wenn Bots 404 Fehlerseiten generieren? Bei diesem Bot könnte man meinen, er sei nur dafür Programmiert worden, 404´er Seiten zu erzeugen. Denn das macht er ziemlich gut!</p>
<p style="text-align: justify;"><br class="clear" /></p>
<p style="text-align: justify;"><strong>24. Oktober 2009, 12:43 Uhr Nachtrag: </strong></p>
<p style="text-align: justify;">Anhand der IP konnte ich die Firma ausfindig machen, die evl. hinter diesem Bot steckt und mir demnach die 1. gestellte Frage selber beantworten können. Mein 2. bester Freund ist ein Österreicher! Er kommt nämlich genau von:</p>
<p style="text-align: justify;"><strong>Hostmaster Chello Broadband<br />
UPC Broadband<br />
Internet Services<br />
Erlachgasse 116<br />
A-1100 Vienna<br />
Austria</strong></p>
<p style="text-align: justify;"><strong>E-Mail: hostmaster@chello.at, oder abuse@chello.at<br />
</strong>
</p>
<p style="text-align: justify;">Die Adresse deckt sich 100% mit der Kennung des Spiders (Zur Erinnerung: chello062178217028.11.15.vie.surfer.at). Dank meiner <a title="Whois-Abfrage" href="http://www.ripe.net">Whois -Abfrage</a>, konnte ich diese Firma ausfindig machen. Ich habe UPC direkt angeschrieben und sie um eine Stellungnahme gebeten. Mir wurde es heute nämlich zu Bunt, da ich gesehen habe, dass dieser Robot über Nacht wieder 207 Stück 404-Fehlerseiten generiert hat.</p>
<p style="text-align: justify;"><br class="clear" /></p>
<p style="text-align: justify;"><strong>24. Oktober 2009, 17:22 Uhr Nachtrag: </strong></p>
<p style="text-align: justify;">Mittlerweile konnte ich noch mehr Informationen über diesen Bot heraus finden. Ich habe heute die kompletten Log-Files meins Webhostes ausgelesen. Dabei konnte ich interessante Details heraus finden. Und zwar nennt sich dieser Spider &#8220;<strong>betaBot</strong>&#8220;. Diesen Namen benutzt er auch als User-Agent! Ich habe den Eindruck, er mag am liebsten meine Tags durchsuchen. Jedenfalls erzeugt er bei allen meinen Tags einen &#8220;404 file not fount&#8221; Fehler.</p>
<p style="text-align: justify;">In wie weit dieser betaBot mit der Oben angesprochenen Firma aus Österreich zusammen hängt, kann ich noch nicht sagen. Ich muss jetzt erst einmal die Antwort von einem Verantwortlichen dieser Firma abwarten. Sobald ich näheres heraus finden konnte, werde ich sofort darüber berichten.</p>
<p style="text-align: justify;"><strong>Hier ein Auzug meiner Orginial Log-File:</strong></p>
<p style="text-align: justify;"><a href="http://www.joachimnadolny.de/uploads/bot-verursacht-fehler-404-not-found-seiten-auf-meiner-webseite/logfile-analyse.jpg"><img class="alignnone" title="Logfile" src="http://www.joachimnadolny.de/uploads/bot-verursacht-fehler-404-not-found-seiten-auf-meiner-webseite/logfile-analyse.jpg" alt="" width="715" height="90" /></a></p>
<p style="text-align: justify;"><br class="clear" /></p>
<p style="text-align: justify;"><strong>31. Oktober 2009 10:43 Uhr Nachtrag:</strong></p>
<p style="text-align: justify;"><span id="dpfsent_1" onclick="spellCheckers0.showSentLenMenu(this.id);">Eine Woche ist vergangen, seit ich die E-Mail verschickt habe und wie erwartet, hat sich <span id="dpforth0_unknown_1_0" lang="Cello" onclick="spellCheckers0.showOrthMenu(this.id);">­Chello</span> <span id="dpforth0_unknown_1_1" onclick="spellCheckers0.showOrthMenu(this.id);">­Broadband</span> nicht dazu geäußert. </span><span id="dpfsent_2" onclick="spellCheckers0.showSentLenMenu(this.id);">Das ist natürlich sehr ärgerlich. Mittlerweile konnte ich diesen aggressiven <span id="dpforth0_45_2_0" lang="Betabot" onclick="spellCheckers0.showOrthMenu(this.id);">­betaBot</span> per &#8220;<a title="Bots den Zugriff verweigern" href="http://www.joachimnadolny.de/blog/bots-und-spammer-den-zugriff-auf-die-eigene-webseite-verweigern/">.</a></span><span id="dpfsent_3" onclick="spellCheckers0.showSentLenMenu(this.id);"><a title="Bots den Zugriff verweigern" href="http://www.joachimnadolny.de/blog/bots-und-spammer-den-zugriff-auf-die-eigene-webseite-verweigern/"><span id="dpforth0_unknown_3_0" onclick="spellCheckers0.showOrthMenu(this.id);">­htaccess</span></a>&#8221; von meiner Webseite aussperren. </span><span id="dpfsent_4" onclick="spellCheckers0.showSentLenMenu(this.id);">Jetzt gibt es noch einen 2. Bot auf meiner Website, der auch <span id="dpforth0_sdt_4_0" onclick="spellCheckers0.showOrthMenu(this.id);">­404ér</span> Fehler erzeugt. </span><span id="dpfsent_5" onclick="spellCheckers0.showSentLenMenu(this.id);">Anders, wie <span id="dpforth0_45_5_0" lang="Betabot" onclick="spellCheckers0.showOrthMenu(this.id);">­betaBot</span>, generiert dieser Heino Fehlerseiten <span id="dpforth0_unknown_5_1" onclick="spellCheckers0.showOrthMenu(this.id);">­á</span> la: </span><span id="dpfsent_6" onclick="spellCheckers0.showSentLenMenu(this.id);">www.joachimnadolny.de<span id="dpfgram0_611de_6_0" lang="&quot; /" onclick="spellCheckers0.showGramMenu(this.id);">&#8220;/</span>\&#8221;. </span><span id="dpfsent_7" onclick="spellCheckers0.showSentLenMenu(this.id);">Zum Glück halten sich die so generierten Fehlerseiten in Grenzen (max. 10 Stück / Tag), aber nervig ist es dennoch.</span></p>
<p style="text-align: justify;"><br class="clear" /></p>
]]></content:encoded>
			<wfw:commentRss>http://www.joachimnadolny.de/blog/bot-verursacht-haufenweise-404-fehlerseiten-auf-meiner-webseite/feed/</wfw:commentRss>
		<slash:comments>13</slash:comments>
		</item>
		<item>
		<title>1. Spammer auf meiner Webseite -Herzlichen Glückwunsch!</title>
		<link>http://www.joachimnadolny.de/blog/1-spammer-auf-meiner-webseite/</link>
		<comments>http://www.joachimnadolny.de/blog/1-spammer-auf-meiner-webseite/#comments</comments>
		<pubDate>Mon, 12 Oct 2009 00:00:37 +0000</pubDate>
		<dc:creator>Joachim Nadolny</dc:creator>
				<category><![CDATA[Intern]]></category>
		<category><![CDATA[Backlink]]></category>
		<category><![CDATA[Bot]]></category>
		<category><![CDATA[Spam]]></category>
		<category><![CDATA[Spamfilter]]></category>
		<category><![CDATA[Spammer]]></category>

		<guid isPermaLink="false">http://www.joachimnadolny.de/?p=1293</guid>
		<description><![CDATA[Servus Paul Y., du bist der erste Spammer auf meinem neuen Blogg, der gerade einmal 1 Woche und ein paar zerquetschte Tage im Netz steht. Nein, du bekommst keine 100.000 Euro als Geschenk. Wohl eher eine auf die Rübe! Dabei hatte ich mich heute erst mit Andreas genau über dieses Thema unterhalten, bzw. darüber geschrieben. [...]]]></description>
			<content:encoded><![CDATA[<p style="text-align: justify;"><img class="alignleft" title="Frage, Antwort, Diskussion" src="http://www.joachimnadolny.de/uploads/images/frage-antwort.jpg" alt="" width="110" height="110" />Servus Paul Y.,</p>
<p style="text-align: justify;">du bist der <strong>erste Spammer auf meinem neuen Blogg</strong>, der gerade einmal 1 Woche und ein paar zerquetschte Tage im Netz steht. Nein, du bekommst keine 100.000 Euro als Geschenk. Wohl eher eine auf die Rübe!</p>
<p style="text-align: justify;">Dabei hatte ich mich heute erst mit <a title="majeres.de" href="http://www.majeres.de">Andreas</a> genau über dieses Thema unterhalten, bzw. darüber geschrieben. Es ging darum, dass Crazy Girl die Nase voll hat von den Spamm-Bots und den meisten Webseiten Besitzern, die ihre URL wild in Kommentare schreiben nur um einen Backlink zu bekommen. Um diesem Treiben ein Ende zu<span id="more-1293"></span> setzen,  hat sie einen saftigen Artikel geschrieben, der den meisten Spammern wohl übel Aufstoßen wird. Daraufhin hat Andreas einige Änderungen an seiner Kommentarfunktion vorgenommen, um  Spammern schon im Voraus die Lust am schreiben zu nehmen. Andreas bemängelte zudem, dass viele dieser &#8220;Backlinkfreaks&#8221; (so nenne ich diese jetzt einmal),  noch nicht einmal seine Artikel durch lesen und auch nur ein paar Wörter in den Kommentar schreiben. Hauptsache der Backlink ist gesetzt. Für mich war das Thema Spamm noch nicht interessant, da mein Blogg noch sehr jung ist und ich erst vor wenigen Tagen von Google erfasst wurde.</p>
<p style="text-align: center;"><a href="http://www.joachimnadolny.de/uploads/1-spammer-auf meiner-webseite-herzlichen-glueckwunsch/spamer.jpg"><img class="aligncenter" title="Kommentarspam" src="http://www.joachimnadolny.de/uploads/1-spammer-auf meiner-webseite-herzlichen-glueckwunsch/spamer.jpg" alt="" width="721" height="88" /></a></p>
<p style="text-align: justify;">Wer kann schon wissen, dass es meine Webseite überhaupt gibt. Darum schmunzelte ich wohl ein wenig über die Aktion von Andreas und Crazy Girl. Das ist noch keine 14 Stunden her, da landet tatsächlich der erste Kandidat auf meinem Blogg! Alter Schwede, ich glaub ich spinne. Hätte ich euch beide nur von Anfang an Ernst genommen. Gut, die Welt geht jetzt nicht unter, wegen diesem einen Spammer, der mir einfach nur auf die Nerven gehen wollte. Wenn meine Seite in ein paar Monaten langsam bekannt geworden ist, was kann mich dann hier erwarten? Gut, bis dahin ist noch Zeit. Ich werde mir wohl oder übel einen Spamfilter installieren müssen.</p>
<p style="text-align: justify;">Was ist denn das beste Anti-Spam Plugin für WordPress? Kennt sich jemand damit aus und kann mir Tipps geben? Ich meine, ich hätte schon einmal etwas Positives von <a title="Akismet" href="http://akismet.com/">Akismet</a> gelesen. Taugt das was?</p>
<p><br class="clear" /></p>
]]></content:encoded>
			<wfw:commentRss>http://www.joachimnadolny.de/blog/1-spammer-auf-meiner-webseite/feed/</wfw:commentRss>
		<slash:comments>12</slash:comments>
		</item>
	</channel>
</rss>
