お行儀の悪い検索エンジンロボット

ども。
寒さに耐え切れず、ついに自宅でストーブを使い始めた担当ちゅんです。

突然ですが、最近、八雲町ウェブサイトが妙に重い(遅い)と感じておりませんか?
町民の方からも「最近はちょっと画面が出るまでに一呼吸置くよね」とのご指摘があったところです。

サイトを管理する立場からしますと、サイトの快適さ=Webパフォーマンスには細心の注意を払う必要があると思っていますし、事実、とある調査によると、サイトの表示時間が2秒遅くなるとその企業の収益は4.3%減少するなんてデータもあるようなのです。

ということで、早速サーバーの維持管理をお願いしている委託先へ連絡し調査してもらいました。すると、表示が遅かった原因はあっさり判明。何事も無かったかのようにスパッとトップページが表示されるようになりました。

原因は、どうやら複数の「お行儀の悪い」検索エンジンのロボット(Bot)がコンテンツを根掘り葉掘り引っ掻き回してたようで。やれやれです。委託先いわく「試しに一度アクセスを遮断してみたら、その後は来なくなっちゃいました」とのことですが、驚くのは「サーバーの負荷が80%もダウンした」と言うのです。ほぼ毎秒に近い頻度でアクセスされたのでは負荷が高まるのは当たり前ですし、これではDDoS攻撃とほとんど変わらないんじゃないかと思ったりして。ちなみに、どちらのロボちゃんが来ていたのかは具体的には書きませんが、海外です。どこの国かはまあ大体でご察し頂ければ…。

じゃあどうする?という話ですが、まずは紳士的に「robots.txt」を用いて、Botに「もっと優しくしてください」とお願いしてみることに。今回、異常なまでの荒々しさを見せたBotには、ペナルティの意味も込めてCrawl-delayに3600を設定。1時間に1回しかクロールできない設定(ちなみにMS系のBotであるBingのページには、Crawl-delayは最長でも10でお願いね!とされています)となるのですが、当然の報いかと。これで一応は様子を見ることにしますが、万一robotsに従わないような場合は、強制排除も検討?しなければなりません。

今後も、度々サイトが重くなるかもしれませんが、何卒ご容赦のほどよろしくお願いいたします。

証拠の現場
一番下の行以外は全部Botです。ひどすぎませんか?!

(投稿者:ちゅん)


カテゴリー: つぶやき パーマリンク

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です