Googlebotは、Googleのウェブクローラーの総称です。クローラーは、サイト情報を収集しWEBインデックスを構成してくれます。検索のインデックス化には、一刻も早くGooglebotにクローリングしてもらうことが有効です。本記事では「サブディレクトリ」と「サブドメイン」構造を持つサイトのクローリング申請法をそれぞれ解説します。
Google クロールとは?
Googlebotは、Googleのウェブクローラーの総称です。Googleが必要な情報を収集しWEBインデックスを構成するために使われ、モバイルおよびデスクトップクローラー、ニュース画像、ビデオ用等の専用クローラーもあります。
Googlebotにクローリングさせる方法は、以下に示すように「サブディレクトリ」と「サブドメイン」構造を持つWEBで異なります。まずは、このクローリングを行う登録方法を解説します。
Google Search Consoleからクローリングの申請
最初に以下に示すリンクのGoogleサーチコンソール (Google Search Console) 機能を使用してGoogleのクローラーに巡回してもらうよう申請します。
Google Search Console へようこそからwebへアクセスすると以下のようなスクリーンが表示されます。
ここで「ドメイン」(左側)と「URLプレフィックス」(右側)どちらを選ぶかを考えるまえに、右側の「ドメイン」と「サブドメイン」とはなにか、そして「サブディレクトリ」とは何かをそれぞれ説明いたします。
一般的な.comをもつURLアドレスを例にすると構造上、下記のように区別できます。
サブディレクトリ構造
https://〇〇〇〇.xxxxx.com/blog/
の場合、/blog/といった「ドメイン名」の後にスラッシュがあるものがサブディレクトリ構造
①ドメインまたはサブドメイン構成を選択する場合
このことから、サーバーの構造でWordPressがルート直下にインストールされている場合は①を選びます。
上図左側の「ドメイン」もしくは「サブドメイン」部分にあなたのURLを入力します。http:// やhttps://などの入力は不要です。
続行を押せば登録は終了です。
②サブディレクトリ構成を選択する場合
一方で、サーバー機のルートディレクトリ以下に/blogのディレクトリ構造を作った後にWordPressをインストールしている場合、URLの構造はサブディレクトリ構造となっています。この場合、①の「ドメイン」(左側)では登録ができません。右側の「URLプレフィックス」を選びましょう。
右側の「URLプレフィックス」部分にサブディレクトリを加えた全URL入力する。
例えば、
https://〇〇〇〇.xxxxx.com/blog/
を登録します。ここでは最後の「/」は入れましょう。
すると以下の様に所有権の確認画面が表示されます。
画面の指示に従い「1.ファイルをダウンロード」から「googleXXXXXX.html」ファイルをダウンロードして自身のサーバーにアップロードして終了です。
上記の画面上の下の「確認」ボタンをクリックして、下記の証明画面がでれば所有権が証明されたことになります。
クローラー登録後
Googleクローラーの反映時期は?
だいたい一月ほどかかります。
Googleクローラーの巡回頻度は?
ボット (google bot) がクローリングする間隔はサイトによってまちまちです。
自身のサイトがどれだけクロールされているかの確認は、Google Search Console (GSC) から知ることができます。(GSCはSiteKitをWordPressにインストールすることでも確認できます。)
下記はGSCの設定画面です。
画面のクロールの統計情報「レポートを開く」からクロール回数を確認できます。
このブログは2022年9月時点で、開設してはや3ヶ月ほど経ちました。常に何かしらクローリングしていますが、大々的なページインデックス化は週に二回ほどあります。3~4日に一回ほどです。
クロールが来てもGSCのインデックスを確認するかぎりでは、すべてをサイト内のページを掲載してくれるわけではないようです。サイト全体のクローラー巡回の後、1日ほど遅れてページのインデックス登録が発生するようです。
中には、
①「クロール済み – インデックス未登録」という巡回はしたが、キーワードが見つからずにインデックス化ができない場合
②「検出 – インデックス未登録」というおそらくインデックス登録するほどでもないページの場合
があり、記事の修正を余儀なくされる場合があるようです。
Googleクロール頻度を短くする方法はあるのでしょうか。
Googleは世界中のウェブサイトを巡回しており、クロール間隔を短くしたり、クロールサイト数を増やしたりする要因として以下の点があると考えられています。
- クロール対象となるURLがユーザーに取って価値があるか?
- インターネット上で人気があるか?
- 更新が頻繁にされているか?
- 最後の更新から時間がたっていないか?
Googleがクロールする回数が増えれば、それだけ検索結果に乗り集客数が増えることになります。結論は良い記事を書くことでしょう。
記事を毎日更新している場合で、googleボットがやってきては、3日から4日ほど追加記事や更新記事がgoogle検索サイトに反映されていきます。一方、記事の更新がほとんどされていない場合は、googleボットの来る回数がへるのか。一週間ほどに一度くらいしかページのgoogle検索へ反映されないようです。
Googleのクロール頻度を増やすには?
クロール回数を上げるためにはドメインパワーを上げることです。これには日々、有益な新規コンテンツを増やし、検索順位の悪いページを常にリニューアルすることが重要です。
それでも悠長には構えていられない場合には、以下の方法が実際、効果的です。
サイトの更新・リトライ更新
とくにWordPressなどのコンテンツ管理プラットフォームを使用している場合、適切なプラグインをインストールすることでコンテンツの追加・変更により自動的に検索エンジンにPING送信されたりします。
URL検査サイトを使用する
URLが少ない場合、個々の URL のクロールをリクエストするには、URL 検査ツールを使用することで、URL 検査ツールでインデックス登録をリクエストすることが可能です。
ただ、記事の内容に一致する「検索ワード」が見つからなかったり、「検索ワード」の検索数が少なかったりする場合には、URL検査サイトで検索してもサイトが登録されないことがあります。その場合、検索されやすい検索ワードを確認して、ワードに沿った記事をリライトするなどが必要です。
サイトマップ(sitemap.xml)の更新
URLが多い場合、サイトの情報を示す(sitemap.xml)サイトマップを送信することが有効です。サイトマップは、Google がサイト上の URL を検出するための重要な方法ですので登録しておくと便利です。登録を行うことで、googleボットが定期的にやってきて追加や更新ページをスキャンしてくれます。
sitemapの登録方法は、「google search console」の左側メニューで「sitemap」登録をクリックします。
すると以下のように新しいサイトマップの追加から登録できます。
「サイトマップのURLを入力」欄に「sitemap.xml」とタイプします。ステータス部分にて「成功しました」と表示されれば成功です。
①SEOのプラグインをインストールしていること
②一度でも記事の更新が行われていること
が満たされていれば、サイトマップが自動で生成されていますので、上記のようにステータスに「成功しました」の表示がでます。
Googleクローラーにクロールさせない方法
具体的なブロック手法についてご説明します。
簡単な方法としてプラグインを利用もしくは、有料テーマを保有していれば、SEO設定として「noindex」という設定を選べばよい。
まとめ
✔ Googlebotは、Googleが必要な情報を収集しWEBインデックスを構成するために使われる。
✔ Googleのクローリング申請はディレクトリ構造を持つサイトとサブディレクトリ構造を持つサイトで異なる。
✔ インデックス化には良い記事を書くことで被リンクを増やし検索以外からの流入も増やしていくことが重要。
コメント