インデックス カバレッジレポートで除外のステータスに含まれる「検出 - インデックス未登録」という型を目にしたことがある方も多いと思います。型名だけ見てもなぜこの型に該当しているのか、どうすればインデックスされるのか、などがわかりにくくご質問いただくことも多いため、本記事では「検出 - インデックス未登録」について解説します。
「検出 - インデックス未登録」とは
Google サーチコンソールのインデックス カバレッジレポートに出てくる型のひとつです。このレポートでは管理しているWebサイトのURLについて4つのステータスで確認することができますが、「検出 - インデックス未登録」は除外ステータスに属する型となります。
(図1:インデックス カバレッジレポートに表示される「検出 - インデックス未登録」)
▼関連記事
どんな状態?
Googleの公式ドキュメントには下記のように記載されており、GooglebotがURLを見つけているもののクロールしておらず、インデックスもされていない状態となります。
検出 - インデックス未登録:ページはGoogleにより検出されましたが、まだクロールされていません。これは通常、GoogleがURLをクロールしようとしたものの、Webサイトへの過負荷が予想されたため、クロールの再スケジュールが必要となった場合です。そのため、レポート上で最終クロール日が空欄になっています。
参考:インデックス カバレッジ レポート - Search Console ヘルプ
Googleのインデックスプロセスは大まかに下記図2の流れとなっています。「検出 - インデックス未登録」は、GoogleがURLを見つけるプロセスまでは完了している、と理解すると良いでしょう。
(図2:Googleのインデックスプロセスの簡易イメージ)
インデックスのプロセスを含むGoogle 検索の詳細は初心者向け検索コースの動画でも解説されています。
参考:Google 検索の詳細 | 初心者向け検索コース エピソード 4 - YouTube
「クロール済み - インデックス未登録」との違い
混同しやすい除外の型に「クロール済み - インデックス未登録」があります。インデックスプロセスを用いるとこの型との違いは以下の表のようになり、「クロール済み - インデックス未登録」はURLを見つけてクロールしたもののインデックスされていないURLとなります。
クロール済み - インデックス未登録 | 検出 - インデックス未登録 | |
URLを見つける | ○ |
○ |
クロールする | ○ | × |
インデックスに登録する | × | × |
▼関連記事
この型に分類される理由
Googleの公式ドキュメントには、Webサイトへの過負荷が予想されたためクロールが後回しになったと記載されています。Googleは検出したURLすべてをクロールする訳ではありません。Googleがクロールにかけるリソースは有限であるため、最終的にインデックスしない可能性が高いURLのクロールは後回しになることがあります。クロールする前に把握できる情報から、優先度が下げられていることも考えられます。
「検出 - インデックス未登録」に該当するURLの対応
この型に該当する理由はURLによって様々ですが、まずはレポートに表示されるURLがクロールされるべきなのかを確認しましょう。計測用パラメータがついたURLや他に正規URLがある重複URLなどの場合は、通常インデックスさせる必要がないためクロールされる必要もないと言えます。クロールされる必要のないURLがこの型に該当しているなら特に対応は必要ありませんが、大量に該当しているような場合や大規模なWebサイトの場合はrobots.txtを利用するなどしてクロールしなくてよいことを明示的にGoogleに伝えると良いでしょう。
クロールされるべきURLがこの型に該当している場合、明確な理由がGoogleから提示されることはありません。しかし、考えられる理由としては以下のようなものが挙げられます。
・サーバーに問題がある
Googleは、Webサイトのサーバーの状態に応じてクロールの頻度を調整します。何らかの理由によりサーバーの負荷が高まっている場合、クロールの頻度が下げられることがあります。この型に該当するURLが急増しているような場合はサーバーの負荷状態について確認しましょう。
・Webページのサイズ(容量)が大きすぎる
GoogleがURLをクロールしてレンダリングするためのリソースにも限りがあります。Webページのサイズが大きすぎるとリソースをたくさん消費するため、クロールが後回しにされる可能性があります。JavaScriptやCSSのサイズを最適化することで改善する可能性があります。
・コンテンツの品質に問題がある
Googleのジョン・ミューラー氏は「検出 - インデックス未登録」に該当するURLが存在する場合、Webサイト全体の品質が影響している可能性もあると発言*しています。GoogleはWebに公開されているすべてのコンテンツをインデックスするわけではなく、コンテンツの品質に一定の基準を設けています。繰り返しになりますが、クロールのリソースも有限のため低品質である可能性が高いURLはクロールを後回しにすることが考えられます。品質が理由になっていると考えられる場合は、ターゲットとする検索ユーザーが望む情報や機能を整理したうえでページの改善方針を定め、個別に品質改善をすることが推奨されます。
参考:English Google SEO office-hours from December 10, 2021 - YouTube
・内部リンクの構造に問題がある
GoogleはURLの重要性を推測する手掛かりのひとつとして内部リンクの構造を使用しており、インデックスプロセスの中でWebサイトの内部リンクの構造も把握していきます。具体的には、内部リンクが設置されていない(もしくは少ない)URLよりも、内部リンクが適切に設置されているURLの方が重要と捉えられます。この型に該当するURLに向けた内部リンクがない(もしくは少ない)場合はこの理由が影響している可能性が高いため、内部リンクの構造を見直してみましょう。
まとめ
本記事では「検出 - インデックス未登録」に該当する理由についていくつか紹介しました。「クロール済み - インデックス未登録」と同様に、除外されているURLをインデックスさせても自然検索流入が増える保証はなく、そもそもこの型に該当するURLをインデックスさせようとする試みの優先度が高くない(コンバージョンへの影響度が小さい)状態のWebサイトもあるはずです。
Webサイトの目的や抱える課題を総合的に把握したうえで、それでも実施することに意義があると判断した場合に対応することを推奨します。課題をお持ちの場合は当社にお問い合わせください。
▼関連資料
この記事の著者
増渕 佑美
2014年に株式会社アイレップに入社し、SEOコンサルタントとして従事。ソリューション部署に所属。通販や人材などデータベース型サイトを中心に経験を積んでおり、現在はメディアサイトのSEOも担当し幅を広げている。
好きなこと:散歩、パズル、動物の動画をみること
2014年に株式会社アイレップに入社し、SEOコンサルタント...