Webサイトを運営していると、HTTPステータスコードや404エラー、301リダイレクトなどの言葉を耳にすることがあると思います。これらは、検索エンジンのURLの扱いに関わるためSEO担当者もおさえておくべき用語と言えます。本記事では、SEO担当者が知っておくべきポイントを紹介します。
HTTPステータスコードとは
パソコンやスマートフォンなどのブラウザからWebページを閲覧する時は、図1のようにWebサーバーとのやり取りがおこなわれています。クライアントとは、Webサーバーからサービスの提供を受けるブラウザなどを指します。
(図1:クライアントとWebサーバーのやり取りのイメージ)
HTTPステータスコードとは、HTTPレスポンスに含まれるWebサーバーの処理結果を表現する3桁の数字のことを指します。
(図2:HTTPレスポンスで実行結果やHTMLファイルが返送される)
3桁の数字は「処理が成功した」、「リダイレクト(転送)がかかっている」、「エラーがある」、などさまざまな意味を持っています。詳細なインターネット通信の仕組みはSEO担当者にとって必須の知識ではないかもしれませんが、HTTPステータスコードについては検索エンジンのWebページの扱いにも関わるため理解しておくことを推奨します。
SEO担当者がHTTPステータスコードを知っておくべき理由
検索エンジンがインデックスするURLはユーザーが閲覧できることが大前提です(この前提がないと検索結果に表示されたURLがエラーを返す事象が発生し、検索エンジンの利便性を損ねるため)。つまり、SEO担当者はインデックスさせたいURLが、問題なく閲覧できる状態になっているかどうかをHTTPステータスコードで判断できるのが望ましいです。
またSEOの業務では、Webページやコンテンツの移動や削除、URL変更などもおこなうことがあります。特にURLの変更をする時は、各URLが適切なHTTPステータスコードを返すようにしておかないと自然検索流入を大きく減少させてしまう恐れもあるため、正しく理解しておく必要があります。
HTTPステータスコードの種類
HTTPステータスコードは大きく分けると1xx、2xx、3xx、4xx、5xxの5つに大別できます。それぞれ主要なものを表でまとめていますので参考にしてください。また、SEO担当者が覚えておくべきものは表内で太字にしています。
参考:HTTP レスポンスステータスコード - HTTP | MDN
・1xx(Informational):処理中
1xxは、情報処理中であるということを示すHTTPステータスコードです。Google サーチコンソールなどのツールでは目にしないので、SEO担当者の方は頭の片隅に入れておく程度で良いでしょう。
HTTPステータスコード | 意味 |
100 Continue | リクエスト継続可能 |
101 Switching Protocols | プロトコル切り替え |
102 Processing | 処理中 |
103 Early Hints | 早期に予想されるヘッダを伝達 |
・2xx(Success):成功
2xxは、通信が成功したことを示すHTTPステータスコードです。インデックスさせたいURLは「200 OK」(もしくは「201 Created」)のステータスコードが返る状態になるようにします。
HTTPステータスコード | 意味 |
200 OK | リクエスト成功 |
201 Created | リクエストが成功し、リソースの作成が完了 |
202 Accepted | リクエストは受理されたが、まだ実行されていない |
203 Non-Authoritative Information | オリジナル以外の情報を含み信頼できない |
204 No Content | リクエストに対して送信するコンテンツがない |
205 Reset Content | リクエストのリセットを伝達 |
206 Partial Content | 一部のリクエストが成功 |
・3xx(Redirection):リダイレクト
3xxは、リダイレクト(転送)がおこなわれたことを示すHTTPステータスコードです。そのURLに訪問すると自動的に別のURLに転送されることを意味します。
HTTPステータスコード | 意味 |
300 Multiple Choice | リクエストに対し複数のレスポンスがある |
301 Moved Permanently | URLが永遠に変更されたことを示す |
302 Found | URLが一時的に変更されたことを示す |
303 See Other | リクエストに対するレスポンスが別URLにある |
304 Not Modified | リクエストしたリソースは更新されていない |
307 Temporary Redirect | 一時的なリダイレクト(302とほぼ同じ) |
308 Permanent Redirect | 恒久的なリダイレクト(301とほぼ同じ) |
・4xx(Client errors):クライアントエラー
4xxは、クライアント側でエラーが起きていることを示すHTTPステータスコードです。クライアント(ユーザー)側のリクエストに不備があることを意味し、このステータスコードを返すURLはインデックスされません。
HTTPステータスコード | 意味 |
400 Bad Request | リクエストが無効 |
401 Unauthorized | 認証が必要 |
403 Forbidden | クライアントにアクセス権がない |
404 Not Found | リソース・ページが存在しない |
410 Gone | リソース・ページが恒久的に削除された |
411 Length Required | リクエストにContent-Lengthヘッダーがない |
429 Too Many Requests | 一定時間内の大量リクエストによる拒否 |
※4xxのHTTPステータスコードは種類が多いため、よく見かけるもののみ記載
・5xx(Server errors):サーバーエラー
5xxは、サーバー側でエラーが起きていることを示すHTTPステータスコードです。サーバー側がリクエストの処理に失敗したことを意味します。このステータスコードを返すURLはクロール頻度が低下し、すでにインデックスされているURLは一定期間インデックスが保持された後、インデックスから削除されます。
HTTPステータスコード | 意味 |
500 Internal Server Error | サーバー内部エラー |
502 Bad Gateway | ゲートウェイとして動作するサーバーが無効なレスポンスを受け取った |
503 Service Unavailable | サーバーの過負荷やメンテナンスにより利用不可 |
※5xxのHTTPステータスコードは種類が多いため、よく見かけるもののみ記載
参考:HTTPステータスコード、ネットワークとDNSエラー、およびGoogle検索| ドキュメント| Google Developers
HTTPステータスコードに関するSEO担当者が知っておくべき用語
本章では、SEO担当者ならよく耳にするHTTPステータスコード関連の用語を簡単に解説します。
301リダイレクト、302リダイレクト
リダイレクトとは、既存のURLに訪問したユーザーを自動的に別のURLに転送することを指します。このリダイレクトの手法には下記のような種類があり、301リダイレクトと302リダイレクトはサーバー側で実装されるリダイレクトに該当します。
・サーバー側で実装されるリダイレクト
サーバー側で実装されるリダイレクトで、インデックスさせたいURLを変更する場合はもっとも推奨される手法です。301リダイレクトは永続的なURLの変更を示し、302リダイレクトは一時的な変更を示すという点に違いがあります。
・meta refreshタグによるリダイレクト
サーバー側でのリダイレクトが難しい場合の代替手法のひとつがmetaタグを使った手法です。meta refreshをHTMLのheadセクションに配置するか、HTTPヘッダーのサーバー側のコードとともに配置します。
・JavaScriptを使用したリダイレクト
サーバー側のリダイレクトもmeta refreshタグによるリダイレクトも実装が困難な場合は、JavaScriptを使用したリダイレクトが代替手法のひとつとなります。この手法では、JavaScriptの実行によりリダイレクトがおこなわれます。Googlebotはクロール後にレンダリング※しようとするもののさまざまな要因で失敗することがあるため、Googlebotが確実にリダイレクトを検知できない可能性がある点を認識しておきましょう。
※HTMLファイルなどをもとにユーザーが閲覧する画面を生成すること、JavaScriptの実行も含む
参考:リダイレクトと Google 検索 | Google 検索セントラル | ドキュメント | Google Developers
ソフト404
ソフト404とは、コンテンツがない(削除されている)URLにもかかわらずHTTPステータスコードが200を返すURLのことを指します。検索エンジンは、200が返るURLなのでインデックス候補と認識してクロールしますが、コンテンツがないため検索結果経由で訪問するユーザーに見せる必要はないことを検知すると、ソフト404と判定してインデックスに登録しません。
(図3:Googleがソフト404と判定したページの例)
参考:ソフト 404 エラーを修正する方法 | Google 検索セントラル | ドキュメント | Google Developers
カスタム404
カスタム404とは、コンテンツがなく(削除されている)404を返すURLをユーザーにわかりやすくカスタマイズしたWebページを指します。Webサイトを運営していると404ページはどうしても発生しますが、特にカスタムしていない404ページはエラーメッセージのみで訪問者に不親切です。
(図4:エラーメッセージのみが表示される404ページ)
コンテンツがないことをわかりやすく伝え、他の情報やコンテンツを提供する形にカスタマイズすることでユーザーの離脱を防げる可能性があります。404を返すので検索結果に表示されることはありませんが、ユーザーの利便性向上に寄与すると認識しておくと良いでしょう。
(図5:カスタム404ページの例)
Googleはカスタム404のヒントとして下記を紹介しています。
・ユーザーに対して、探しているページが見つからないことを明確に伝えます。親しみやすく平易な言葉を使用します。
・404 ページを、サイトのその他の部分と同じデザイン(ナビゲーションを含む)にします。
・最も人気のある記事や投稿へのリンクのほか、ホームページへのリンクを追加します。
・無効なリンクを報告する方法をユーザーに提供することを検討します。
参考:ソフト 404 エラーを修正する方法 | Google 検索セントラル | ドキュメント | Google Developers
HTTPステータスコードの確認方法
Google Chromeではデベロッパーツールを使うことで簡単に確認できます。
・Google Chromeを開き[F12]キーでデベロッパーツールを起動
・確認したいWebページにアクセス
・Networkタブを選択し、Statusを確認
(図6:HTTPステータスコードをデベロッパーツールで確認するイメージ)
まとめ
HTTPステータスコードとそれに関連する用語について解説しました。サーバーエラーの対応などはエンジニア職の業務になるのが一般的なため、SEO担当者には馴染みがないかもしれませんが、紹介した用語を把握しておいた方が日々の業務進行がスムーズになると思います。また、Webサイトの移転などURLの変更をおこなうときは、自然検索流入を減少させないためにもリダイレクトの設定が非常に重要になります。URL変更を伴うWebサイトの移転などを検討されている場合は、当社にて検索エンジンに配慮した移転の支援が可能ですのでお問い合わせください。
▼関連記事
この記事の著者
増渕 佑美
2014年に株式会社アイレップに入社し、SEOコンサルタントとして従事。ソリューション部署に所属。通販や人材などデータベース型サイトを中心に経験を積んでおり、現在はメディアサイトのSEOも担当し幅を広げている。
好きなこと:散歩、パズル、動物の動画をみること
2014年に株式会社アイレップに入社し、SEOコンサルタント...