Googleのキャッシュとインデックスの違いとチェック方法

LINE@での無料相談はこちら
LINEで送る
Pocket

検索エンジンに詳しい方であれば、下記2つの言葉の違いをご存知でしょうか?
・キャッシュ
・インデックス
GoogleやYahoo!の検索結果に表示されるためには、この2つのステップを踏む必要があります。まず、Web上のページが「キャッシュ」されて、その後すぐに「インデックス」されます。この2つの処理が検索エンジン側にあるからこそ、自社のホームページが検索結果で表示されます。

キャッシュというのは、検索エンジンの情報収集ロボット(クローラー)がホームページを訪問して、そのページのデータを収集することです。インデックスというのは、ロボットが集めてきたデータを検索結果として表示できるように、検索エンジン側のサーバーに収納して、いつでも表示OKな状態にすることです。詳しいことはGoogleのヘルプページにも書かれています。

つまり、この2段階の処理を自分のホームページで行なってもらわなければ、検索結果に自社のホームページは出てこないということになります。インデックス

キャッシュとインデックスの違い

キャッシュとインデックスのお話の理解は大丈夫でしょうか?Google側では、コンテンツ次第で下記の2つの処理も可能です。
・そもそもキャッシュしない
・インデックスからの削除
どちらも検索エンジン側での処理になります。Googleにインデックスされていないサイトは、検索結果に表示されない=存在しないということです。誰もが簡単にウェブコンテンツを制作できる時代、Webにとって不必要なコンテンツも非常に多くなっています。

検索エンジンといえば、Google(Yahoo!)であり、Google(Yahoo!)を介して集客を行うのが検索エンジンでの上位表示です。Googleは、利用者、つまり顧客にとって、メリットのない情報は容赦なく無視しますし、インデックスから削除します。インデックスに登録すらしてくれないということが当たり前になっています。

では、どんなサイトがインデックスから削除され、そもそもキャッシュをしてもらえないのかを考えてみましょう。

・SNS内の個人の日記(全体公開のもの)
・個人的な雑記ブログ(統一されたテーマ、専門的な内容を除く)
・何度も「次へ」を押さなければ辿り着かない、深い階層にある昔のブログ記事
・独自アドレスではない無料ブログの記事
・アクセスが全くないページ
・中身の無い(薄い)ページ(相対的に内容の薄いページから順番に削除候補に上がっていく)

キャッシュ&インデックスされなければ、記事を書いても無駄な労力になるので注意しなければならないところです。ユーザーは何を必要としているのかを考え、「書く力を高めていく」ことが、Webを活用し続ける一番誰もが獲得しやすいスキルなのです。

自サイトがキャッシュされているかどうか調べる方法

検索エンジンの検索結果に表示させるためには前述の通り、Googleにキャッシュされて、それがインデックスされなければなりません。これはGoogle Search Consoleを使うとすぐに分かるのですが、特定のページだけキャッシュされているかどうかを、すぐに調べたいといった方にはこういう方法もあります。

cache

それはhttps://www.webroad.co.jp/のキャッシュを調べるのであればアドレスバーのそのURLの前に「cache:」を入力し、エンターキーを押して、キャッシュされているかどうかを判別する方法です。cache:https://www.webroad.co.jp/」の形にして入力するということです。

キャッシュされているのであれば「webcachegoogleusercontent.com~」というURLで始まるアドレスにリダイレクトされて、そのキャッシュされているかどうかを調べたホームページの上に、「これはGoogleに保存されている<http://~>のキャッシュです。このページは何年何月何日の何時に取得されたものです。」というような表示が出てきます。この表示が出ると、そのページは正しく「キャッシュ(cache)」されているということになります。

適切にキャッシュされていれば、その後、スムーズにGoogleのサーバー内のインデックスに収納される流れになりますので、ひとまずは安心できます。もしURLの前にキャッシュの文字を入れてエンターキーを押してもキャッシュされていない場合は、「404.that’s an error」といった表示になります。

この場合は、低品質なコンテンツであるか、そもそもGoogleがキャッシュしてインデックスするに足りないページと思われているか、公開してまだ日時が経過していないのか、他に似たようなページがあってキャッシュしてもらえてないのか、Googleのクローラーがそのページをまだ発見できていないか、などいくつかの問題が考えられます。

404thatsanerrorページのキャッシュを確認した際に、キャッシュされていないページというのは、決して検索エンジンの検索結果に出てくる(表示される)ことはありません。どうしても検索エンジンの検索結果に返したいページは、必ずキャッシュされている必要があります。更にはインデックスされている必要があります。

それを調べるツールが、Google Search Consoleであり、サイト運営者はGoogle Search Consoleに登録して自社サイトの状況を確認しておかなければならないのです。

Follow me!

The following two tabs change content below.

山口 敦

代表取締役株式会社ウェブロード
1974年大阪生まれ。プロフィールはこちら。 (HP活用方法の動画一覧→Youtubeチャンネル) 経営理念「育て拡げるお手伝い」の下、IT活用に活路を見出す個人・中小企業のWebサポートを積極的に展開している。 西宮商工会議所青年部2018年度広報委員長、尼崎商工会議所会員。