検索エンジンの仕組み:クロール、インデックス作成、ランキング

検索エンジンの仕組み:クロール、インデックス作成、ランキング

2020年6月19日

検索エンジンは検索者が尋ねている質問に最も関連性のある結果を提供するために、インターネットのコンテンツを発見、理解、および整理するために存在します。

検索結果に表示するには、まずコンテンツが検索エンジンに表示される必要があります。
これは間違いなくSEO対策に重要なことで、SERP(検索エンジン結果ページ)に表示されなければユーザーがサイトに検索を介してたどり着くことはありません。

検索エンジンはどのように機能しますか?

検索エンジンには3つの主要な機能があります。

  1. クロール:インターネットでコンテンツを探し、見つけた各URLのコード/コンテンツを調べます。
  2. インデックス:クロールプロセス中に見つかったコンテンツを保存および整理します。ページがインデックスに登録されると、関連するクエリの結果として表示されるように実行中です。
  3. ランク:検索者のクエリに最もよく答えるコンテンツを提供します。つまり、結果は関連性の高いものから低いものの順に並べられます。

検索エンジンのクロールとは何ですか?

クロールは、検索エンジンがロボットのチーム(クローラーまたはスパイダーと呼ばれる)を送信して、新しいコンテンツや更新されたコンテンツを見つける発見プロセスです。コンテンツはさまざまです(Webページ、画像、ビデオ、PDFなど)が、形式に関係なく、コンテンツはリンクによって検出されます。

Googlebotは、最初にいくつかのWebページにアクセスし、次にそれらのWebページのリンクをたどって新しいURLを見つけます。このリンクパスに沿ってホッピングすることで、クローラーは新しいコンテンツを見つけて、それをCaffeine(検出されたURLの大規模なデータベース)と呼ばれるインデックスに追加し、後で検索者がそのURLのコンテンツがに適しています。

検索エンジンインデックスとは何ですか?

検索エンジンは、見つけた情報を処理してインデックスに保存します。インデックスは、発見したすべてのコンテンツの巨大なデータベースであり、検索者に提供するのに十分であると見なされます。

検索エンジンのランキング

誰かが検索を実行すると、検索エンジンは関連性の高いコンテンツのインデックスを検索し、検索者のクエリを解決することを期待してそのコンテンツを注文します。関連性による検索結果のこの順序付けは、ランキングと呼ばれます。一般に、Webサイトのランクが高いほど、検索エンジンはそのサイトがクエリに関連していると見なすことができます。

サイトの一部または全部から検索エンジンクローラーをブロックしたり、特定のページをインデックスに保存しないように検索エンジンに指示したりすることができます。これを行う理由はいくつかありますが、検索者がコンテンツを見つけたい場合は、最初に、クローラーがアクセスでき、インデックスに登録できることを確認する必要があります。そうでなければ、それは目に見えないのと同じくらい良いです。

この章の終わりまでに、検索エンジンに反対するのではなく、検索エンジンで作業するために必要なコンテキストが得られます。