サイトマップXMLでクローラー巡回の誘導を行う




サイトマップXMLとは


検索エンジンのクローラーは、各サイトを巡回してリンクを頼りに各サイトのページ構成を検知していますが、ページ数が多い場合や階層が深い場合、巡回が漏れるページが発生する可能性があります。そこで、クローラーはサイトのページ構成が記載されているサイトマップXMLを頼りにサイト内を巡回していきます。

クローラーがサイトマップXMLを読込まで


クローラーは最初に、「Robots.txt」ファイルにアクセスし、読み込むべきサイトマップXMLのパスを取得します。サイトマップXMLは一つである必要はなく、任意のファイル名で複数設けることもできます。

本サイトのrobots.txt(http://www.seo.se-lab.yokohama/robots.txt)は、下記の様に設定しています。

Sitemap: http://www.seo.se-lab.yokohama/sitemap.xml

# global
User-agent: *
Disallow: /xmlrpc.php

WordPressのプラグインで作成する場合


WordPressでは、SEO対策用のプラグインが多数用意されています。特に有名なのが「All in One SEO Pack」で、サイトマップXMLの作成もできます。本サイトも「All in One SEO Pack」でSEO対応、サイトマップXMLの作成をしています。

動的ページのサイトマップXMLを作成する場合


WordPressで作成したページについては、プラグインでサイトマップXMLの作成が可能ですが、WordPress以外の管理している静的ページや、Struts等で作成した動的ページについては、独自にサイトマップXMLを作成し、「Robots.txt」ファイルへパスを追記する必要があります。

サイトマップで最低限必要な項目の例

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

    <url>
        <loc>【インデックスしたいURL】</loc>
    </url>

</urlset>

関連記事


外部参考サイト