ページコンテンツ
サイトマップXMLとは
検索エンジンのクローラーは、各サイトを巡回してリンクを頼りに各サイトのページ構成を検知していますが、ページ数が多い場合や階層が深い場合、巡回が漏れるページが発生する可能性があります。そこで、クローラーはサイトのページ構成が記載されているサイトマップXMLを頼りにサイト内を巡回していきます。
クローラーがサイトマップXMLを読込まで
クローラーは最初に、「Robots.txt」ファイルにアクセスし、読み込むべきサイトマップXMLのパスを取得します。サイトマップXMLは一つである必要はなく、任意のファイル名で複数設けることもできます。
本サイトのrobots.txt(http://www.seo.se-lab.yokohama/robots.txt)は、下記の様に設定しています。
Sitemap: http://www.seo.se-lab.yokohama/sitemap.xml # global User-agent: * Disallow: /xmlrpc.php
WordPressのプラグインで作成する場合
WordPressでは、SEO対策用のプラグインが多数用意されています。特に有名なのが「All in One SEO Pack」で、サイトマップXMLの作成もできます。本サイトも「All in One SEO Pack」でSEO対応、サイトマップXMLの作成をしています。
動的ページのサイトマップXMLを作成する場合
WordPressで作成したページについては、プラグインでサイトマップXMLの作成が可能ですが、WordPress以外の管理している静的ページや、Struts等で作成した動的ページについては、独自にサイトマップXMLを作成し、「Robots.txt」ファイルへパスを追記する必要があります。
サイトマップで最低限必要な項目の例
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>【インデックスしたいURL】</loc> </url> </urlset>
関連記事
外部参考サイト