静的HTMLファイル用のGoogle Sitemap生成
2011年5月13日Table of Contents
Linux前提の力技ですが、手作業でやるよりは圧倒的に早い。
動的ページでも、応用は出来るかもしれません。。。
手順:
- findでhtmlファイルをリスト抽出
- $ find . -type f | grep .html | grep -v .svn > sitemap.xml
- ファイル名をURLへ置換
- vimのコマンドラインで、^./をURLへ置換する
- 「%s!^./!http://www.thekyo.jp/manual/!g」
- URLをGoogle Sitemapの<url>フィールドの形式に置換
- vimのコマンドラインでURLを置換する
- 「%s!^\(.*\)$!<url>\r<loc>\1</loc>\r<lastmod>2011-05-13T00:00:00+00:00</lastmod>\r<priority: >1.0000</priority>\r</url>\r!g」
- ヘッダ、フッタを付けて完了
完成例:
[xml]
<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.google.com/schemas/sitemap/0.84″>
<url>
<loc>http://www.thekyo.jp/manual/pear/core.ppm.pear-validate.validversion.html</loc>
<lastmod>2011-05-13T00:00:00+00:00</lastmod>
<priority>1.0000</priority>
</url>
</urlset>
[/xml]
この方法で、1万以上ある静的ページのsitemap.xmlが2分くらいで完了します。
やはり、vimは便利。