静的HTMLファイル用のGoogle Sitemap生成
2011年5月13日Linux前提の力技ですが、手作業でやるよりは圧倒的に早い。
動的ページでも、応用は出来るかもしれません。。。
手順:
- findでhtmlファイルをリスト抽出
- $ find . -type f | grep .html | grep -v .svn > sitemap.xml
- ファイル名をURLへ置換
- vimのコマンドラインで、^./をURLへ置換する
- 「%s!^./!http://www.thekyo.jp/manual/!g」
- URLをGoogle Sitemapの<url>フィールドの形式に置換
- vimのコマンドラインでURLを置換する
- 「%s!^\(.*\)$!<url>\r<loc>\1</loc>\r<lastmod>2011-05-13T00:00:00+00:00</lastmod>\r<priority: >1.0000</priority>\r</url>\r!g」
- ヘッダ、フッタを付けて完了
完成例:
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.google.com/schemas/sitemap/0.84"> <url> <loc>http://www.thekyo.jp/manual/pear/core.ppm.pear-validate.validversion.html</loc> <lastmod>2011-05-13T00:00:00+00:00</lastmod> <priority>1.0000</priority> </url> </urlset>
この方法で、1万以上ある静的ページのsitemap.xmlが2分くらいで完了します。
やはり、vimは便利。