PHP(euc) + Smarty(euc) で、UTF-8やSJIS出力する方法(解決策とまとめ)
2007年2月8日Table of Contents
以前ハマった、PHP+SmartyでのUTF-8出力のまとめのメモ。
SJISなども置き換えて処理させれば、動作確認済み。もちろん、mb_internal_encodingがUTF-8の環境での、SJIS出力やEUC-JP出力も対応。
ってことで、メモ。
PHP(euc) + Smarty(euc) で、UTF-8やSJIS出力する方法(解決策とまとめ)
ここでは、PHPのとSmartyテンプレートのエンコードをeucとしてますが、PHP = Smartyテンプレートとして読み替えれば、どんな文字コードでもOKのはず。
一応、同一スクリプトで文字コードの変換出力部分をテストした時のサンプルソースを貼っておきます。
サーバー環境
PHP 4.4.4
mbstring.detect_order: auto mbstring.encoding_translation: Off mbstring.func_overload: 0(none) mbstring.http_input: auto mbstring.http_output: euc-jp mbstring.internal_encoding: euc-jp mbstring.language: Japanese mbstring.script_encoding: no value mbstring.substitute_character: no value
Smarty テンプレート(euc)
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd"> <html lang="ja"> <head> <meta http-equiv="content-type" content="text/html; charset={$data.html_output}"> <title>{$data.html_title}</title> </head> <body> <div> テンプレート内に直接記載 </div> <br> <br> <div> {* この値をcontent-typeへ指定 *} PHPからセット -> {$data.html_output}(このHTMLのcharset)<br> {* PHP内部で指定した文字列 *} PHPからセット -> {$data.comment|nl2br}<br> {* formからPOSTされた文字列 *} PHPからセット -> {$data.form}(フォームから取得) </div> <br> <div> <form action="#" method="post"> <input type="text" name="comment" value=""><br> <input type="submit" value=" OK "> </form> </div> <br> <div> <fieldset> <a href="?charset=shift_jis">SJIS</a><br> <a href="?charset=euc-jp">EUC-JP</a><br> <a href="?charset=utf-8">UTF-8</a><br> </fieldset> </div> </body> </html>
UTF-8/SJIS/EUC-JP 出力テストサンプル(euc)
<?php /** * PHP(euc) + Smarty(euc) 環境での他文字コード出力テスト **/ /* input charset */ // key(HTML META内charset) value:mb_convert_encodingパラメータ(JIS,SJIS,EUC-JP,UTF-8) $list_charset = array( 'shift_jis' => 'SJIS', 'euc-jp' => 'EUC-JP', 'utf-8' => 'UTF-8', ); $output_charset = get_output_charset(); $conv_charset = get_charset(); /* content header */ header('content-type:text/html; charset="$output_charset"'); /* smarty setting*/ require_once('Smarty/Smarty.class.php'); $smarty = new Smarty(); $smarty->template_dir = './'; $smarty->compile_dir = './templates_c/'; /* template(encode) == php(encode) */ $smarty->register_outputfilter("output_filter"); /* values for smarty template */ $data['html_title'] = 'タイトル←PHPから指定'; $data['html_output'] = $output_charset; if( isset($_POST['comment']) ){ $data['form'] = htmlspecialchars(mb_convert_encoding($_POST['comment'], mb_internal_encoding(), $conv_charset)); } $data['comment'] = 'PHP側からデータをセット♪'; /* smarty assign */ $smarty->assign('data', $data); /* smarty display */ $smarty->display("pc_index.tpl"); //{{{ output_filter /* Smarty->display()時に処理されるフィルタ(outputfilter) */ function output_filter($buff, &$smarty) { $conv_charset = get_charset(); if (function_exists("mb_convert_encoding")) { $enc = mb_detect_encoding($buff); if ($enc != $conv_charset ) { $buff = mb_convert_encoding($buff, $conv_charset, 'EUC-JP'); /* コード変換が分かりにくいので、一応出力 */ } } return $buff. "template:$enc<br>output:$conv_charset"; } //}}} //{{{ get_output_charset /* $list_charsetから出力用(content-header)の文字コードを取得 */ function get_output_charset() { global $list_charset; if( isset($_GET['charset']) ){ $charset = htmlspecialchars($_GET['charset']); if( array_key_exists($charset, $list_charset) ){ return $charset; } } return strtolower(mb_internal_encoding()); } //}}} //{{{ get_charset /* $list_charsetから文字コード変換用(mb_convert_encoding)の文字コードを取得 */ function get_charset() { global $list_charset, $conv_charset; if( isset($_GET['charset']) ){ $charset = htmlspecialchars($_GET['charset']); if( in_array($charset, $list_charset) ){ return $list_charset[$charset]; }else{ //return mb_internal_encoding(); return $charset; } }else{ return $charset; } } //}}}
まとめ
mb_internal_encoding(PHP) = Smartyテンプレート
PHPのエンコードとSmartyテンプレートが同じ文字コードの場合(例:EUC-JP)
- outputfilterでUTF-8化処理する
- header()を使って、content-typeを必ず指定(ここではUTF-8)
- GET/POSTデータをそのままテンプレート内に入れると、mb_detect_encoding()がテンプレートを処理できなくなる場合があるので、GET,POST(多分Cookieなども)されるデータはmb_convert_encoding()を使ってEUCへ
mb_internal_encoding(PHP) != Smartyテンプレート
PHPのエンコードとSmartyテンプレートが異なる文字コードの場合(例:テンプレート = UTF-8)
(試してませんが・・・おそらく)
- テンプレートコンパイル前にprefilter()でEUC-JP化処理する
- テンプレートコンパイル後にpostfilter()でUTF-8化処理する
- header()を使って、content-typeを必ず指定(ここではUTF-8)
- GET,POST(多分Cookieなども)されるデータはそのまま使えるはず
今回はまったのは、header()のとこなんですが、結局[ templates_c ]内をちゃんと削除できてなかったらしく、正しく処理してるのに「あれ?」って感じで修正入れて・・・・無限ループ状態だったようです。
こういう時に客観的な目とか慎重さがあればなぁ・・と反省_| ̄|○