PHP(euc) + Smarty(euc) で、UTF-8やSJIS出力する方法(解決策とまとめ)

以前ハマった、PHP+SmartyでのUTF-8出力のまとめのメモ。
SJISなども置き換えて処理させれば、動作確認済み。もちろん、mb_internal_encodingがUTF-8の環境での、SJIS出力やEUC-JP出力も対応。
ってことで、メモ。

PHP(euc) + Smarty(euc) で、UTF-8やSJIS出力する方法(解決策とまとめ)

ここでは、PHPのとSmartyテンプレートのエンコードをeucとしてますが、PHP = Smartyテンプレートとして読み替えれば、どんな文字コードでもOKのはず。
一応、同一スクリプトで文字コードの変換出力部分をテストした時のサンプルソースを貼っておきます。

サーバー環境

PHP 4.4.4

mbstring.detect_order: auto
mbstring.encoding_translation: Off
mbstring.func_overload: 0(none)
mbstring.http_input: auto
mbstring.http_output: euc-jp
mbstring.internal_encoding: euc-jp
mbstring.language: Japanese
mbstring.script_encoding: no value
mbstring.substitute_character: no value

Smarty テンプレート(euc)

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html lang="ja">
<head>
<meta http-equiv="content-type" content="text/html; charset={$data.html_output}">
<title>{$data.html_title}</title>
</head>
<body>
<div>
テンプレート内に直接記載
</div>
<br>
<br>
<div>
{* この値をcontent-typeへ指定 *}
PHPからセット -> {$data.html_output}(このHTMLのcharset)<br>
{* PHP内部で指定した文字列 *}
PHPからセット -> {$data.comment|nl2br}<br>
{* formからPOSTされた文字列 *}
PHPからセット -> {$data.form}(フォームから取得)
</div>
<br>
<div>
<form action="#" method="post">
<input type="text" name="comment" value=""><br>
<input type="submit" value=" OK ">
</form>
</div>
<br>
<div>
<fieldset>
<a href="?charset=shift_jis">SJIS</a><br>
<a href="?charset=euc-jp">EUC-JP</a><br>
<a href="?charset=utf-8">UTF-8</a><br>
</fieldset>
</div>
</body>
</html>

UTF-8/SJIS/EUC-JP 出力テストサンプル(euc)

<?php
/**
*  PHP(euc) + Smarty(euc) 環境での他文字コード出力テスト
**/
/* input charset */
// key(HTML META内charset) value:mb_convert_encodingパラメータ(JIS,SJIS,EUC-JP,UTF-8)
$list_charset = array(
'shift_jis' => 'SJIS',
'euc-jp' => 'EUC-JP',
'utf-8' => 'UTF-8',
);
$output_charset = get_output_charset();
$conv_charset = get_charset();
/* content header */
header('content-type:text/html; charset="$output_charset"');
/* smarty setting*/
require_once('Smarty/Smarty.class.php');
$smarty = new Smarty();
$smarty->template_dir = './';
$smarty->compile_dir = './templates_c/';
/* template(encode) == php(encode) */
$smarty->register_outputfilter("output_filter");
/* values for smarty template */
$data['html_title'] = 'タイトル←PHPから指定';
$data['html_output'] = $output_charset;
if( isset($_POST['comment']) ){
$data['form'] = htmlspecialchars(mb_convert_encoding($_POST['comment'], mb_internal_encoding(), $conv_charset));
}
$data['comment'] = 'PHP側からデータをセット♪';
/* smarty assign */
$smarty->assign('data', $data);
/* smarty display */
$smarty->display("pc_index.tpl");
//{{{ output_filter
/* Smarty->display()時に処理されるフィルタ(outputfilter) */
function output_filter($buff, &$smarty)
{
$conv_charset = get_charset();
if (function_exists("mb_convert_encoding")) {
$enc = mb_detect_encoding($buff);
if ($enc != $conv_charset ) {
$buff = mb_convert_encoding($buff, $conv_charset, 'EUC-JP');
/* コード変換が分かりにくいので、一応出力 */
}
}
return $buff. "template:$enc<br>output:$conv_charset";
}
//}}}
//{{{ get_output_charset
/* $list_charsetから出力用(content-header)の文字コードを取得 */
function get_output_charset()
{
global $list_charset;
if( isset($_GET['charset']) ){
$charset = htmlspecialchars($_GET['charset']);
if( array_key_exists($charset, $list_charset) ){
return $charset;
}
}
return strtolower(mb_internal_encoding());
}
//}}}
//{{{ get_charset
/* $list_charsetから文字コード変換用(mb_convert_encoding)の文字コードを取得 */
function get_charset()
{
global $list_charset, $conv_charset;
if( isset($_GET['charset']) ){
$charset = htmlspecialchars($_GET['charset']);
if( in_array($charset, $list_charset) ){
return $list_charset[$charset];
}else{
//return mb_internal_encoding();
return $charset;
}
}else{
return $charset;
}
}
//}}}

まとめ

mb_internal_encoding(PHP) = Smartyテンプレート

PHPのエンコードとSmartyテンプレートが同じ文字コードの場合(例:EUC-JP)

  • outputfilterでUTF-8化処理する
  • header()を使って、content-typeを必ず指定(ここではUTF-8)
  • GET/POSTデータをそのままテンプレート内に入れると、mb_detect_encoding()がテンプレートを処理できなくなる場合があるので、GET,POST(多分Cookieなども)されるデータはmb_convert_encoding()を使ってEUCへ

mb_internal_encoding(PHP) != Smartyテンプレート

PHPのエンコードとSmartyテンプレートが異なる文字コードの場合(例:テンプレート = UTF-8)
(試してませんが・・・おそらく)

  • テンプレートコンパイル前にprefilter()でEUC-JP化処理する
  • テンプレートコンパイル後にpostfilter()でUTF-8化処理する
  • header()を使って、content-typeを必ず指定(ここではUTF-8)
  • GET,POST(多分Cookieなども)されるデータはそのまま使えるはず

今回はまったのは、header()のとこなんですが、結局[ templates_c ]内をちゃんと削除できてなかったらしく、正しく処理してるのに「あれ?」って感じで修正入れて・・・・無限ループ状態だったようです。
こういう時に客観的な目とか慎重さがあればなぁ・・と反省_| ̄|○