NamazuのUTF-8化
カテゴリ:サイト運営&開発
日時:2004/03/07 22:30
Unicodeにはいろいろ不満もあるが、EUCやシフトJISではできないことも多い。シフトJISでもウムラウトなどを実体参照で強引に表示させることはできるが、これでは検索に問題がある。
XMLはUTF-8が前提だし、将来的にXML化する可能性も視野に入れるとサイト全体をUTF-8に移行させた方がスッキリしそうだ。
UTF-8化したサイトを試験的に作ってみると、検索機能で壮烈な文字化け発生。調べてみると、NamazuはUTF-8に対応していないとのこと。
が、nkf 2.0.xを通せば何とかなりそう。mknmzrcに
$NKF = "/usr/bin/nkf -W";
と書いて解決。
それとは別に、某コーナー用のデータ管理機能を作り込む。一応、予定していた機能は実装できたのだが、コードが恐ろしく汚くなってしまった。同じような処理をしているコードが多いし、DBへのアクセスを多用しすぎたかも。
小さいデータは配列にブチ込んで、キャッシュ化すべきだったかな。全体的にユーザー関数&クラス化して、コードを整理したい気もするけど、自分しか使わない機能だから動けばいいや、という気もする。
XMLはUTF-8が前提だし、将来的にXML化する可能性も視野に入れるとサイト全体をUTF-8に移行させた方がスッキリしそうだ。
UTF-8化したサイトを試験的に作ってみると、検索機能で壮烈な文字化け発生。調べてみると、NamazuはUTF-8に対応していないとのこと。
が、nkf 2.0.xを通せば何とかなりそう。mknmzrcに
$NKF = "/usr/bin/nkf -W";
と書いて解決。
それとは別に、某コーナー用のデータ管理機能を作り込む。一応、予定していた機能は実装できたのだが、コードが恐ろしく汚くなってしまった。同じような処理をしているコードが多いし、DBへのアクセスを多用しすぎたかも。
小さいデータは配列にブチ込んで、キャッシュ化すべきだったかな。全体的にユーザー関数&クラス化して、コードを整理したい気もするけど、自分しか使わない機能だから動けばいいや、という気もする。