Unicodeのお話

Unicodeというと全世界の文字列を1つのコード体系でまとめられる便利なもの。これからソフトを作るならUnicodeを使って処理しておけばそのまま国際化に対応できる。なんていう楽しい文句を聞いてきましたが、実際のところUnicodeってなかなかややこしい。例えば秀丸でテキストを保存するときに選べるエンコード

と4種類もある。


Unicode HOWTO

Unicodeの簡単な歴史とPythonにおけるUnicodeの扱い。


UTF-8とUTF16の違いは?

UTF-8UTF-16UCS-2とUCS-4の単語の簡単な説明。