2008年10月24日金曜日

よくわかるユニコード

  • Unicodeは文字コードセットのこと。UTFとは別。
  • UTF-何々というのはUnicodeをのエンコード方式のこと。
  • BOM(Byte Order Mark)は基本的にUTF-16にしかつかない。UTF-8では不要。
近頃はWeb上のリソースから、iPhoneの文字列までみんなUnicodeになりましたね。
でもよく考えたらUnicodeについて真面目に学んだことが一度もなかったので、BOMのあるなしで悩んだのをきっかけに、Unicodeについて勉強してみました。

勉強しただけではすぐ忘れちゃうので、こんな図にしてみました。




これで少しは覚えられるかも。