FC2ブログ

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

UnicodeとUTF-8の違い

仕事でUnicodeがらみのことをやることになりそうなんで、よくわかってなかったUnicodeとUTF-8の違いなどを調べてみた。


例によってgoogle先生に聞いた。

参考
SE奮闘記
  
wikipedia Unicode
  
wikipedia UTF-8
 
簡単にまとめると

 Unicode:文字の集合
 UTF-8 :符号化方式の一種

ということらしい。


 UnicodeとUTF-8が同じレベルのものと勘違いしやすいのはWindowsのせいもあるのではないだろうか。
 メモ帳で保存するとき文字コードを選択できるが、その選択肢がUnicode、UTF-8などというリストになっている。
 ここでのUnicodeはUTF-16 のリトルエンディアンらしい。
 だったら、UTF-16と書いてくれればいいのに……

 しかも、UTF-8で保存したら勝手にBOMつけやがるし……
 (UTF-8でBOM付だと、一部のアプリで文字列にゴミが入ったりすることがある)

以上。
スポンサーサイト

テーマ : プログラミング
ジャンル : コンピュータ

コメントの投稿

管理者にだけ表示を許可する

検索フォーム
プロフィール

takuan93

Author:takuan93
本ブログの説明書→「ReadMe」

管理者に連絡

カテゴリ
WiX (5)
Ant (1)
フリーエリア
最新記事
カウンター
カレンダー
09 | 2018/10 | 11
- 1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31 - - -
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。