Upload
koichik
View
4.957
Download
4
Embed Size (px)
Citation preview
06/25 (UTC) リリース
符号化文字集合
エンコーディング方式
ASCII
ISO-8859-1
JIS X 0201
JIS X 0208
JIS X 0213
Shift_JIS
EUC-JP
ISO-2022-JP
世界中の文字を集めた符号化文字集合
2バイトの符号
日本語・中国語・韓国語の漢字は統合
世界中の文字を集めた符号化文字集合
4バイトの符号
Unicodeに先行していたが支持されず
Unicodeのエンコーディング方式
バイト単位で可変長のエンコーディング
2byte (16bit) では足りない
BMP (基本多言語面)
2バイト単位のエンコーディング方式
サロゲートペア
UTF-8ではサロゲートペアは不要
3バイト長までしかサポートしていない環境もある
非BMPを3バイトのペア(計6バイト)でエンコーディング
エンコーディング方式が揃う
UTF-16
UTF-32
Unicode 3.2 ('02)
emojiが追加 (非BMP)
ECMA262
string型
~v3.8
v3.9~
Node v0.6
Node v0.8
Buffer
ストリーム (string_decoder)
Node v0.6
Node v0.8
Node v0.6
Node v0.8
他のエンコーディング
node-iconv
ストリームでの利用は注意