11. 符号化文字集合CCS / Coded Character Set文字集合を構成する「文字」、一つ一つに番号を振ったもの一般にはこの番号を「コードポイント」Unicode の場合「Unicode Scalar Value」「あ」->U+3042 (Unicode)JIS X 0208「ビット組合せ」や「区点コード」「あ」->04区02点 (JIS X 0208)
12. 符号化文字集合の例ASCII 英数記号ISO/IEC 8859-1 アクセント付き文字JIS X 0201 いわゆる半角カナJIS X 0208 第一・第二水準漢字などJIS X 0212 補助漢字などJIS X 0213 第三・第四水準漢字などUnicode いろいろ
18. Unicode用語集UCS-2は文字集合ではなくencodingISO/IEC 10646の定義13.1 Two-octet BMP form (UCS-2)This coded representation form permits the use of characters from the Basic Multilingual Plane with each character represented by two octets.Unicodeの定義“UCS-2. ISO/IEC 10646 encoding form: Universal Character Set coded in 2 octets, limited to the Basic Multilingual Plane.”http://www.unicode.org/glossary/#UCS_2
19. History of I18NInternationalization, 国際化I .{18} NI18NS12N (Scherpenhuizenさんが元祖)http://blog.miraclelinux.com/yume/2007/01/i18n_8bc0.html
43. There Ain't No Such ThingAs Plain Text.Joel Spolskyhttp://www.joelonsoftware.com/articles/Unicode.htmlTEXT needsEncoding and Language
60. シフトJIS関連の名前「シフトJIS」 マイクロソフトウェア・アソシエイツが名付けた。総称として用いられる「Shift-JIS」「Shift JIS」 「シフトJIS」の英語表記「MS漢字コード」 開発者の山下による命名「SJIS」 Unix方面での名前「Shift_JIS」 IANA Charsetでの名前「シフト符号化表現」 JIS X 0208:1997 附属書1「Shift_JISX0213符号化表現」 JIS X 0213:2000 付属書1「Shift_JIS-2004符号化表現」 JIS X 0213:2004付属書1「CP932 (Windows Codepage 932)」 Microsoft実装「Windows-31J」 CP932のIANA Charsetでの名前「IBM CP932」 MS CP932とは別物「IBM943」 MS CP932とおおむね同じ、JIS X 0201「IBM943C」 MS CP932と同じ、ASCII
61. 日本語EUC関連の名前「日本語EUC (圧縮形式)」 情報交換用のEUC、普通はこれ「日本語EUC (固定長形式)」 System V での内部表現「eucJP」 UI-OSF日本語環境実装規約で定義「EUC-JP」 IANA Charsetでの名前「UJIS」 ΣOSでの名前「CP51932」 Internet Explorerでの日本語EUC実装「eucJP-ms」 TOG/JVC CDE/Motif 技術検討 WGが定義「EUC-JISX0213」 JIS X 0213:2000 付属書3「EUC-JP-2004」 JIS X 0213:2004 付属書3