Unicode
ASCII
7 bits (128 karakter)
ISO8859
8 bits (256 karakter)
Encoding lain :
EBCDIC (IBM); JIS, Shift-JIS (Jepang); TIS (Thailand), ISCII (India)
Unicode à
16 bits (yang lumrah) sampai dengan 21 bits. 16 bits = 65000 karakter
Yang masuk standar Unicode :
Latin; Cyrillic (Eropa Timur); Arabic, Hebrew (Timur Tengah); Han characters (China, Taiwan, Jepang, Korea); Hiragana, Katakana (Jepang); Hangul (Korea); Thai, Lao, Khmer, Burmese (Asia Tenggara); Devanagari, Bengali, Tamil, Telugu, Malayalam, Gurmukhi, Punjabi, Sinhala (India, Srilangka)
Unicode 6500 karakter pertama