您现在的位置: 弘智首页 > JAVA > JAVA语言基础 >

Java Unicode编码

时间:2012-10-31 来源:弘智教育 点击: 次
程序设计如何支持除了拉丁文字符集外的任何语言,己成为一个大问题。许多国家语言定义的是8位字符集,但是如果你要在一个文件中同时使用拉丁文字符集和西里尔字符集(Cyrillic)就会产生问题。如果你要处理日文,用8位字符集表示将是不可能的。Unicode是一个标准字 符集,它是为满足所有语言的字符需要而制定的。它用16位编码表示一个字符,即一个字符占两个字节,从而可以表达多达65535个不同的字符。这样就叮对 许多字符进行编码,也就有足够的空间设置每个国家的字符集编码。其中可以包含日文使用的需要数千个字符编码的Kanji字符集。

    我们将在第2章中看到,Java源代码使用的也是Unicode字符集。严格地说,只有注释、标识符、字符和文本串可以使用Unicode前128个之外的字符。Java内部也支持Unicode来表示字符和串,所以它潜在地具有理解国际性语言的能力。你熟悉的ASCII码与Unicade前l28个字符是一一对应的,所不同的是每个字符占用两个字节,你不必在意所要处理的字符编码,当然除非你从一开始就要建立一种支持多语言的应用程序。

弘智主页 | 弘智介绍 | 培训课程 | XML地图