多语言

字符编码就是计算机在显示字符时使用的编码,也就是一个字符集。

GB2312与GBK

GB2312和GBK均是中国政府颁发的标准汉字编码。为了使汉字能够在计算机上被正确地显示,国家规定了GB2312规范,将大陆常用的6763个汉字放置到该字符集中,并首次在中文操作系统CCDOS中使用。

GB2312根据国际标准ISO 2022设计,在GB2312颁发的时候,不同的国家使用不同的编码。

中国政府将简体与繁体汉字统一起来并颁发了GBK标准。

Unicode、UCS与UTF-8

在一个国际标准字符集中包含全世界各国的文字并提出了"国际统一码"的概念,成立了Unicode委员会。

Unicode 1.0制定的编码使用2个字节来表示一个字符,从U+0000到U+FFFF。国际标准化组织ISO根据Unicode的标准制定了国际字符集,简称UCS,也就是ISO10646编码体系。UCS分为UCS-2和UCS-4两种形式。

  • UCS-2采用与Unicode相似的编码方式,使用2个字节来表示一个字符。
  • UCS-4采用4字字节来表示一个字符,在UCS-2前加2个值为零的字符。

后来Unicode标准推出了2.0,也采用4位节来表示一个字符,与ISO标准达到了统一。现在所使用的国际字符集均指Unicode 2.0或UCS-4标准。

UTF是国际字符集转换格式的缩写。UTF中最常见的一种编码形式为UTF-8。UTF-8使用8位字节编码,通常使用1到3位表示一个字符。

UTF8的优点主要包括以下几点:

  • UTF-8中的字节使用与计算机中的CPU无关,可以使用一套编码在不同的平台上交流。
  • UTF-8具有良好的容错能力。如果某一个字节数据丢失,不会对其他字节造成影响。

网页编码的实现

在网页中,可以使用HTML标签来选择网页显示的字符编码,即在<head>标签中插入<meta>标签来实现,其语法格式如下:

<meta http-equiv="Content-type" content="text/html; charset=字符集名称">

GLS设计思想简介

GLS是全球语言支持的缩写,其含义是在开发的系统中提供全球语言的支持。

results matching ""

    No results matching ""