C语言之数据类型④——中文字符

  这里需要知道扩展ASCII码表:即128-255的扩展码称为称为扩展ASCII码。但是基本不使用,因此后来规定当两个扩展ASCII码连在一起时,就表示一个汉字,这样表示7000多个简体汉字。

  在这些编码里,连在ASCII里本来就有的数字,标点,字母统统重新变了两个字节长的编码,这就是常说的“全角”字符,而原来在127号一下的那些就叫“半角”字符了

上述编码规则就是GB2312或GB2312-80

弊端:

  (1)两种编码可能使用相同的数字代表两个不同的符号

  (2)或者使用相同的数字代表不同的符号

Unicode编码就是为了解决这个问题才出现的