字符(包含各种自然语言文字字符、各种符号字符),都是图形符号。为了在计算机中存储和标识字符,大家为每一个字符指定一个特定的编码。该编码也被叫做字符的机内码。
1、ASCII码:是英文American Standard Code for Information Interchange的缩写,意为美国标准信息交换代码。
2、ASCII码的分类:
(1)7位ASCII码:表示128种字符。
(2)8位ASCII码:又包含基本ASCII码和扩展ASCII码。都可以表示128个不一样的英文字符。基本ASCII码的最高位是0;扩展ASCII码的最高位是1。
3、汉字编码:包含国标码、区位码汉字输入码、汉字字形码。一个汉字在计算机中是用两个字节来表示的。
4、标码:
1981年国内公布了《信息交换用汉字编打字符集基本集》,又称为国家标准信息交换用汉字编码,简称GB2312-80,它将汉字组成一个94×94的方阵(行数称为区;列数称为位)它规定了两种汉字编码策略,一种即是区位码,另一种为国标码。比如:啊字在16区1位,其区位码为:
1601.
5、国标码=(区号+32)(位号+32)=区位码+32=(区号+20h)(位号+20h)=区位码+20h
6、机内码:为了不与基本ASCII码相混淆,将两字节存放国标码的每一字节的最高位(bit)置1,如此形成的汉字编码正是现行的汉字在计算机内的存储编码,称为机内码。
7、三码的关系为:国标码=区位码+20h。内码=国标码+80h=区位码+A0h
8、输入码(外码):音码、形码、音形结合的码
9、汉字的字模码(用于显示和打印):显示器的屏幕是由均匀分布的显示点(像素)构成的,伴随显示器得分辩率的不同,一屏所能显示的点数也不同,现在用最多的是800×600点的分辨率,即横向800点,纵向600点,或曰600行×800列。当然现在显示器的分辨率均可达到1280×1024的高分辨率。汉字在屏幕上是以点阵的形式显示的,显示一个汉字的最基本的点阵为16×16点阵,除此之外还有24×24点阵、48×48点阵、64×64点阵等。
10、问题:怎么样计算一个汉字字模码所占用的存储空间?
汉字输入码国标码汉字内码汉字字形码汉字