计算机中信息的编码

  • 格式:pdf
  • 大小:25.48 KB
  • 文档页数:5

下载文档原格式

  / 5
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)汉字外码 无论是区位码或国标码都不利于输入汉字,为方便汉字的输入而制定的汉 字编码,称为汉字输入码。汉字输入码属于外码。不同的输入方法,形成了不 同的汉字外码。常见的输入法有以下几类: dvzfvkwMI1 按汉字的排列顺序形成的编码(流水码):如区位码; 按汉字的读音形成的编码(音码):如全拼、简拼、双拼等; 按汉字的字形形成的编码(形码):如五笔字型、郑码等; 按汉字的音、形结合形成的编码(音形码):如自然码、智能 ABC。 输入码在计算机中必须转换成机内码,才能进行存储和处理。
(3)汉字字形码 为了将汉字在显示器或打印机上输出,把汉字按图形符号设计成点阵图, 就得到了相应的点阵代码(字形码)。 全部汉字字码的集合叫汉字字库。汉字库可分为软字库和硬字库。软字库 以文件的形式存放在硬盘上,现多用这种方式,硬字库则将字库固化在一个单 独的存储芯片中,再和其它必要的器件组成接口卡,插接在计算机上,通常称 为汉卡。 rqyn14ZNXI 用于显示的字库叫显示字库。显示一个汉字一般采用 16×16 点阵或 24×24 点阵或 48×48 点阵。已知汉字点阵的大小,可以计算出存储一个汉字
计算机中信息的编码
计算机中信息的编码 在计算机中,各种信息都是以二进制编码的形式存在的;也就是说,不管 是文字、图形、声音、动画,还是电影等各种信息,在计算机中都是以 0 和 1 组成的二进制代码表示的;计算机之所以能区别这些信息的不同,是因为它们 采用的编码规则不同。比如:同样是文字,英文字母与汉字的编码规则就不 同,英文字母用的是单字节的 ASCII 码,汉字采用的是双字节的汉字内码;但 随着需求的变化,这两种编码有被统一的 UNICODE码(由 Unicode 协会开发的 能表示几乎世界上所有书写语言的字符编码标准)所取代的趋势;当然图形、 声音等的编码就更复杂多样了。这也就告诉我们,信息在计算机中的二进制编 码是一个不断发展的、高深的、跨学科的知识领域。 b5E2RGbCAP 1、字符(英文,包括字母、数字、标点、运算符等)编码 字符的编码采用国际通用的 ASCII 码( American Standard Code for Information p1EanqFDPw Interchange ,美国信息交换标准代码),每个 ASCII 码以 1 个字节 (Byte) 储存,从 0 到数字 127 代表不同的常用符号,例如大写 A 的 ASCII 码是 65,小写 a 则是 97。由于 ASCII 码只用了字节的七个位,最高位并不使用, 所以后来又将最高的一个位也编入这套编码码中,成为八个位的延伸 ASCII(ExtendedASCII) 码,这套内码加上了许多外文和表格等特殊符号,成为 目前常用的编码。基本的 ASCII 字符集共有 128 个字符,其中有 96 个可打印 字符,包括常用的字母、数字、标点符号等,另外还有 32 个控制字符。标准 ASCII 码使用 7 个二进位对字符进行编码,对应的 ISO 标准为 ISO646 标准。 下表展示了基本 ASCII 字符集及其编码: DXDiTa9E3d 字母和数字的 ASCII 码的记忆是非常简单的。我们只要记住了一个字母或 数字的 ASCII 码(例如记住 A 为 65,0 的 ASCII 码为 48),知道相应的大小 写字母之间差 32,就可以推算出其余字母、数字的 ASCII 码。 RTCrpUDGiT 虽然标准 ASCII 码是 7 位编码,但由于计算机基本处理单位为字节 ( 1byte = 8bit ),所以一般仍以一个字节来存放一个 ASCII 字符。每一个字 节中多余出来的一位(最高位)在计算机内部通常保持为 0(在数据传输时可 用作奇偶校验位)。由于标准 ASCII 字符集字符数目有限,在实际应用中往往 无法满足要求。为此,国际标准化组织又制定了 ISO2022 标准,它规定了在保 持与 ISO646 兼容的前提下将 ASCII 字符集扩充为 8 位代码的统一方法。 ISO 陆续制定了一批适用于不同地区的扩充 ASCII 字符集,每种扩充 ASCII 字符集 分别可以扩充 128 个字符,这些扩充字符的编码均为高位为 1 的 8 位代码(即 十进制数 128~255),称为扩展 ASCII 码。下表展示的是最流行的一套扩展 ASCII 字符集和编码: 5PCzVD7HxA 2、汉字的编码 (1)汉字内码
由于国标码不能直接存储在计算机内,为方便计算机内部处理和存储汉 字,又区别于 ASCII 码,将国标码中的每个字节在最高位改设为 1,这样就形 成了在计算机内部用来进行汉字的存储、运算的编码叫机内码(或汉字内码, 或内码)。内码既与国标码有简单的对应关系,易于转换,又与 ASCII 码有明 显的区别,且有统一的标准(内码是惟一的)。 Zzz6ZB2Ltk
汉字信息在计算机内部也是以二进制方式存放。由于汉字数量多,用一个 字节的 128 种状态不能全部表示出来,因此在 1980 年我国颁布的《信息交换用 汉字编码字符集——基本集》,即国家标准 GB231wk.baidu.com-80方案中规定用两个字节 的十六位二进制表示一个汉字,每个字节都只使用低 7 位(与 ASCII 码相 同),即有 128×128=16384 种状态。由于 ASCII 码的 34 个控制代码在汉字系 统中也要使用,为不致发生冲突,不能作为汉字编码, 128 除去 34 只剩 94 种,所以汉字编码表的大小是 94×94=8836,用以表示国标码规定的 7445 个汉 字和图形符号。 jLBHrnAILg
每个汉字或图形符号分别用两位的十进制区码(行码)和两位的十进制位 码(列码)表示,不足的地方补 0,组合起来就是区位码。把区位码按一定的 规则转换成的二进制代码叫做信 xHAQX74J0X
息交换码(简称国标码)。国标码共有汉字 6763 个(一级汉字,是最常用 的汉字,按汉语拼音字母顺序排列,共 3755 个;二级汉字,属于次常用汉字, 按偏旁部首的笔划顺序排列,共 3008 个),数字、字母、符号等 682 个,共 7445 个。 LDAYtRyKfE