当前位置:红颜文学网 > 节日 > 正文

汉字输入码 简述汉字输入码,汉字内码,汉字字形码,汉字交换码区别

导语:标题:简述汉字输入码、汉字内码、汉字字形码和汉字交换码的区别优质答案:计算机信息编码在计算机中,各种信息以二进制代码的形式存在;也就是说各种信息,比如文字、图形、声音、动画、电影等。,在计算机中由0和1组成的二进制代码表示;计算机之所以能区分这些

标题:简述汉字输入码、汉字内码、汉字字形码和汉字交换码的区别

优质答案:

计算机信息编码

在计算机中,各种信息以二进制代码的形式存在;也就是说各种信息,比如文字、图形、声音、动画、电影等。,在计算机中由0和1组成的二进制代码表示;计算机之所以能区分这些信息,是因为它们采用了不同的编码规则。例如,英文字母的编码规则与汉字不同。英文字母用单字节ASCII码,汉字用双字节汉字内码;但随着需求的变化,这两种代码有被统一的UNICODE代码(Unicode Association开发的几乎可以代表世界上所有书写语言的字符编码标准)取代的趋势;当然,图形、声音等的编码。这告诉我们,计算机中信息的二进制编码是一个发展中的、深刻的、跨学科的知识领域。

1.字符编码(英文,包括字母、数字、标点符号、运算符等。)

字符的编码采用美国信息交换标准码(American Standard Code for Information exchange),每个ASCII码存储在一个字节中,0到127的数字代表不同的常用符号,例如大写A的ASCII码为65。小写A是97。因为ASCII码只使用了字节的7位,没有使用最高位,所以最高位后来被编码到这个码中,成为8位的扩展ASCII码。这个内码加了很多外文、表格等特殊符号,成为目前常用的代码。基本ASCII字符集有128个字符,包括96个可打印字符,包括常用的字母、数字、标点符号等。,还有32个控制字符。标准ASCII码用7个二进制编码字符,对应的ISO标准是ISO646。下表显示了基本的ASCII字符集及其编码:

字母和数字的ASCII码的记忆非常简单。只要我们记住一个字母或数字的ASCII码(例如,记住a是65,0的ASCII码是48),我们就可以通过知道32的大小写字母的区别来计算其他字母和数字的ASCII码。

虽然标准的ASCII码是7位码,但是因为计算机的基本处理单位是字节(1字节= 8位),所以一个ASCII字符通常存储在一个字节中。每个字节中的额外位(最高位)在计算机内部通常保持为0(在数据传输过程中可用作奇偶校验位)。由于标准ASCII字符集的字符数量有限,在实际应用中,往往达不到要求。为此,国际标准化组织制定了ISO2022标准,规定了在保持与ISO646兼容的前提下,将ASCII字符集扩展到8位代码的统一方法。ISO先后制定了多个适用于不同地区的扩展ASCII字符集,每个字符集可分别扩展128个字符。这些扩展字符的代码都是8位代码(即十进制数128~255),称为扩展ASCII码。下表显示了最流行的扩展ASCII字符集和代码集:

2.汉字编码

(1)汉字内码

汉字信息也以二进制方式存储在计算机中。由于汉字数量庞大,一个字节的128种状态无法全部表示出来。因此,1980年,信息交换用汉字编码字符集-基本集,国家标准GB2312-80规定,一个汉字应该用两个字节的16位二进制表示,每个字节只使用低7位(与ASCII码相同)。即有128×128=16384个状态。因为汉字系统要用ASCII码的34个控制码,为了避免冲突,不能作为汉字码使用。128个中只剩下94种,所以汉字编码表的大小为94×94=8836,用于表示国家标准码规定的7445个汉字和图形符号。

每个汉字或图形符号用两位小数的区号(行码)和两位小数的位置码(列码)表示,不足之处用0补充。由区号按一定规则转换而来的二进制码称为信息交换码(简称国标码)。国家标准码(一级汉字)中有6763个汉字,是最常用的汉字,按照汉语拼音的字母顺序排列。二类汉字属于第二常用汉字,按部首笔画顺序排列(共3008个),数字、字母、符号共682个(共7445个)。

由于国标代码不能直接存储在计算机中,为了便于计算机内部处理和存储汉字,并与ASCII码不同,国标代码中的每个字节在最高位都改为1,从而形成了一种在计算机中存储和计算汉字的代码,称为内码(或汉字内码,或内码)。内码与国标码有简单对应,易于转换,与ASCII码明显不同,有统一的标准。

(2)汉字的外部代码

位置码和国标码都不利于汉字输入。为方便汉字输入而制定的汉字编码称为汉字输入码。汉字输入码属于外码。不同的输入法形成不同的汉字外码。常见的输入法如下:

按照汉字排列顺序形成的码(流码):如位置码;

根据汉字读音形成的代码(音码):如全拼、简拼、双拼;

根据汉字字体形成的编码(形码):如字体、郑码;

汉字音形结合形成的码(音形码):如自然码、智能ABC等。

输入代码必须在计算机中转换成内部代码,然后才能存储和处理。

(3)汉字字体编码

为了在显示器或打印机上输出汉字,根据图形符号将汉字设计成位图,得到相应的点阵码(字体码)。

所有汉字编码的集合称为汉字库。汉字库可以分为软字库和硬字库。软字库以文件的形式存储在硬盘上,现在常用。硬字库是将字库固化在一个单独的内存芯片中,然后和其他必要的设备组成一个接口卡,插在电脑上,通常称为Hanka。

用于显示的字体称为显示字体。16×16点阵、24×24点阵或48×48点阵一般用来显示一个汉字。给定汉字点阵的大小,就可以计算出存储一个汉字所需的字节空。比如用16×16点阵表示一个汉字,就是说每个汉字用16行表示,每行16点,一个16点需要16位二进制码(即2字节),总共16行,所以16行×2字节/行=32字节,即16×16点阵表示一个汉字,字体码需要32字节。

即字节数=点阵行数×点阵数/8

打印用的字体叫打印字体,比显示字体包含的汉字多,不像工作时显示字体需要转入内存。

可以这样理解:计算机中表示汉字的统一编码方法形成的汉字编码称为内码(如国标码),内码是唯一的。为便于汉字输入而形成的汉字码是输入码,属于汉字的外码,输入码因编码方式不同而有所不同。为显示和打印汉字而形成的汉字编码是字体码,计算机通过汉字的内部编码在字体库中找出汉字的字体码,实现它们的转换。

例1:已知汉字“春”的国标码是343AH,那么求其内码?

内码=国标码+8080H=343AH+8080H=B4BAH

例2:2000个汉字用24×24点阵(一位为二进制位)表示一个汉字需要多少千字节?

(24×24/8)×2000/1024 = 140.7 kb≈141 kb

免责申明:以上内容属作者个人观点,版权归原作者所有,不代表红颜文学网_教育热点新闻_作文怎么写_文学作品赏析_2020抗击疫情优秀作文立场!登载此文只为提供信息参考,并不用于任何商业目的。如有侵权或内容不符,请联系我们处理,谢谢合作!
当前文章地址:https://www.hyjzdh.com/jieri/631456.html 感谢你把文章分享给有需要的朋友!
上一篇:武汉二本大学排名 2020湖北二本大学排名 哪个大学最好 下一篇: 铵态氮肥 如何正确用铵态氮肥