电脑装配网

汉字编码每个汉字用几个字节(每日知识点之信息的编码)

 人阅读 | 作者舞动奇迹 | 时间:2023-05-23 14:23

1)数据单位:

位 bit:也称比特,简记b。是计算机存储数据的最小单位

字节 Byte:简记B。规定1B=8bit字节是存储信息的基本单位每个存储单元的大小就是一个字节,所以存储器的容量大小以字节来度量,如KB、MB、GB和TB,其换算关系是:1024 = 210

1TB = 1024GB,1GB = 1024MB,1MB = 1024KB,1KB = 1024B

字 WordCPU通过数据总线一次存取、加工和传送的数据称为字

 

2)数值的表示:

计算机中,所有数据都以二进制的形式表示。通常规定一个数的最高位作为符号位,0表示正,1表示负

具有数值大小和正负特征的数据成为数值数据。

机器码:BCD码或8421码。

 

3)字符编码:

ASCII码(美国标准信息交换代码)是一种西文机内码,占用一个字节(8bit),其最高位为0,可表示128个不同的字符。

其中包括数字0-9、26个大写英文字母、26个小写英文字母

数字的ASCII码 < 大写字母的ASCII码 < 小写字母的ASCII码

小写字母比大写字母大32(20H)

 

4)汉字编码:

一般用连续的两个字节(16位)来表示一个汉字

汉字交换码:即国标码GB2312,收录了6763个汉字,以及682符号,共7445个字符,奠定了中文信息处理的基础,它不能直接在计算机中使用

汉字机内码:是真正的计算机内部用来存储和处理汉字信息的代码

国标码 + 8080H = 机内码

汉字输入码:也称为汉字外部码。根据编码规则,这些汉字输入码可分为流水码、音码、形码和音形结合码四种。

◇智能ABC、微软拼音、搜狗拼音和谷歌拼音等为音码。

◇五笔字型、笔画输入法为形码,也叫结构码

汉字字形码:用来将汉字显示到屏幕上或打印到纸上所需要的图形数据。分为点阵码和矢量码两种。

点阵码是一种用点阵表示汉字字形的编码,它把汉字按字形排列成点阵,一个16×16点阵的汉字要占用32个字节,一个32×32点阵的汉字则要占用128字节,而且点阵码缩放困难且容易失真。

16*16 = 256bit = 256/8Byte = 32Byte

32*32 = 1024bit = 1024/8 Byte = 128Byte

矢量码占用空间小,缩放简单不易失真。


文章标签:

本文链接:『转载请注明出处』