七星号

栏目分类:
返回
快速导航关闭
当前搜索
当前分类
热门搜索
七星号 > 编程知识 > 正文

(gbk编码表)GBK编码的一个汉字要占多少字节呀?

作者:用户投稿 发布时间:2024-10-20 00:49:38 阅读次数:

一:GBK编码的一个汉字要占多少字节呀?

GBK编码的一个汉字要占多少字节呀?

GBK编码,一个汉字占两个字节。

GBK全称《汉字内码扩展规范》(GBK即“国标”、“扩展”汉语拼音的第一个字母,英文名称:Chinese Internal Code Specification) ,中华人民共和国全国信息技术标准化技术委员会1995年12月1日制订,国家技术监督局标准化司、电子工业部科技与质量监督司1995年12月15日联合以技监标函1995 229号文件的形式,将它确定为技术规范指导性文件。这一版的GBK规范为1.0版。

GBK 亦采用双字节表示,总体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F 一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883 个。

全部编码分为三大部分:

1. 汉字区。包括:

a. GB 2312 汉字区。即 GBK/2: B0A1-F7FE。收录 GB 2312 汉字 6763 个,按原顺序排列。

b. GB 13000.1 扩充汉字区。包括:

(1) GBK/3: 8140-A0FE。收录 GB 13000.1 中的 CJK 汉字 6080 个。

(2) GBK/4: AA40-FEA0。收录 CJK 汉字和增补的汉字 8160 个。CJK 汉字在前,按 UCS 代码大小排列;增补的汉字(包括部首和构件)在后,按《康熙字典》的页码/字位排列。

2. 图形符号区。包括:

a. GB 2312 非汉字符号区。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符号外,还有 10 个小写罗马数字和 GB 12345 增补的符号。计符号 717 个。

b. GB 13000.1 扩充非汉字区。即 GBK/5: A840-A9A0。BIG-5 非汉字符号、结构符和“○”排列在此区。计符号 166 个。

3. 用户自定义区:分为(1)(2)(3)三个小区。

(1) AAA1-AFFE,码位 564 个。

(2) F8A1-FEFE,码位 658 个。

(3) A140-A7A0,码位 672 个。

第(3)区尽管对用户开放,但限制使用,因为不排除未来在此区域增补新字符的可能性。

二:王莘钰 gbk编码表?

GBK码: 王=CDF5 莘=DDB7 钰=EEDA

GBK码数字形式: 王=12,13,15,5 莘=13,13,11,7 钰=14,14,13,10

1248涂卡数字: 王=48/148/1248/14 莘=148/148/128/124 钰=248/248/148/28

三:gbk 编码表查询

您查询的是GBK内码。

================================

夏----CFC4

雨----D3EA

成----B3C9

四:字符编码的GBK

GBK即汉字内码扩展规范,K为扩展的汉语拼音中“扩”字的声母。英文全称Chinese Internal Code Specification。GBK编码标准兼容GB2312,共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库。GB2312码是中华人民共和国国家汉字信息交换用编码,全称《信息交换用汉字编码字符集——基本集》,1980年由国家标准总局发布。基本集共收入汉字6763个和非汉字图形字符682个,通行于中国大陆。新加坡等地也使用此编码。GBK是对GB2312-80的扩展,也就是CP936字码表 (Code Page 936)的扩展(之前CP936和GB 2312-80一模一样)。 GB 2312的出现,基本满足了汉字的计算机处理需要,但对于人名、古汉语等方面出现的罕用字,GB 2312不能处理,这导致了后来GBK及GB 18030汉字字符集的出现。

GBK采用双字节表示,总体编码范围为8140-FEFE,首字节在81-FE 之间,尾字节在40-FE 之间,剔除 xx7F一条线。总计23940 个码位,共收入21886个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号883 个。P-Windows3.2和苹果OS以GB2312为基本汉字编码, Windows 95/98则以GBK为基本汉字编码。

有些汉字用五笔和拼音都打不出来,如:溙(五笔IDWI),须调出GBK字符集才能打出这个字。极品五笔中可右击输入法图标,设置,属性中选GBK字符集。极点五笔中可点击工具条中相关图标进行转换。 GBK码对字库中偏移量的计算公式为:

[(GBKH-0x81)*0xBE+(GBKL-0x41)]*(汉字离散后每个汉字点阵所占用的字节) 字符有一字节和双字节编码,00–7F范围内是一位,和ASCII保持一致,此范围内严格上说有96个字符和32个控制符号。

之后的双字节中,前一字节是双字节的第一位。总体上说第一字节的范围是81–FE(也就是不含80和FF),第二字节的一部分领域在40–7E,其他领域在80–FE。

五:gbk编码是什么?

GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准。GBK编码依然采用双字节编码方案,其编码范围:8140-FEFE(高字节从81到FE,低字节从40到FE),剔除xx7F码位,共23940个码位。

GBK编码共收录汉字和图形符号21886个,其中汉字(包括部首和构件)21003个,图形符号883个。GBK编码支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字。GBK编码方案于1995年12月15日正式发布,这一版的GBK规范为1.0版。

扩展资料:

全部编码分为三大部分:

1、汉字区。

包括:

a. GB 2312 汉字区。即 GBK/2: B0A1-F7FE。收录 GB 2312 汉字 6763 个,按原顺序排列。

b. GB 13000.1 扩充汉字区。包括:

(1)、 GBK/3: 8140-A0FE。收录 GB 13000.1 中的 CJK 汉字 6080 个。

(2) 、GBK/4: AA40-FEA0。收录 CJK 汉字和增补的汉字 8160 个。CJK 汉字在前,按 UCS 代码大小排列;增补的汉字(包括部首和构件)在后,按《康熙字典》的页码/字位排列。

(3) 、汉字“〇”安排在图形符号区GBK/5:A996。

2、图形符号区。

包括:

a. GB 2312 非汉字符号区。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符号外,还有 10 个小写罗马数字和 GB 12345 增补的符号。计符号 717 个。

b. GB 13000.1 扩充非汉字区。即 GBK/5: A840-A9A0。BIG-5 非汉字符号、结构符和“〇”排列在此区。计符号 166 个。

3、 用户自定义区:

分为(1)(2)(3)三个小区。

(1)、 AAA1-AFFE,码位 564 个。

(2) 、F8A1-FEFE,码位 658 个。

(3) 、A140-A7A0,码位 672 个。

第(3)区尽管对用户开放,但限制使用,因为不排除未来在此区域增补新字符的可能性。

六:GBK,UTF8是什么?

GBK,UTF8都是一种字符集,就是一种编码方式~\x0d\x0a\x0d\x0a字符集(Characterset)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,\x0d\x0a\x0d\x0a常见字符集名称:ASCII字符集、GB2312字符集、UTF8字符集、GB18030字符集、Unicode字符集等。\x0d\x0a\x0d\x0a计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。

七:日文系统编码是什么?中文是GBK

编码GBKGBK码是GB码的扩展字符编码,对多达2万多的简繁汉字进行了编码,简体版的Win95和Win98都是使用GBK作系统内码。

日语的文字编码主要是Shift_JIS、EUC-JP、ISO-2022-JP这三种。

Shift_JIS主要是Windows和Macintosh使用的文字编码。Shift_JIS 的文字集合基本是按照JIS X 0208规定的。但实际上各个厂商各自进行扩展,包含了大量重复的、规格以外的文字。

因此Windows在本来的 Shift_Jis的文字集合之外,又增加了NEC扩展、IBM扩展所包含的文字。这种规格和实际情况的分歧长期存在,随着windows-31J的规格化,混乱情况有所改善。

EUC-JP是被Linux和Solaris广泛地使用的文字编码。

ISO-2022-JP主要被Email使用的文字编码。只使用7个bit,第8个bit不使用,所以不适合程序中的字符串处理,主要使用在网络中的数据交换中。

扩展资料:

注意事项:

1、按照何种规则将字符存储在计算机中,如'a'用什么表示,反之将存储在计算机中的二进制数解析显示出来,称为解码,如同密码学中的加密和解密。在解码过程中,如果使用了错误的解码规则,则导致'a'解析成'b'或者乱码。

2、字符集:是一个系统支持的所有抽象字符的集合。字符是各种文字和符号的总称,包括各国家文字,标点符号,图形符号,数字等。

3、要处理中文显然一个字节是不够的,至少需要两个字节,而且还不能和ASCII编码冲突,所以制定了GB2312编码,用来把中文编进去。

参考资料来源:百度百科-字符编码

参考资料来源:百度百科-GBK

八:gbk 编码表A是几

A=10, B=11, C=12, D=13, E=14, F=15

九:GB2312和GBK的区别?

1、收录不同:GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;GBK共收入21886个汉字和图形符号。

2、表示不同:GB2312对任意一个图形字符都采用两个字节表示,并对所收汉字进行了“分区”处理,每区含有94个汉字/符号,分别对应第一字节和第二字节。GBK采用双字节表示,总体编码范围为8140-FEFE之间,首字节在81-FE之间,尾字节在40-FE之间。

3、处理功能不同:对于人名、古汉语等方面出现的罕用字,GB2312不能处理,这导致了后来GBK 及GB18030 汉字字符集的出现。

扩展资料

汉字编码的困难原因:

1、数量庞大:一般认为,汉字总数已超过6万个(包括简化字)。虽有研究者主张规定3000多或4000字作为当代通用汉字,但仍比处理由二三十个字母组成的拼音文字要困难得多。

2、字形复杂:有古体今体,繁体简体,正体异体;而且笔画相差悬殊,少的一笔,多的达36笔,简化后平均为9.8笔。

参考资料

百度百科-GBK

百度百科-GB2312

十:gbk编码是什么

GBK全名为汉字内码扩展规范,英文名Chinese Internal Code Specification。K 即是“扩展”所对应的汉语拼音(KuoZhan)中“扩”字的声母。

GBK 亦采用双字节表示,总体编码范围为8140-FEFE,首字节在81-FE 之间,尾字节在40-FE 之间,剔除 xx7F一条线。总计23940 个码位,共收入21886个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号883 个。

今天的内容先分享到这里了,读完本文《(gbk编码表)GBK编码的一个汉字要占多少字节呀?》之后,是否是您想找的答案呢?想要了解更多,敬请关注www.qixingcap.cn,您的关注是给小编最大的鼓励。

推荐文章:

  • css3圆角网页CheckBox复选框开关按钮美化样式代码
  • module怎么读
  • 前端开发培训一般几个月
  • androidsystemrecovery<3e>没反应
  • flash8教程哪个好
  • ibatis分页查询语句
  • vb数据库编程教程
  • java培训java
  • 从零开始学java这本书怎么样
  • 卷积芯片
  • Tag: gbk编码表
    欢迎分享转载→ (gbk编码表)GBK编码的一个汉字要占多少字节呀?
    本文地址:https://www.ccd-17.com/biancheng/22093.html

    编程知识栏目本月最新文章

    本站最新文章

    我们一直用心在做

    Copyright © 2021-2022 七星号-(www.ccd-17.com) 版权所有