龙空技术网

公文该用仿宋还是仿宋_GB2312?

可编辑ppt课件 448

前言:

当前兄弟们对“windows的字体库在哪里”大约比较关怀,同学们都需要分析一些“windows的字体库在哪里”的相关资讯。那么小编在网上搜集了一些关于“windows的字体库在哪里””的相关资讯,希望你们能喜欢,你们一起来了解一下吧!

相信不少文字工作者在工作中遇到过以下两种情况。

情况一:文档中的文字在自己电脑上显示正常,但是在其他人电脑上打开文档的时候却发现文字显示效果不同的情况。

情况二:当文档中设置某种字体后,感觉少数生僻字显示效果不对劲。

针对以上情况,本着求真务实的态度,通过了解概念与原理,探究更深层次的原因。

01

字体和字库

首先,针对情况一中不同设备上文字显示效果不一致的原因,有经验的小伙伴可能知道这大概是由于设备上缺少“字体”导致的,那么这里所说的“字体”到底指的是什么意思?是不是等同于“字库”?

字体指的是同一汉字用于印刷和数字终端显示的不同体式,包括排版字体、设计字体、书写字体等。[来源:中华人民共和国国家标准GB/T 12200.2—94,4.1.2.2,有修改]

而“字库”应该是外文字体、中文字体以及相关字符的电子文字字体集合库。

明白了这两个概念之后我们大概就知道了平时所说的电脑上缺了什么字体实际上指的是电脑上缺少了字库。比如:方正小标宋体在Windows操作系统中默认情况下是没有的,所以如果电脑上没有安装小标宋这个字库的话就无法在Word中将文字设置为方正小标宋体,同理,如果其他人电脑上已安装这个字体,并且在Word文档中设置文字的显示效果为方正小标宋,在未将字体嵌入文件的情况下,对方将该文档发至你电脑上阅读和编辑的时候,由于缺失该字体,Word文档会自动使用默认的字体替代它进行显示,所以就会出现不同的电脑上显示效果不一致的情况,甚至可能会出现看起来是乱码的情况。

02

各种仿宋之间的关系

仿宋、仿宋_GB2312、方正仿宋_GBK以及华文仿宋等之间的关系是什么呢?

仿宋体是汉字的主要印刷体之一,是模仿宋体产生的字体。[来源:中华人民共和国国家标准GB/T 12200.2—94]

仿宋体来源于丁善之、丁辅之兄弟于1916年推出的一款仿宋代刻本的字体——“丁氏聚珍仿宋版活字”。

而大家平时见到并使用的仿宋、仿宋_GB2312、方正仿宋_GBK以及华文仿宋等实际上是不同公司制作的字库。比如:仿宋由北京中易中标电子信息技术有限公司设计,在Windows 7以上的操作系统中自带;仿宋_GB2312由长城电脑设计,在Windows XP操作系统中自带;方正仿宋_GBK由北京北大方正电子有限公司设计;华文仿宋由华文公司设计。这些字库中的字体均为仿宋体。

查阅现行的2012年版《党政机关公文格式》(GB/T 9704-2012),关于字体和字号,只规定了公文正文用“仿宋体”,没有明确规定必须用仿宋_GB2312。所以在公文写作时,不是一定要用仿宋_GB2312。

03

各种字符集之间的关系

认真的小伙伴可能会发现仿宋_GB2312、方正仿宋_GBK又有点不一样,后面分别带了个GB2312和GBK。这里又涉及到了字符集和字符编码的知识。

学过计算机基础知识的小伙伴应该对ASICII还保留一些印象。

(一)ASICII

ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语,而其扩展版本EASCII则可以勉强显示其他西欧语言。

ASCII字符集:主要包括控制字符(回车键、退格、换行键等),可显示字符(英文大小写字符、阿拉伯数字和西文符号)。

ASCII编码:将ASCII字符集转换为计算机可以接受的数字系统的数的规则。使用7位(bits)表示一个字符,共128字符;但是7位编码的字符集只能支持128个字符,为了表示更多的欧洲常用字符对ASCII进行了扩展,ASCII扩展字符集使用8位(bits)表示一个字符,共256字符。ASCII字符集映射到数字编码规则如下图所示:

计算机中储存的信息都是用二进制数表示的,而我们在屏幕上看到的英文、汉字等字符是二进制数转换之后的结果。而ASICII、GB2312、GBK、GB18030 以及 UTF8 就是不同的编码字符集。每个编码字符集中的英文、汉字等字符都有对应的编号,按照何种规则将字符存储在计算机中,如'a'用什么表示,称为“编码”;反之,将存储在计算机中的二进制数解析显示出来,称为“解码”,如同密码学中的加密和解密。在解码过程中,如果使用了错误的解码规则,则导致'a'解析成'b'或者乱码。

在操作系统中内置了很多编码字符集,这是由于世界上有很多国家和民族,不同的国家和民族往往有着自己的语言文字。这些编码字符集就好比一本本字典存在在操作系统中,供系统用户调用,有的字典是基础字典,可能收录的字少些,而高阶字典可能就收录的字多些,或者不同语言的字典收录的文字就不同,但是不管什么字典,都可以通过第几页第几个的坐标形式定位到某个字,所以有可能出现比如:第10页第3个字在A字典中是某个字,在另一本字典中的同样位置是另外一个字的情况,还有可能有的字典收录较多,它的第1000页还有字,而别的字典没有第1000页的情况。对于计算机,它更在乎的是这个坐标编码,所以就可能出现用错了字符集导致出现乱码的情况发生。

(二)GB2312

GB2312实际上指的是《信息交换用汉字编码字符集 基本集》(GB/T 2312-1980),于1981年5月1日开始实施,根据中华人民共和国国家标准公告(2017年第7号)和强制性标准整合精简结论,自2017年3月23日起,该标准转化为推荐性标准,不再强制执行。在该标准中,共收录汉字6763个。与我们平时对汉字的了解来看,应该看得出这个标准收录的汉字不多,也符合该标准中“基本集”这个名字含义。

(三)GBK

GBK全称《汉字内码扩展规范》,GBK 向下与 GB2312 编码兼容,不过它只是“技术规范指导性文件”,并不属于国家标准,2000年已被《信息交换用 汉字编码字符集 基本集的扩充》(GB18030-2000)国家强制标准替代,是前者向后者过渡过程中的一个承上启下的产物。

(四)GB18030

GB18030已发布了3个版本,分别是GB 18030-2000 、GB 18030-2005和GB 18030-2022 。GB 18030-2022 为目前最新版《信息技术 中文编码字符集》强制性国家标准,将于2023年8月1日正式实施。

新版标准共收录汉字87887个,比上一版增加录入了1.7万余个生僻汉字,不仅收录《通用规范汉字表》全部汉字,还可覆盖我国绝大部分人名、地名用生僻字以及文献、科技等专业领域的用字,能够满足各类使用需求,为传承中华文化、增强中文信息处理能力、满足姓名生僻字人群用字需求提供强有力的标准保障。

(五)UTF-8

当计算机传到世界各个国家时,为了适合当地语言和字符,设计和实现类似GB2312/GBK/GB18030的编码方案。这样各搞一套,在本地使用没有问题,一旦出现在网络中,由于不兼容,互相访问就出现了乱码现象。为了解决这个问题,产生了Unicode。在计算机科学领域中,Unicode(统一码、万国码、单一码、标准万国码)是业界的一种标准,它可以使电脑得以显示世界上数十种文字的系统。可以这样理解:Unicode是字符集,UTF-32/ UTF-16/ UTF-8是三种字符编码方案。UTF-8是ASCII的一个超集。

它们的关系如下图。

由于技术条件的限制,最初电脑中的字库类型主要还是宋体、黑体、楷体和仿宋体。1991年,长城计算机公司根据GB2312规定的6763个汉字,开发了一种显示为仿宋字体的计算机字体库,即仿宋_GB2312,并被微软采用。随着Windows 1995及Windows XP系统的大规模应用,逐渐占领了市场,成为当时应用最广的计算机仿宋字体库,也延续到今天。也就是说,仿宋_GB2312是一种商业仿宋字体库。与其对应,还有楷体_GB2312等字体库。

而计算机上的仿宋和仿宋GB2312的两种字体还是有区别的,仿宋可以显示很多的生僻字,比如骉,镕等,Windows 7之后的Windows系统都自带字体“仿宋”,是基于GB18030设计的,可以理解为仿宋是仿宋GB18130的简称,更容易让人理解。收录汉字自然也更多,与仿宋GB2312包含的6763个汉字相比,数量多得多。而且相比仿宋GB2312,字体更纤细,字迹更清晰,特别是在标点符号、字母和数字上,仿宋字体都更纤细、更清晰。

04

结语

《党政机关公文格式》(GB/T 9704-2012)只要求公文正文要用仿宋字体,并没有硬性要求用基于哪一种字符集编码的仿宋,目前新版本系统中自带的仿宋,才更符合国标要求。

最后提一下,公文涉及到的字体有四个,即仿宋,小标宋、黑体、楷体。方正字库官网的商业授权的免费字体有五个,即方正黑体、方正书宋、方正仿宋、方正楷体、 方正甲骨文。针对“商业发布”这种使用方式免费。方正小标宋商用不免费,非商用当然是可以用的。

标签: #windows的字体库在哪里