龙空技术网

腾讯搜狗输入法“汉字守护计划”升级,生僻字行业解决方案加速落地

财经新媒体 56

前言:

今天各位老铁们对“搜狗ubuntu1404”可能比较看重,看官们都想要剖析一些“搜狗ubuntu1404”的相关知识。那么小编同时在网上汇集了一些对于“搜狗ubuntu1404””的相关资讯,希望朋友们能喜欢,小伙伴们快快来了解一下吧!

作者 | 崔苗/文 陈默/编辑

身份证上可以显示的姓名,到银行后系统却无法录入;门诊收费处可以打出的名字,医生问诊系统里却没有……一位名叫侯某yi(燡的简化用字)的用户因为其名字中存在生僻字,在生活中遭遇了处处不便。交得了钱却看不了病、开得了户转却转不了帐等问题一直困扰着她,甚至在互联网数字时代,实名认证都无法完成。

侯女士所遭遇的问题在生活中并不少见。据统计,我国有6000万人名及大量地名、古籍、方言中包含生僻字,其中多数尚未实现数字化。在金融、医疗、交通等公共服务中,如果名字中存在生僻字,将会直接影响用户的正常生活。因此,生僻字解决方案最重要的是在不同的场景中落地,帮助用户在各种需要实名办理业务中,正常输出生僻字。

为了解决生僻字输入、显示问题,继去年11月腾讯搜狗输入法宣布支持强制性国家标准GB 18030《信息技术 中文编码字符集》后,4月23日,腾讯联合工信部电子工业标准化研究院、光明日报全媒体、北京国家金融标准化研究院、汉仪字库、OPPO、陕西历史博物馆共同宣布“汉字守护计划”公益行动的升级,将从生僻字征集、行业应用推广两个环节加速生僻字数字化进程。

“汉字守护计划”升级启动仪式

据腾讯搜狗输入法方面介绍,全国首个“生僻字征集”微信小程序已于4月20日“联合国中文日”上线,直接面向用户征集无法输入的生僻字。在行业方面,腾讯搜狗输入法推出生僻字行业解决方案,将助力解决政务、金融、交通、教育、医疗等公共服务领域的生僻字难题。

工信部电子工业标准化研究院副院长孙文龙分析认为,尽管我国对通用规范汉字的信息化处理已基本普及,但很多人名、地名中的生僻字还无法在信息化系统中正常使用,影响相关群众在银行开户、出行购票等需实名登记情况下获得服务。电子标准院2022年牵头制定强制性国家标准GB 18030《信息技术 中文编码字符集》,所有政务服务、公共服务的产品与系统均须符合标准,将有效解决生僻字引发的公共障碍。

腾讯公司副总裁曾宇表示:“生僻字数字化是一项系统工程,腾讯从用户为本、科技向善的角度出发,关注用户对生僻字输入的刚需之痛和迫切愿望,希望联合更多合作伙伴和社会公众,通过‘生僻字征集’小程序以及生僻字行业解决方案,帮助完善从源头征集到应用落地的全链路。”

值得注意的是,针对生僻字问题,目前行业普遍面临着诸多难点。如何快速支持将近9万汉字、怎样设计能够让客户快速找到其想要的生僻字、如何让用户在不同终端设备都能正常输入和显示生僻字、如何快速找到那些未被收入新国标的生僻字等都是亟待业界解决的重要问题。

腾讯搜狗输入法认为,瞄准用户在不同场景下对输入法的痛点,可以从字库框架体系升级、输入方式创新及输入效率优化三个部分来拆解生僻字输入解决方案中需要实现的技术门槛。

具体来看,一方面,为了支持新国标,腾讯搜狗输入法生僻字输入解决方案对于原有字库编码体系进行扩展和升级,另一方面,针对生僻字输入难题,该方案在拼音输入之外加入了笔画输入,此外,通过对词库结构和搜索算法的优化,进一步提高了生僻字的输入效率。

据悉,腾讯搜狗输入法生僻字行业解决方案支持包含新国标字库在内的9万多个汉字,并通过拆解字形,提供手写、笔画、拼音及“部首拼音+笔画”等多种方式,解决生僻字难认难写造成的输入难题;提供覆盖PC、平板、车机等多终端,以及Windows、iOS、Linux等多种操作系统的输入法版本;包含字库服务,转码服务在内的一站式解决方案,帮助金融、医疗、交通、公共设施、社会保障、仓储邮政等公共服务和政务服务使用场景实现生僻字的输入、显示和信息交换。

数据显示,4月20日“生僻字征集”小程序上线后,首日访问量突破63万,用户提交生僻字1404个。经专业审核,通过的生僻字将被赋码并录入国标字库,最终实现在电脑、手机等设备及信息系统中无障碍地输入与显示。

不容忽视的是, 解决生僻字输入问题,不仅有利于帮助用户解决日常生活中遇到的种种难题,更重要的是有助于文化存续。

中国社会科学院语言研究所研究员、原词典编辑室主任谭景春认为,中华文明是唯一有确切文字可考且没有中断的文明,而汉字则是中华文明的关键载体。解决生僻字问题,将推动中华文化在数字时代继续传承。

标签: #搜狗ubuntu1404