8月17日,工信部电子工业标准化研究院召开强制性国家标准GB 18030-2022《信息技术 中文编码字符集》标准宣贯会,在该标准指导下,经电子标准院权威测试,腾讯搜狗输入法作为行业首个支持标准内全量汉字的输入法产品,获得最高级(实现级别3)认证。
图:搜狗输入法获奖现场
为规范汉字在各类信息处理系统中的录入、存储及流转,解决人名、地名等生僻字使用难题,2022年7月,国家市场监管总局发布强制性国家标准GB 18030-2022《信息技术 中文编码字符集》,为适配不同产品及场景用字需求,该标准设立三档实现级别。其中,政务服务和公共服务的信息技术产品及系统要求实现级别3,即强制支持标准内全部88115个汉字。
去年11月,腾讯搜狗输入法率先响应该标准,发布行业首个“生僻字键盘“,在移动端率先支持超过9万个汉字的输入。针对用户只识字形、不知读音的情况,生僻字键盘通过“拆字”,实现笔画输入、拆分部首的拼音输入,以及部首拼音+笔画的混合输入3种便捷输入方式。以“仝”字为例,在不知道拼音的情况下,用户可以通过拆分部首的拼音,输入“ren gong”即可。
图:搜狗输入法生僻字键盘
面向垂直行业,腾讯搜狗输入法推出行业解决方案,助力解决金融、医疗、交通、公共设施、社会保障、仓储邮政等公共服务和政务服务领域的生僻字难题。该方案目前已在金融领域率先落地,腾讯搜狗输入法联合北京国家金融标准化研究院推出的定制化解决方案“金标输入法”在数百家银行应用,解决无法网银认证、开户、线上转账等问题。
为了让更多生僻字进入数字世界,腾讯搜狗输入法还联合工信部电子工业标准化研究院、光明日报全媒体、北京国家金融标准化研究院、汉仪字库、OPPO、陕西历史博物馆等单位共同发起“汉字守护计划”,通过“生僻字征集小程序”,面向大众征集新版国标外未编码的生僻字。截至目前,“生僻字征集小程序”用户累计超过800万,其中约3万人参与提交,共收集生僻字5500个,去重后有300多个生僻字经过专家考证与审查,有望收入新国标和国际标准。
汉字数字化是一项社会系统性工程,从标准制定到汉字征集、考证、赋码,字体字形设计,再到输入法及操作系统等软硬件厂商适配,打通这条链路需多方共同助力。工信部电子工业标准化研究院副院长孙文龙在4月23日汉字守护计划升级发布会上曾说:“语言文字信息化工作离不开各方共同努力。希望大家一起,共同促进新国标的应用实施,持续完善语言文字信息技术标准体系,合力支撑语言文字信息技术高质量发展。”