守护生僻字

作家文摘 2023年05月19日

  最近,一个生僻字冲上热搜。nià(上边是少了一横的“鸟”,下边是“甲”,见图)姓是云南丽江傈僳族中一支以鸟为图腾的家族的姓氏。进入数字时代,由于nià这个姓氏无法在信息系统中使用,为避免购票、办卡等均无法正常输入、显示的麻烦,该姓氏的上百人被迫把姓改成了“鸭”。

  据统计,全国有6000万人名及大量地名、古籍、方言中包含生僻字,其中多数尚未实现数字化。数字时代,我们该如何守护那些被困在信息系统“盲区”的汉字?

  中国社会科学院语言研究所研究员、原词典编辑室主任谭景春认为:“汉字正是由于独特的表意方块形体,才具备超时间和空间的能力……也使得中国几千年的灿烂文化能够留传至今。”“汉字收录在《康熙字典》里的有4万多个,收录在《汉语大字典》里的有6万多个,收录在《中华字海》里的有87019个。不过现代通用的也就5000到8000个。”

  每一个生僻字姓氏,往往承载着本土文化的“基因”。《中国民间故事丛书》的云南丽江华坪卷,记述了关于傈僳“nià”姓来历的传说故事。传说很久很久以前,深居在大山里的一户傈僳族人家生下了一个小孩,但没几天小孩的妈妈因病去世,父亲用鸟肉汤喂养小孩活下来,为了让孩子记住这段经历,父亲就给他取了一个名,叫“nià”,意思是用鸟肉汤喂大的孩子。从此以后,傈僳族中就有了这个姓氏。“弃用”生僻汉字,无疑意味着当地人被迫割舍了一段深厚的民族历史文化。

  在谭景春看来,打不出生僻字,不仅会给一部分人的工作和生活带来困扰和不便,也意味着宝贵的汉字文化遗产正在流失。

  为何生僻字的信息化如此难?工信部电子工业标准化研究院中文信息研究室主任黄姗姗介绍,汉字是一种表意文字,每个汉字都有它独特的含义和字形,生僻字其实就是表意字所特有的信息处理问题。“信息系统要认识汉字就需要一字一形一码来建立对照表,一个汉字有形没有码,或者编码不被某个系统所支持,就成了信息时代的生僻字。”

  黄姗姗说,汉字信息化编码难度高,开发字库的工作费时费力,生僻字的标准化专业又复杂。“大多数应用、软件产品支持的汉字量都在2万-3万,一些个性化的字库产品甚至只有几千字。”黄姗姗坦言,生僻字的搜集和整理是一个长期的工作,已经开展了几十年,未来还会继续开展。

  工信部电子工业标准化研究院副院长孙文龙表示:“电子标准院2022年牵头制定强制性国家标准GB 18030《信息技术 中文编码字符集》,所有政务服务、公共服务的产品与系统均须符合标准,这将有效解决生僻字引发的公共障碍。”     (摘自5月10日《中国青年报》 沈杰群文)