“与西方文字不同,汉字是表意文字,成千上万的不同含义需要成千上万的不同汉字来表示。西方文字主要是拼音文字,通过几十个字母的组合就可以变出成千上万的单词。在计算机里面,西方文字只需要给几十个字母编码就够了,而每一个汉字都要一个编码才行。”
“随着时代的进步和发展,GB2312已经满足不了应用的需要,比如‘镕’字现在是高频率使用字,而 GB 2312却没有为它编码,因而政府、新闻、出版、印刷等行业和部门,在使用中感到十分不便。”
“所以说,随着信息技术的发展,GB2312的6763个汉字,已经不能再满足人们使用要求。”
“而对于蜀大中文系,历史系,图书馆这些单位来说,六千多个汉字,更是难以满足信息数字化的需要。”
“最近,国际标准化组织下属编码字符集工作组,研制了一套新的编码字符集标准,叫做ISO/IEC 10646。”
会议室里又是一阵惊呼。
之前说的那些都是实际情况介绍,只要是稍微有点兴趣的人,翻翻资料,都能够说得出来。篱
可是ISO/IEC 10646国际标准则是国际标准化组织刚刚提出来的,而且到现在都只颁布了一部分,这孩子已经接触到前沿信息了。
周至继续说道:“这是一个针对多文种处理的编码字符集标准,目的是对世界上的所有文字统一编码,以实现世界上所有文字在计算机上的统一处理。”
“理论上以此为基础,我们能构建出一个在信息技术工程上通用的多八位编码字符集,搭建出一个多文种的基本编码体系结构。”
会议室里已经有人忍不住举起了手来,打断了周至的发言:“周至同学,你是从哪里知道我们国家正在根据ISO/IEC10646标准,准备搭建多文种基本编码体系结构的?”
“推测啊,”周至说道:“既然GB2312已经不敷使用,自然就需要拓展;正好ISO/IEC 10646国际标准化字符集已经出台,给了汉字内码相当大的拓展空间,因此我们自然就可以根据这个制定出扩展规范,最终得到扩展后的字库了,难道不是吗?”
“呃……”那人想了一下,还真就是这个逻辑思路。
麦主任介绍道:“这是我们系的李红江教授,同时他也是国家信息技术编码字符集工作组成员。”篱
李红江说道:“我承认,肘子你说的一切都对,但你可能还不知道吧?这个事情,我们国家已经在紧锣密鼓地展开了。”
“新的字库,便是如你所说,将基于通用多八位编码字符集,适应16/32位操作系统,一共扩展到23940个码位,收录21003个汉字。称为GB 13000,很快就会推出了,到时候,就能够解决汉字输入的绝大多数问题。”
这个消息会议室里很多人都是第一次知道,大家都兴奋异常,不由得鼓起掌来。
李红江这才笑道:“作为一名高中生,能够找到我们国家在信息技术方面的一个痛点,并且做了一定的研究,甚至提出了和国家相契合的解决思路,这已经很不容易了。”
说完对麦主任轻松地笑道:“所以说,少年强则中国强,像周至同学这样的,是我们信息产业的希望啊!”
话虽是这样说,其实意思也很明白,那就是这些问题国家都已经考虑过了,新编码马上就要出来了,就不劳你一个高中毕业生来操这份心了。
周至一直静静地等待李红江说完,然后才说道:“两万一千个汉字,就能够解决问题了吗?”篱
“两万一千零三个!”李红江强调道:“从六千多个扩展到两万一千零三个,扩展了三倍多,这是多大的成就和进步?”