一項(xiàng)由中國(guó)科研人員自主開發(fā)的編碼技術(shù),將使包括許多生僻字在內(nèi)的所有漢字都能通過(guò)計(jì)算機(jī)處理。利用這項(xiàng)四字節(jié)編碼核心技術(shù),不僅可以解決古籍出版中的問(wèn)題,還可以解決戶籍、銀行、海關(guān)、民航等行業(yè)遇到的姓名、地名生僻字問(wèn)題。
這項(xiàng)技術(shù)由北京時(shí)代瀚堂科技有限公司自主開發(fā),可錄入、顯示、編輯、檢索、查詢和管理71500多個(gè)漢字,而傳統(tǒng)的二字節(jié)編碼技術(shù)只能處理27500多個(gè)漢字。
過(guò)去,《說(shuō)文解字》等傳統(tǒng)文化典籍,只能依靠影印出版,不僅費(fèi)時(shí)費(fèi)力,而且不符合現(xiàn)代人的閱讀習(xí)慣。古籍研究者在遇到生僻字與計(jì)算機(jī)有機(jī)結(jié)合時(shí),叫苦連天,因?yàn)檫@不僅意味著工作量大大增加,還可能造成工作漏洞。如今,采用四字節(jié)編碼技術(shù),用計(jì)算機(jī)錄入和處理方式出版的《說(shuō)文解字》,極大地方便了出版者和讀者。
基于四字節(jié)編碼技術(shù),北京時(shí)代瀚堂科技有限公司開發(fā)了“龍語(yǔ)瀚堂”典籍?dāng)?shù)據(jù)庫(kù),包括字書類數(shù)據(jù)庫(kù)、殷周金文庫(kù)、音韻庫(kù)、中國(guó)簡(jiǎn)帛庫(kù)、甲骨文庫(kù)等13類子庫(kù)的數(shù)百萬(wàn)條數(shù)據(jù)記錄。應(yīng)用這一數(shù)據(jù)庫(kù),社會(huì)科學(xué)文獻(xiàn)出版社已出版了我國(guó)最早的字書《說(shuō)文解字》,雙方還將繼續(xù)合作出版《康熙字典》。目前,“龍語(yǔ)瀚堂”典籍?dāng)?shù)據(jù)庫(kù)已在清華、北大等百余所大學(xué)的中文系、歷史系、考古系以及國(guó)內(nèi)外一些漢學(xué)研究機(jī)構(gòu)廣泛試用。
(來(lái)源:人民日?qǐng)?bào);作者:武衛(wèi)政、譚 超)