第四章 汉字的孳乳 第三节 汉字的数量和字典

由于汉字的孳乳,它的数量必然从少到多,不断发展。这种发展的情况,可以通过记录汉字的档案——字典而得以了然。

记录迄今为止我们所发现的汉字的最早字体——甲骨文的字典,具有代表性的是《甲骨文编》。这书由孙海波编集,分为三大部分: 一是“正编”,收录目前大体可以认识的字,共1723个;二是“合文”,收合文371条;三是“附录”,收录目前未能辨认或虽经有人辨认而尚未成为定论的字,共2949个。因而总计甲骨文的单字数量是4672个。

收录金文,包括殷商、西周、春秋、战国诸时期金文字形和数量的字典,叫做《金文编》。它的编者是容庚。这书分为“正编”和“附录”两大部分,“正编”收字2420个,“附录”收字1352个,二者相加是3772个。

现在看来,殷周金文只有3000多字,比它还早的甲骨文却有4000多字,似乎不符合汉字字数由少到多发展的规律了。这是为什么呢?主要是因为甲骨文的图画性质比金文的总体来得浓厚,有不少还是较为原始的图形文字,人名、地名等专用字特别多,大量是早已消亡而今天未能识别的。而金文则合并了甲骨文的许多图形文字,人名、地名等专用字也少一些,所以总字数就减少了,但是能辨认的字则比甲骨文多。

这以后,汉字的数量就呈现不断上升的趋势了。

从问世的年代来说,《说文解字》是我国记录汉字的第一部字典。我们在上文已经不止一次地提到由东汉学者许慎编撰的这部著作了。《说文解字》主要收集汉字的小篆字形,共收字9353个。许慎首创将汉字依照形体和意义进行分部排列,共分540部;每部的第一个字,叫做“部首”。汉语字典到今天还有“部首排列法”,应该归功于许慎的发明。只是今天一般字典使用的部首,都在《说文解字》的基础上作了归并,只有200多个了。

西晋吕忱编了一本 《字林》,也按 《说文解字》分540部,收字达到12824个。

南朝梁陈之间的顾野王,编有字典《玉篇》,分542部,收字16917个。

隋代陆法言编有《切韵》。这是一部“韵书”,就是将汉字按照读音的不同进行排列,主要供人们作诗押韵时查检。韵书也有对汉字形体和意义的说明,所以也是一种字典。《切韵》到后世已经失传,但北宋初年还存在。当时的一帮学者以陈彭年为首,在《切韵》的基础上编修了《广韵》,收字26000多个。

到了明代末年,有一位叫梅膺祚 〔yingzuo英作〕的学者,编了一本《字汇》,收字33179个,简化《说文解字》部首,合为214部。

清代由康熙皇帝下令编修了一部《康熙字典》,由张玉书等学者集体合作。全书部首也是214个,收字47035个。

有人作过统计,汉字在《康熙字典》编成之前,每隔五六百年左右,就要增加五六千字到一万字左右。也就是说,每年大约要增加新字十几个。

《康熙字典》以后,汉字的增加就不多了,新增加的主要是一些科学技术的新造字和某些地方的方言用字。1915年《中华大字典》出版,收字48000个。1968年台湾出版《中文大辞典》,收字49905个。

近年来,四川辞书出版社出版了《汉语大字典》,共八册,收字54000多个。

但是,历代实际使用的汉字都不过只有几千个,大量的汉字只是历史上来去匆匆的过客,或者只在很小的范围内被少数人使用,但它们却都被字典记录在案,成为“死字”、“字典字”。另外,有些形体不同的字,实际上只是同一个字的不同写法,叫做“异体字”(详后),例如“升、陞、昇”、“札、劄、剳”等,许多字典也都作为不同的字头收录了。这样,怪不得历代字典所收的汉字,就越来越多了。