特色:
长期以来,甲骨文研究素以资料匮乏难寻著称。《甲骨文合集》的出版,为学术界提供了一份比较完整并经过科学整理的原始材料,基本上解决了找资料难的问题。姚孝遂、肖丁先生主编的《殷墟甲骨刻辞摹释总集》和《殷墟甲骨刻辞类纂》将《合集》等书的卜辞依次摹写,释为现代汉字,编纂成字词索引,是整理甲骨文献,使之走向普及,更好地为各有关学科服务的重大成果,受到了学术界特别是非甲骨学专业读者的普遍欢迎。近年来随著计算机技术的发展,甲骨文信息处理系统已研制成功。建立和完善甲骨文的字库、词库、语料库及其检索系统,并使之实用化、普及化,以适应学术界研究和运用甲骨文献的需要,已成为亟待解决的问题。《摹释》和《类纂》可以说就是建立甲骨文语料库的一次有意义的准备和尝试。本文拟结合使用《摹释》和《类纂》的一些体会,谈谈建立甲骨文语料库应注意的几个问题。本文纯属外行谈“机”,若贻笑大方,弃而覆瓮可也。 一、关於语料的完整性 甲骨文总计约十万片,《合集》收录41956片,加上《合集》未及收入的《小屯南地甲骨》、《英国所藏甲骨集》、《束京大学东洋文化研究所藏甲骨文字》、《怀特氏等所藏甲骨文集》,去其重复,总计约五万片。可以说,有研究价值的甲骨材料,基本上已纲罗在内。在建立甲骨文语料库时,除剔除伪刻、重复外,应将其全部录入,并对拟检索的项目按普遍和统一的原则加注标志,以保证语料的完整性。《类纂》是甲骨文字词的索引,但在编纂时对虚词和常见辞实行了选录。编者的本意,是使书更精简一些,使用起来更方便一些。姚孝遂先生在该书序言中说:“上面我们所提到的对一些常见虚辞节录,这对研究古代语言,尤其是研究古代语法的人来说,无疑会感到遗憾。但是,我们没有其它好的办法,只能作出这样痛苦的选择。”编者的苦衷是可以理解的,但这确实降低了《类纂》的使用价值。语料不全令人遗憾,但更严重的问题还在於,经过选录的语料和未经选录的语料在书中没有统一加注区别性的标志,哪些字头下的语料齐全,哪些不全,就不得而知。编者指出“常用之虚辞”、“常见辞例”经过选录,但究竟是哪些词,很可能见仁见智,非专业的使用者,更难以断定。如同是虚词,该书1333页“于”字头下标明了“选录”,而970页“不”字头下床标“选录”,但仅有卜辞土06条,显然是经过选录的;1299页“在”字颢下未标“选录”,但辞条甚多,是否经过选录,就难说了。又如118页“邑”字头