三方合力推進古籍?dāng)?shù)字化
古籍?dāng)?shù)字化目前主要有三種方式,一是原樣數(shù)字化,即按照古籍的原貌原樣掃描或影印、最大限度地保存古籍歷史信息;二是文本式數(shù)字化,即將古籍全文錄入整理成可檢索的數(shù)據(jù)庫;三是知識型數(shù)字化,即按照知識管理的模式對古籍?dāng)?shù)據(jù)庫進行標引等深度加工。
“對公共圖書館而言,所做的工作主要是第一種。有一些企業(yè)在做第二種數(shù)字化。”張志清介紹說,目前國家圖書館等公共圖書館和高校圖書館普遍利用館藏資源進行數(shù)字化開發(fā),如國家圖書館開發(fā)的數(shù)字古籍善本、碑帖精華、甲骨世界、西夏碎金、年畫擷英等提供了館藏古籍、碑拓、甲骨等文獻的影像,讀者不必到館即可在網(wǎng)上瀏覽。
一些高校科研單位也在從事古籍?dāng)?shù)字化工作。北京大學(xué)圖書館建設(shè)有“秘籍琳瑯——北京大學(xué)數(shù)字圖書館古文獻資源庫”,是完整展示北京大學(xué)圖書館藏古籍的網(wǎng)絡(luò)平臺,讀者可以在其上檢索北大圖書館藏全部各種類型古文獻元數(shù)據(jù),查看和瀏覽古籍書影、電子圖書,以及拓片、輿圖圖像。北大館牽頭建設(shè)的“學(xué)苑汲古——高校古文獻資源庫”,更是匯集了包括北大圖書館在內(nèi)的國內(nèi)24所高校圖書館藏古籍元數(shù)據(jù)60余萬條、書影20余萬幅,電子圖書8.35萬冊,是目前世界上規(guī)模最大的古籍書目數(shù)據(jù)庫之一。
商業(yè)公司開發(fā)的古籍?dāng)?shù)據(jù)庫是古籍?dāng)?shù)字化的重要組成部分。以北京愛如生技術(shù)公司為代表的企業(yè)開發(fā)的大型古籍?dāng)?shù)據(jù)庫如“文淵閣四庫全書”“中國基本古籍庫”“中國方志庫”“中國歷代石刻史料匯編”“四部備要”“古今圖書集成”等,規(guī)模龐大,檢索方便,很受圖書館和讀者的青睞。據(jù)統(tǒng)計,截至2012年,我國公藏機構(gòu)已經(jīng)擁有超過20億字的數(shù)字化文本格式的古籍。可以說,目前常見古籍基本上都能在互聯(lián)網(wǎng)上找到數(shù)字化格式。
但正如一些學(xué)者所指出的,全文化的古籍?dāng)?shù)據(jù)庫雖然方便檢索,但準確性不夠,在論文、著作中征引文獻時,仍要使用公認的權(quán)威版本的紙書。北京大學(xué)中文系教授、全國高校古籍整理研究工作委員會辦公室主任盧偉說,在最近幾年的碩士博士生論文答辯中,經(jīng)常出現(xiàn)征引文獻出錯,一問都是使用古籍?dāng)?shù)據(jù)庫造成的。
“當(dāng)前商業(yè)性的古籍?dāng)?shù)據(jù)庫存在貪大、求全的傾向,雖然檢索方便,但準確性不足是其硬傷,今后應(yīng)該重視數(shù)字善本的建設(shè),要讓讀者拿來就能用,敢于征引?!敝腥A書局總編輯顧青說。
今年“4·23”世界讀書日期間,中華書局推出了“中華經(jīng)典古籍庫”微信版。這個包含896部古籍、5億字的古籍庫就規(guī)模而言不算大,但就其準確性而言,則是其他商業(yè)性古籍?dāng)?shù)據(jù)庫難以比肩的。顧青說,“我們的古籍庫是基于幾代學(xué)者整理點校的版本,體現(xiàn)了新中國古籍整理的最高水平,可以成為讀者信賴和依據(jù)的本子,這一點是我們的優(yōu)勢?!?/p>
據(jù)顧青介紹,新中國成立以來整理出版的古籍近3萬種,其中古籍整理類約1萬種,古籍影印類約4000種,古籍普及類約1.5萬種。另外,民國時期整理的古籍還有1萬多種。但這些點校本的版權(quán)分散在全國幾十家古籍出版社和社科出版社,“我們也希望能把他們出版的較好的古籍點校本納入中華經(jīng)典古籍庫,但不少地方出版社想自己搞數(shù)字化,不太愿意把版權(quán)拿出來?!鳖櫱嗾J為,如果各出版社單打獨斗,就會出現(xiàn)數(shù)十個小型古籍?dāng)?shù)據(jù)庫,難以形成規(guī)模優(yōu)勢。
光明日報社概況 | 關(guān)于光明網(wǎng) | 報網(wǎng)動態(tài) | 聯(lián)系我們 | 法律聲明 | 光明網(wǎng)郵箱 | 網(wǎng)站地圖
光明網(wǎng)版權(quán)所有